Må ta data mer på alvor

Må ta data mer på alvor

Virksomheter må ta data alvorlig. Det er flaut ikke å sikre seg mot virus. Det er utilgivelig å mangle data etter et havari.
Det er tiden det tar å gjenskape dataene som bør være rettesnoren for strategien rundt sikkerhetskopiering. Nettopp for å hindre totalhavari av virksomheten, må tiden det tar å gjenskape data gjennomdrøftes. Stor vekst i lagringsvolumer påvirker tiden for sikkerhetskopieringen og tiden det tar å gjenskape data.

Dobles

-- Dataveksten følger Moores lov. Den dobles nå hver attende måned, sier Prasad Rampali, sjefsarkitekt i Intel.

Gordon Moore som satte frem loven, var med å grunnlegge Intel. Han konstaterte at antall transistorer på en elektronikkbrikke doblet hver attende måned. I praksis betyr det at ytelsen dobles.

En prosessor har de siste 30 årene økt antall transistorer fra noen titalls tusen til typisk 100 millioner. Skal datakapasiteten følge samme mønster vil det si at en bedrift med 1 TB med data i dag skal ha 10.000 TB om 30 år.

Sikkerhetskopiering av så mye data er en enorm utfordring. Gjenskaping ved en katastrofe vil ikke være mulig før bedriften er gått konkurs. Det er ikke nok timer.

Erfaring tilsier at bedrifter som ikke har sikret seg godt nok ved en katastrofe, vil gå konkurs i løpet av noen år hvis ikke systemene virker tilfredsstillende i løpet noen uker. Det er ikke applikasjonene som avgjør om bedriftens forretningssystemer virker tilfredsstillende.

Det er dataene. Alle som bedriften skylder penger, vil gjøre sine krav. De færreste som skylder, betaler uoppfordret, da de vet kravet forsvant med systemene.

Mindre tid

Til nå har alle data vært like viktige. Dataene har blitt kopiert for ekstra sikkerhet for å kunne ta seg av alle mulige uforutsette hendelser. Det går bra når det er tid nok å ta kopier.

De store virksomhetene snakker om et 8Backup-vindu8 som er den tiden sikkerhetskopieringen har til rådighet. Mens kopieringen foregår skal ikke applikasjonene endre dataene i filene og databasene. Tidligere var 8vinduet8 typisk fra seks om kvelden til seks om morgenen.

Over tid har kopieringsvinduet krympet. Krav om kontinuerlig tilgjengelighet medfører at å stoppe applikasjoner for å ta sikkerhetskopier av data, ikke lenger er en mulighet. Da må virksomhetene finne frem til andre måter å sikre dataene på.

Å ta en pekerkopi (Snap-shot Copy), er raskt. Deretter brukes pekerkopien som grunnlag for sikkerhetskopieringen. Et annet alternativ er å speile data i flere kopier hvoretter en av kopiene benyttes som sikkerhetsgrunnlag.

Ekstra kopier på platelager sørger for å gjenskape ødelagte filer og tabeller. Norsk Hydro har mange generasjoner med filer for å kunne ta frem tidligere versjoner ved behov. De syv første dagene er de på Hydros hovedsentre. De etterfølgende 23 dagene er de på beredskapssentrene.

Vite hva du har

For mindre norske bedrifter er 8Backup-vindu8 et ukjent begrep. De kopierer data for å sikre seg ved hjelp av enkle magnetbåndstasjoner, automatladere og mindre magnetbåndbiblioteker. Problemet er hvorvidt de kopierer alle de dataene som det trengs å ta kopier av.

Sikringsrutinene blir ikke alltid ajourført. Det kjøpes inn nye tjenestemaskiner som ikke alltid kommer med i beredskapsopplegget.

-- Det å vite hva du har, er nøkkelen til vite hva du skal gjøre. Vi har Etrust Network Frensic, internt kalt Sonar, som oppdager alt som er tilkoblet nettverket, sier Øyvind Andhøy, teknologidirektør i Computer Associates.

Det er administrasjonsprogramvaren for datalagring i form av ressursadministrasjon (Storage Resource Management) som kan avsløre databruken.

Den kan gi oversikt over ikke brukte data fordelt på perioder som 90, 180 og 360 dager. Slike data er det unødvendig å sikkerhetskopiere om igjen og om igjen.

Avsløring av data som ikke kopieres fordi datamaskinen ikke er med i sikkerhetsopplegget, data som kopieres, men ikke har vært benyttet på lang tid, og veksten i lagringskapasiteten, krever at data vurderes med hensyn til viktighet.

Klassifisere

Storagetek og Proact er bevisst behovet for å klassifisere data med hensyn til viktighet. Proact opererer med tre inndelinger, Storagetek med fire eller flere.

Ved samtidig å kombinere dataklassifikasjon med datalivssyklus blir det en enkel, men spennende matrise som vil påvirke kjøp av lagringssystemer, som vil påvirke sikkerhetskopiering og gjenskapelse av tapte data.

-- Kunder er blitt flinkere til å klassifisere data, særlig siste året, sier Roger Stakkestad, i IBM Tivoli.

Klassifiseringsmatrisen kan brukes for å bevisstgjøre virksomheten hvor meget de påvirkes av sine data, hvordan de skal planlegge for ytterligere vekst, hvordan de skal planlegge for å sikre seg mot forskjellige typer sammenbrudd.

-- Det er begynt å bli mye prat om ILM. For enkelte er det et virkemiddel for å flytte gammel moro på billig lagring for å unngå å ta stilling til dataene, hevder Jens Gamlem, kundeansvarlig i Storagetek.

Et eksempel kan være data om ansatte i store bedrifter med mye personalgjennomtrekk. ILM (Information Lifecycle Management) handler om å redusere kostnadene for de store lagringsvolumene ved å anskaffe rimeligere lagringssystemer for data som brukes sporadisk.

For å fortsette

-- Det er en helt annen fokus på å differensiere lagring av data i 8backup-sammenheng8, påpeker Roger Stakkestad.

Fordelen med livssyklus er å gjøre virksomheter oppmerksomme på at data må klassifiseres. Noe er forretningskritisk, noe er kritisk, noe er vitalt og noe er nødvendig.

Forretningskritiske data kreves for å fortsette driften videre. Det er de dataene en bedrift ikke kan klare seg uten etter et totalhavari på datamaskiner og lagringssystemer. Typisk er kopier av applikasjonene, informasjon om de andre dataene og data som benyttes av forretningssystemet, eksempelvis SAP.

Kritiske data er data som er nødvendige for den daglige drift, men som ikke må være tilgjengelige umiddelbart etter et havari. Elektronisk post er et typisk eksempel.

Vitale data er eksempelvis web-informasjon eller analysedata, men må ikke være tilgjengelige umiddelbart etter sammenbruddet. Nødvendige data benyttes eksempelvis for referanse og må ikke være tilgjengelige før eventuelt et månedsoppgjør.

Avstand

Det viktige er å klassifisere sine data i henhold til gjenskapelse. Det viktige er å ha minst mulig data i den mest kritiske klassen, for disse dataene bør kunne skaffes i løpet av et par timer, i tilfelle en brann.

De forskjellige klassene vil kreve forskjellige typer løsninger med hensyn til gjenskapelse. Forretningskritiske data bør dubleres på et sted som ikke blir ødelagt i tilfelle brann.

Om det er noen hundre meter fra lagingssystemene eller om det er femti mil borte, må virksomhetene avgjøre. Momenter i forbindelse med fjernlagring er brann, jordskjelv, sabotasje og strømbrudd.

-- Om tre år tror jeg det kommer til å bli et krav at styremedlemmer må skrive under på it-infrastrukturen er tilfredsstillende, fremhever Øyvind Andhøy.

Grunnen er alle skandalene. Det vil bli reist krav om sporing av data for å sikre at ulovligheter unngås. Konsekvensen er at data må sikres i et lovbestemt antall år. Foreløpig er det bare regnskapsdata som i Norge har krav på å bli tatt vare på i ti år.

Gullåre

Alle amerikanske bedrifter vil måtte følge de strenge amerikanske sporingsreglene. Hva USA bestemmer vil påvirke EU, som deretter vil påvirke Norge.

Banker vil måtte følge kravene til Basel II for å unngå å sette av store reserver for å møte eventuelle tap. I den forbindelse blir data viktige.

Altfor mange synes ikke å forstå at data er bedriftens gullåre. I motsetning til en fysisk gullåre vil bedriftens gullåre øke i verdi over tid ved aktiv utnyttelse istedenfor å minske. Det forstår ansatte som i mange år har jobbet med forretningsanalyse, ofte kalt Business Intelligence.

Men sikres ikke dataene, vil de ikke lenger være verdifulle, for det er ikke gull, alt som glimrer. Forskjellen på resultatet for to konkurrenter er evnen til å utnytte data som grunnlag for sin forretningsvirksomhet. Da må data sikres fordi det alltid skjer feil.

Analysefirmaet Meta er skarp i sin uttalelse om sikring av data. Det koster alt for mye, det er alt for ressurskrevende. Skal man tro Meta svikter 5 ) 20 prosent av alle kopieringsjobbene hver natt.

Det gikk an å pleie data med folk den gang arkivplassen , det vil si platelagrene, var veldig kostbare. Det går ikke an i dag.