Data må gjemmes, men ikke glemmes

Data må gjemmes, men ikke glemmes

KOMMENTAR: Mye data er aldri i bruk, men må tas vare på likevel.

De kaller det records management. De kaller det objektdata. Det omfatter data som er verdifulle. De kaller det Big Data. Youtube er mest kjent. Der øker lagringsbehovet uhemmet.

Ideen er å ta vare på, sikre og garantere at dataene er ekte, at de er identiske uansett når de tas frem fra glemselen. Hensikten er at de ikke skal kunne klusses med. De skal ikke fjernes og erstattes. De skal ikke stjeles. Skandalen kan nærmest bli uhørt om dataene blir ødelagt eller borte.

Verdiene er enten historiske eller økonomiske. De historiske representerer vår kollektive fortid. Bedrifter og biblioteker skal sikre digitaliserte historiske data. De økonomiske er en konsekvens av myndighetskrav, opphavsrettigheter, patenter og regulativer.

Tar vi ikke vare på dataene på en sikker måte, kan det bety økonomisk ruin. Tap av lisens er et typisk eksempel. Meglere er utsatt. De må være til å stole på. Da må dataene de presenterer være til å stole på.

Må sikres

I USA er det mange regulativer. Sarbannes Oxley er den mest kjente. Fremkommet på grunn av skandalen rundt Enron som kollapset fordi selskapet var et økonomisk luftslott. Innen helse gjelder HIPAA som regulerer pasientdata på grunn av forsikringsselskapenes bidrag til helsefinansieringen. Food and Drug Administration har de strengeste regulativene med hensyn til dokumentasjon.

I Norge er det mindre strengt. Ti år for sikring av regnskapsdata gjelder. Strenge krav til meglere gjelder. For finansmeglere skal telefonsamtaler tas opp slik at innholdet ved behov kan vurderes i ettertid. Det blir mye Big Data. De må sikres. Alt for ofte har selskaper måttet innrømme at de ikke har tatt vare på det de skulle.

Det er underlig at ikke all korrespondanse som har økonomiske konsekvenser, mellom to parter må sikres. Det er ingen sikringskrav til elektronisk post. Kun det offentliges postjournaler er det satt krav til. Der sikres data, men alt for ofte undras saker fra innsyn.

Innen matvareproduksjon vurderes det hvilke data som bør tas vare på for sporing. I Datalagringsdirektivet kreves det oppbevaring av samtaledata for eventuelt sporing. Men det er ikke satt krav til at dataene er ekte. Det tas for gitt.

Dobbeldublering

Data med reguleringskrav og data av historisk interesse må sikres ved hjelp av avansert it-teknologi. Til nå har det ofte vært lagring ved hjelp av ekstra kopier. Skriv dataene på et magnetbånd og putt det i et hvelv.

Alternativet har vært garantiteknologi, som oftest alt for kostbar. EMC var det første firmaet med et lagringshvelv, en arkiveringsløsning med ekthetsgaranti ved hjelp av datamaskiner, programvare og platelagre. Centerra var det første systemet som laget en sjekksum på de lagrete dataene som ble tatt vare på. Hver gang dataene ble etterspurt ble en utregnet sjekksum sammenlignet med den lagrete sjekksummen.

Men Centerra har ikke blitt noen stor suksess. Problemet var kostbare datamaskiner for gjenfinnings og garantiberegningene. Nå er strategien Atmos.

Hewlett-Packard fulgte opp med sin løsning. IBM hadde et enklere alternativ. Selv Nexsan skaffet seg et tilbud som få oppdaget. Samtlige tilhører forrige generasjon.

Nå trengs det tilsvarende systemer med dagens teknologi. Nå er datamaskiner, nettverk og lagringsenheter blitt mye rimeligere. Det er bare et spørsmål om å gjøre øvelsen om igjen.

Hewlett-Packard har gjort låseteknologien til et programvaretilbud. Låsing skjer alternativt på logisk volum for en gitt periode.

Hitachi Data Systems prøver seg med et lagringshvelv med ny teknologi. Det har en kapasitet på inntil 40.000 TB. Ideen er å kunne være et hvelv for mange leverandører av tjenester på internettet. Fakturering og enkel administrasjon er en selvfølge.

Ideen er å fjerne magnetbåndsarkivering for data som ikke er aktive. De skal ikke sikkerhetskopieres. Det er gjort ved å plasseres dem i hvelvet. Der er data dublert og hvelvet er dublert.

Ahlerts Hjørne