140.000 HYLLEMETER: Arkivverket ser på seg selv som «nasjonens hukommelse», og i fjellet under kontorene i Oslo er det store mengder lagret.

140.000 HYLLEMETER: Arkivverket ser på seg selv som «nasjonens hukommelse», og i fjellet under kontorene i Oslo er det store mengder lagret.

Datalagring til evig tid

Riksarkivet har mer analoge enn digitale data, men det varer ikke evig.

Til å være et statsorgan lokalisert til hovedstaden, er Riksarkivets beliggenhet litt merkelig. Ved endestasjonen til T-banens linje til Sognsvann, vis a vis Toppidrettssenteret og Olympiatoppens lokaler, finner vi bygningene til Riksarkivet og Statsarkivet i Oslo. De er langt uti skauen, i stedet for sentralt og i nabolaget til ett eller annet departement, slik mange andre offentlige instanser virker å foretrekke.

Det kan ha noe med undergrunnen å gjøre. Under en relativt futuristisk utseende kontorbygning finnes det flere etasjer med lagringsrom sprengt ut inni fjellet. Det er her godt over halvparten av arkivene under Arkivverket – fellesbetegnelsen på Riksarkivet, Statsarkivene, Norsk helsearkiv og Samisk arkiv – fysisk befinner seg.

I reklamevideoer for denne etaten brukes begrepet «nasjonens hukommelse», og mandatet er å lagre i uoverskuelig framtid, altså i lengre tid enn vi kan tenke oss

Det stiller krav, og sett med it-øyne er både formater og medier noe som fram til nå ikke har vært spesielt evigvarende, verken når vi tenker hvor lenge det har vært aktuelt å bruke, eller i fysisk levetid.

260 hyllekilometer med papir

Tradisjonelt har arkiver naturlig nok vært papirbaserte. Det er også tilfellet for arkivene til Arkivverket.

-- Totalt finnes det cirka 140.000 hyllemeter i bygget på Sognsvann, og om vi teller med statsarkivene og Samisk arkiv, kommer vi opp i totalt 260.000 hyllemeter, forteller Ole Myhre Hansen, underdirektør i seksjon for digitalt depot i Riksarkivet. Om vi estimerer at en hyllemeter med papir har fem tusen ark, er det altså lagret bortimot 700 millioner ark på Sognsvann.

Det tilsvarende antallet for alle statsarkivene og Samisk arkiv, tilsier at det lagres omlag 1,3 milliarder ark hos Arkivverket, og mange av disse har informasjon på begge sider. 

En petabyte på lager

Arkivverket har ingen ambisjoner om å digitalisere alt analogt materiale. Ifølge Myhre Hansen er nåværende ambisjon å digitalisere 10 prosent av arkivene innen år 2030. Hvilket materiale som velges ut til innskanning er blant annet basert på hva som er og kommer til å bli mest etterspurt blant særlig forskere, etater og befolkning for øvrig.

-- I øyeblikket ligger volumet på cirka to prosent, forteller han. Dette er altså 2 prosent av de 260.000 hyllemeterne som finnes hos Arkivverket.

Det innskannete materialet består av 42 millioner bilder, lagret i 2 kvaliteter, og deretter i original pluss to backup kopier. Det utgjør til sammen mer enn en petabyte i lagringsplass. Originalene kommer her fra en lang rekke historiske arkiver

Den største delen er tinglysingsmateriale, som tar opp nesten 77 TB og nær 28 millioner filer. Deretter kommer kirkebøker og registre fra Riksantikvaren, på henholdsvis 42,5 og 21,7 TB.

I tillegg finnes det digitale indekser og andre metadata om det analoge arkivet. Dette finnes blant annet tilgjengeliggjort for offentligheten på nettsiden arkivportalen.no.

Magnetisk lagring

Arkivverket har valgt å kun bruke magnetiske medier for langtidslagringen sin, forteller Erik Aaberg, seniorrådgiver i samme seksjon som Myhre Hansen. Riksarkivet bruker både harddisker og magnetbånd, og Aaberg sier at tre kopier på forskjellige medier og minst en av dem utenfor bygningen, er Arkivverkets strategi. I Oslo er det løst med to forskjellige datarom i kjelleren, som regnes som tilstrekkelig fysisk adskilt.

Selv om harddisker og magnetbånd i teorien har forskjellig levetid, behandler Arkivverket dem likt.

-- De fysiske mediene har jo en levetid på mellom tre og syv år i snitt før de begynner å gå i stykker. Dermed har vi nå en fysisk migrasjon cirka hvert femte år for alle de tre kopiene vi har av alt, forklarer Aaberg. Det gjøres for å sikre at dataene flyttes til nye medier, før selve lagringsmediet rekker å bli ødelagt.

I tillegg må de tenke på at formatene kan finne på å endre seg over tid. Plutselig er ikke et utbredt format i bruk lenger, og da tar det ikke lang tid før programvaren som bruker formatet også blir borte. Da må innholdet konverteres for at arkivet skal være brukbart.

MAGNETISK: Arkivverket baserer seg utelukkende på magnetiske lagringsmedier, både harddisk og magnetbånd. Med en original og to kopier blir det store mengder, fastslår Ole Myhre Hansen (til venstre) og Erik Aaberg hos Riksarkivet.
MAGNETISK: Arkivverket baserer seg utelukkende på magnetiske lagringsmedier, både harddisk og magnetbånd. Med en original og to kopier blir det store mengder, fastslår Ole Myhre Hansen (til venstre) og Erik Aaberg hos Riksarkivet.

Konservativ strategi

Av den grunn er ikke Arkivverket spesielt fremoverlente når det kommer til å ta ny teknologi i bruk. Når perspektivet er evigheten, er det ingen grunn til å hoppe tidlig på enhver bølge som passerer.

-- Vi er ganske konservative her, det ligger vel i sakens natur. Det betyr ikke at vi ikke følger med på teknologier og hva som skjer der, men vi er konservative når det kommer til strategier. Vi har noen prinsipper som gå på at ting skal være åpent tilgjengelig, at de ikke skal være avhengig av operativsystemer og det skal være vel utprøvde metoder og formater, forklarer Myhre Hansen.

-- Vi har jo en forskrift for hvilke formater vi kan ta i mot for lagring i hundreårperspektiv. Den er ganske restriktiv, og ikke nok med at den er restriktiv, den er så gammel at den begynner å bli utdatert. Det betyr at vi stadig må gjøre unntak fra den. Men vi tror likevel på den konservative grunnholdningen for det vi driver med, legger Aaberg til.

Et eksempel på gammel teknologi i forskriften (se egen ramme) er videoformater. Offisielt krever Arkivverket MPEG-2 videoformat, og ikke MPEG-4. Dette forteller Aaberg er et krav de oftere og oftere må gjøre unntak for.

Digitalt depot

I seksjonen for digitalt depot jobbes det likevel mest med arkiver som var digitale fra begynnelsen av, forteller Myhre Hansen. Det finnes det stort antall arkivsystemer, saksbehandlingssystemer og andre løsninger i offentlig sektor, som er kilder til langtids arkivering (digitalt depot) hos Arkivverket.

Ifølge tall fra rapporten 'eArkiv i offentlig forvaltning', utgitt i 2015 av Arkivverket selv, vil det kunne komme et svært stort antall arkiver som skal tas vare på framover. Totalt er det 21 departementer og 334 underliggende statlige etater som er pliktige til å avlevere øyeblikksbilder (såkalte «uttrekk») til Riksarkivet.

Basert på dette spår Arkivverket at det i perioden 2015 til 2034 vil være cirka 1380 slike avleveringspliktige arkiver. I tillegg peker Arkivverket på et betydelig etterslep, der det anslås at i perioden 1995 til 2014 er omlag 6690 slike uttak som ikke er avlevert til depot, sier Myhre Hansen.

På grunn av at dataene må kvalitetssikres og integritetssikres, må de som regel «vaskes» et par runder før endelig deponering, er det endel kostnader forbundet med slike arkivuttrekk. Slik arbeidet med et uttrekk gjøres nå, anslår Arkivverket at det påløper en kostnad på 200.000 kroner per uttrekk, delt omtrent likt på avsendende etat og Arkivverket selv. 

-- På de meste har vi sett syv runder med frem og tilbake før dataene var gode nok. Det kan være forferdelig tidkrevende, sier Myhre Hansen.

Datautveksling

Både på grunn av kostnadene og den forventete økningen i rene datavolumer, jobbes det iherdig med en heldigital løsning for offentlige arkiver. Myhre Hansen forteller at det foregår et pilotprosjekt på en eArkiv-løsning, der Riksarkivet og Riksantikvaren samarbeider.

I stedet for et regelmessig og manuelt arkivuttak, ligger det i stedet programvareagenter som sender én enkelt sak over til deponering, når saken er avsluttet. Dette står i sterk kontrast til store, kostbare arkivuttrekk med mye manuelt arbeid hvert femte år.

-- Denne piloten er ikke ferdig og i mål ennå, men det ser ut som vi skal lykkes, sier Myhre Hansen.

I forlengelsen av tenkingen omkring elektronisk utveksling av arkivdata, er det mange andre muligheter. For eksempel vil automatisk innsyn i offentlig informasjon være adskillig enklere og mer effektivt å realisere.

Myhre Hansen tenker også høyt om at automatisk innlegging av arkivdata inn i Arkivverkets depoter vil gjøre at mange flere etaters arkiver vil komme til riktig tid på riktig plass i arkivene på Sognsvann. Når det er en realitet, vil dagens datavolumer i «nasjonens hukommelse» øke i et nært eksponentielt tempo, og gå langt forbi papirhyllene som dominerer idag.

Lagring