Her er norsk forsknings åtte petabyte

Her er norsk forsknings åtte petabyte

"Astrastore" reduserer prisen for arkivering av forskningsdata til en tusendel.

Tre gode ting, lagringskapasitet, tilgjengelighet og sikkerhet gjør Astrastore, Norges nye lagringssystem for forskning, til et kinderegg. Det er medisinsk forskning som krever den høye sikkerheten.

- Navnet Astrastore henspiller på Universitetet i Oslos motto: også vi søker stjernene. Det har vært lagt ned mye tid og innsats bak anlegget, sa rektor Ole Petter Ottersen ved innvielsen.

LES OGSÅ:

Terabyte er ikke presist nok

På latin lyder mottoet: Et nos petimus astra. Astrastore er stedet hvor forskerne skal skape sin egen stjernehimmel av vitenskapsressurser på veien dit.

Åpnet

Kunnskapsminister Kristin Halvorsen fikk æren av å åpne anlegget ved å legge inn den første filen som omfattet Stortingsmelding nummer 18, «Lange linjer – kunnskap gir muligheter» fra mars i år. Men forståelsen for arkivering preges ikke denne Stortingsmeldingen av.

- Vi er glade for at Universitetet i Oslo har fått til lagringsanlegget. Det skal betjene hele forsknings-Norge og forskning utenfor landet. Med Astrastore heves kvaliteten. Satsningen er dristig. Det blir enklere å spre og dele kunnskap, sa Kristin Halvorsen, før hun la inn Stortingsmeldingen.

Halvorsen var opptatt av åpen tilgang til vitenskapelige artikler, til vitenskapelige data som sensitive helsedata, uten at det går på bekostning av personvernet.

- Vi måtte til utlandet for å forstå hvor avansert kreftforskning vi har her i landet, påpekte Kristin Halvorsen.

Astrastore skal i tillegg til forskningsdata dekke alle Universitetet i Oslos behov for digital arkivering, alt fra forskningsresultater via épost til ansatte og studenters hjemmeområder.

Overtar

Astrastore skal ta seg av Norges bidrag til lagring av partikkeldata fra det europeiske atomforskningsenteret Cern. Én petabyte skal Cern disponere.

Astrastore overtar nå også funksjonen til Norstore som har vært det tidligere arkivet for norske forskningsdata. 800 GB med data blir overført fra Norstore til Astrastore.

Norstore har vært foreldet i flere år på grunn av uensartet lagringsteknologi hvor lagring fra de fleste lagringsleverandørene har vært benyttet.

Med Astrastore oppnår norske forskere ensartet lagring de neste fem år med ytterligere ett års avtale for å klare overgangen til det etterfølgende arkivet som kommer 2019.

Alle kapasiteter som oppgis er netto, det vil si den lagringsmengden forskerne og Universitetet får tildelt for sine formål. Grovt sett betyr det at bruttokapasiteten er drøyt 20 prosent større.

Det er typisk Store data, Big Data - for forskning har virkelig behov for å forstå store datamengder. Astrofysikk og klima er to områder.

Kilde

Dekan Morten Dæhlen ved Det matematisk-naturvitenskapelige fakultet understreket at alle forskningsområdene produserer store mengder vitenskapelige data. Disse dataene vil være en viktig kilde til ny kunnskap.

Astrastore sørger for at det er mulig å intensivere forskningen rundt forvaltning av sensitive data innen helse og samfunnsfag. I tillegg skal det jobbes med bedre metoder for arkivering av forskningsdata.

Innsatsområder er astrofysikk, biovitenskap, farmasi, fysikk, geovitenskap, informatikk, kjemi og matematikk.

- Syv petabyte klarer vi å fylle fort. I løpet av få år kreves det 500 Petabyte for at politikerne skal få verifisert sine vedtak, fremhevet Morten Dæhlen.

Det er klimavedtak Morten Dæhlen henviser til.

- Dokumentasjon av klimadataene er helt kritisk. Uten data blir det ingen klimaforskning, sa seniorforsker Øystein Godøy ved Meteorologisk Institutt.

I dag er behovet 285 TB. Det seneste året har det ikke vært mulig å med nye modelleksperimenter, men det endres med Astrastore. I 2017 er behovet for klimadata 10 – 20 PB. Om 20 år må man ha arkivert 100 exabyte (100.000 PB) for å være med i det internasjonale klimasamarbeidet.

Fire operaer

- Cern trenger 30 petabyte i året. Det tilsvarer fire bygg tilsvarende Operaen med salt, sa Roar Skålin, spesialrådgiver i Forskningsrådet mens han viste frem en pose grov salt.

Utfordringen er å vite hvilke data som er tilgjengelige, for det gjelder å finne frem til de dataene som det er verdt å arkivere. Derfor må det bli en langsiktig nasjonal strategi å ta vare på data.

Et nasjonalt forslag til et spleiselag for data vil bli sendt Kunnskapsdepartementet i løpet av året. For gode data vil øke kvaliteten på norsk forskning hvor det er viktig å dele med andre for å få noe igjen.

Førsteamanuensis Trygve Leergaard avdeling for anatomi ved det medisinske fakultet ved Universitetet i Oslo understreket at deres bidrag til det internasjonale forskningsprosjektet HBP, Human Brain Project med inntil tusen bilder per hjerne krever 1 TB.

Dr. Philos Leonardo A. Meza-Zepeda ved Radiumhospitalets forskningsinstitutt fremhevet hvordan forskningen kan bidra til å redusere bivirkninger av kreftmedisin på grunn av forskning på pasientenes genomer.

- Norge er det eneste landet hvor alle med lungekreft skjermbildefotograferes, fremhevet Leonardo A. Meza-Zepeda.

Det er særlig de sensitive pasientdataene som må arkiveres trygt. Behovet er to tusen sekvenser med data hver på 5 PB.

Men det er ikke bare lungekreft som krever sikker lagring. Ved Universitetet i Oslo har de anslått at Det medisinske fakultet, Det teologiske fakultet, Det samfunnsvitenskapelige fakultet og Det utdanningsvitenskapelige fakultetet alle har problemstillinger med forskning på sensitive data.

En egen tungregnemaskin, Colossus, og 400 TB med data fra Astrastore er avsatt for sikker sensitiv forskning. Data overføres i løpet av mai og Colossus vil være klar for oppgaver før sommeren.

Tilgang

7,6 PB arkivplass vil Universitetet i Oslo ha tilgang til i løpet av april, for uken etter at Kunnskapsminister Kristin Halvorsen åpnet anlegget kom en bestilling på 600 TB. Det er bare en brøkdel av behovet, for forskningen har omfattende behov for arkivering av forskningsdata.

I 2000 kostet arkivering av en terabyte grovt sett 540.000 kroner i året for Universitetet i Oslo.

- Vi bidrar til å redusere lagringskostnadene for forskerne per år til en tusendepart av hva den var i 2000, sier Rune Sund, administrerende direktør i Hitachi Data Systems som har levert Astrastore.

I den nye kontrakten koster arkivering av en terabyte rundt 570 kroner per år. Investeringskostnadene er dermed redusert til en tusendepart.

Reell kapasitet i Astrastor er 3,4 PiB lagringskapasitet i Hitachi Data Systems lagringssystem HUS VM og 3,6 PiB i magnetbåndbiblioteket Spectralogic T-Finity. Med den nye utvidelsen blir det 4 PiB i HUS VM.

Magnetbåndarkivet har fire IBM magnetbåndsstasjoner for IBMs avanserte magnetbånd, Jaguar på 4 TB. Totalt 702 bånd kan Astrastore arkivere.

Les om:

Lagring