REGNEKRAFT: Hans A. Eide ved USIT/UiO tilbyr forskerne lagringsplass og regnekraft. På infrastrukturen TSD er sikkerheten så høy at sensitive data kan behandles trygt, men dit slipper verken han eller vi inn, så her er HPC-klyngen Abel for mer generell tungregning.
REGNEKRAFT: Hans A. Eide ved USIT/UiO tilbyr forskerne lagringsplass og regnekraft. På infrastrukturen TSD er sikkerheten så høy at sensitive data kan behandles trygt, men dit slipper verken han eller vi inn, så her er HPC-klyngen Abel for mer generell tungregning.

Innovasjon vs. personvern

Mye av den it-relaterte forskningen innenfor helse og medisin handler om DNA, særlig innenfor kreftforskningen. Men det skjer andre spennende ting på området også – innenfor begrensningene personvernet gir.

Publisert Sist oppdatert

It og helse handler om mye mer enn elektroniske pasientjournaler og kontorstøttesystemer. Allerede i dag finner vi it-baserte teknologier innenfor mange av disiplinene i helsevesenet, og alle solemerker tyder på at dette er en utvikling som akselererer. Om ikke mange år inn i framtiden kommer it til å gjennomsyre all aktivitet i helsevesenet.

It er også et av de viktigste hjelpemidlene innenfor medisinsk forskning, og på dette området har de siste års utvikling bidratt til klare framskritt. Universitetet i Oslo (UiO) forsker innenfor nær sagt alle vitenskapelige disipliner, og også innenfor medisin og helse er det stor aktivitet. Vi har snakket litt med et par viktige aktører på UiO om medisinsk forskning, for å se hva framtiden bringer innenfor helse og it.

Forskning og it

Selvsagt har it-relatert forskning eksistert i mange år, både innen medisin og i alle andre fag. Beregningsbasert forskning (se egen ramme) har eksistert så å si så lenge datamaskiner har vært i bruk på universitetene, for eksempel har jo meteorologi lenge brukt beregninger på modeller for å kunne forutse hvordan været utvikler seg. Meteorologi var også en av de viktigste grunnene til at skikkelige tungregnemaskiner – superdatamaskiner – fant veien også til lille Norge i sin tid.  

Datamaskinbruk innenfor spesielt medisinsk forskning ikke kan heller ikke sies å være en nyhet i dag. Også på dette området har beregningsbasert forskning vært en aktuell metode i mange år.

Likevel har de siste årenes utvikling gjort at det er grunn til å si at it-basert forskning er mer relevant enn noengang, kanskje særlig innenfor den medisinske forskningen. Kapasiteten til datamaskinene har økt kraftig, slik at de er i stand til å utføre oppgaver som tidligere ikke var mulig.

For eksempel er kartleggingen av det menneskelige DNA det største biologiske prosjektet noen sinne, det tok 13 år og involverte et stort antall menneskelige og tekniske ressurser verden over. I dag kan vi sekvensere en pasients DNA på en halvtime og for en relativt lav kostnad. Maskinene som gjør jobben genererer omkring 200 GB med data, som alt etter hvordan de etterbehandles, lagres på 125 MB til 3 GB, om rådataene må reduseres.

Samtidig genereres det mer data enn noen gang i verden. Delvis er informasjon som var analog før blitt digitale data nå, og i tillegg deles mer data enn før. Dette er spesielt sant for akademia, der for eksempel EU har oppfordret alle sine medlemsland om å åpne tilgangen til alle forskningsdata. Dette gjør at forskerne har mulighet til å studere langt større datamengder enn før, og i mange tilfeller er datasystemer det eneste verktøyet som er brukbart på disse dataene.

Innsikt fra data

-- Helse kommer til å være veldig forskjellig i fremtiden. Data kommer til å være veldig viktig, hos fastlegen, på sykehuset og i ambulansen; alle steder kommer data til å være helt sentralt, mener Arnoldo Frigessi, professor i statistikk ved Det medisinske fakultet på UiO. Frigessi er også lederen for et relativt nytt forskningssenter, Big Insight i Oslo. Dette er ett av 17 sentre for forskningsdrevet innovasjon som Norges Forskningsråd står bak.

Om mandatet for Big Insight kan vi lese «er å bidra til økt verdiskaping i samfunnet gjennom å utvikle nye statistiske metoder og verktøy for håndtering og sammenstilling av store og komplekse datasett for privat og offentlig sektor» i Forskningsrådets presentasjon.

Big Insight huses av Norsk Regnesentral og består av samarbeid mellom UiO og Universitetet i Bergen, i tillegg til en rekke store og velkjente virksomheter: ABB AS, DNB ASA, DNV GL AS, Gjensidige Forsikring ASA, Norsk Hydro ASA og Telenor ASA. Offentlige partnere er NAV, Skatteetaten og Oslo universitetssykehus. Det er også̊ etablert samarbeid med flere internasjonale forskningsinstitusjoner. Som vi kan se av partnerlisten, er det ikke utelukkende medisinsk forskning som skal foregå under Big Insights vinger, men det er en viktig del av virksomheten:

-- En fjerdedel av Big Insights virksomhet skal være relatert til helse, forteller Frigessi.

Persontilpasset behandling

Et av områdene innenfor helse som Frigessi og Big Insight er mest opptatt av, er persontilpasset diagnostikk og behandling. Dette er basert på DNA-sekvensering av den enkelte pasient, som deretter sammenlignes med et stort antall DNA-sekvenser fra andre pasienter, for å finne sammenfall mellom sykdomstyper og behandlingens resultat.

-- Personlige løsninger og personlig behandling kommer til å være et av de store temaene framover. Ideen er at om ti år når vi går til legen, setter vi inn en brikke der vår DNA er lagret i en maskin. Deretter vil legen finne ut hvilken terapi som passer best for meg, forklarer Frigessi.

Dette er kanskje særlig relevant innenfor kreftbehandling, et område Frigessi har jobbet med tidligere. For kreft finnes det en lang rekke medikamenter og behandlingsalternativer, og når vi tenker på at disse kan varieres både i rekkefølge og dosering, er det klart at det finnes svært mange forskjellige kombinasjoner for forskjellige behandlingsprogram for den enkelte pasient. Her kan DNA-analyser bidra til å finnes den mest optimale behandlingen for hvert enkelt tilfelle, i stedet for dagens kreftbehandling som i noen grad er preget av prøving og feiling.

-- Vi må reorganisere hele greia, man har skjønt at alle disse medisinene man kan få, kan kombineres på mange forskjellige måter. For hver enkelt pasient er det en optimal kombinasjon som er forskjellig fra alle andre. Det er personlig behandling, og dette tilbys ikke noen steder i dag, forteller Frigessi engasjert.

Databasert pasientsikkerhet

Det er ikke bare DNA-analyse Frigessi nevner når vi spør om eksempler på databasert medisinsk forskning i dag. Et annet prosjekt han trekker fram i denne sammenhengen, handler om pasientsikkerhet.

Etter som mer og mer av pasientenes informasjon, hvilken behandling vedkommende har fått og skal ha, er digital, er det mulig å bruke dataassistert kontroll av om pasienten får riktig behandling. I utgangspunktet er dette basert på kunnskap om standard behandling for en gitt sykdom eller skade.

-- Ved en viss sykdom vet vi hva som er standard, rutinemessige terapi. Så gjør legen noe litt annerledes, og da skal en algoritme varsle om dette, om det er riktig eller en feil. En annen pasient skal ha morfin hver tredje time, og da skal det være en algoritme som overvåker dette for alle pasienter. Dette kommer til å skje veldig snart, mener Frigessi.

Utfordringen kommer rundt neste hjørne, når persontilpassete løsninger blir mer utbredt. Konsekvensen av denne utviklingen må også få følger for kvalitetssikringen av helsetjenestene, påpeker Frigessi:

-- Det som skjer her er veldig interessant. Det finnes som jeg sa, rutiner og standard behandlinger. Med persontilpasset behandling finnes det ikke lenger standardbehandlinger, da får du en behandling som ingen andre får. Hvordan skal vi da sikre at pasientene er trygge og får korrekt behandling? Svaret på det er at vi må kontrollere at algoritmene som har skrevet ut behandlingen, er riktige. Plutselig må vi i stedet for å overvåke pasientene og sykepleierne, finne ut om algoritmene som regner ut behandlingene er riktig, sier han.

Han trekker fram et eksempel fra en av sine partnere i Big Insight, DNV GL (tidligere kjent som Norske Veritas). De sertifiserer sykehus, helt tilsvarende at de sertifiserer skip. I dag er kontrollen av sykehusene basert på at DNV GL kontrollerer sykehusets dokumentasjon av sine kontroll- og kvalitetssystemer. Slik kan det ikke fortsette, i takt med at datasystemer i større grad tilpasser behandlingen av pasientene.

-- I dag gjør de det altså ved å kontrollere at sykepleierne og legene gjør de riktige tingene. Om fem år er det sannsynligvis algoritmer som gjør dette automatisk mot de elektroniske journalene. Om ti år, når behandlingen er fullstendig personlig, må DNV GL ha metoder til å sjekke om algoritmene som lager behandlingen er riktige, forklarer Frigessi.

Problematisk personvern

Det er klart at helsedata fra virkelige pasienter er blant de mest sensitive dataene som finnes. Behandlingen av slike data er underlagt strenge regler, med klare føringer både i form av lover og forskrifter. Dette står i klar motsetning til fri og åpen forskning på slike data, og dette mener Frigessi er et problem:

-- Et av de største problemene i hele helsevesenet, er pasientenes personvern. Fra mitt synspunkt er dette litt paranoid. Vi er veldig bekymret for at data skal brukes uten at pasienten vet og samtykker til det, men vi kan ikke fortsette slik. Vi har så mange fantastiske data allerede, som kan brukes til å finne bedre behandlinger raskere. Vi har et ansvar for å bruke disse dataene, fastholder han.

-- Vi må bevege oss vekk fra denne bekymringen, til en ny sosial holdning som sier at data er et felles gode som skal brukes for å få fremgang for oss alle. Alle pasienter og mennesker burde gi bort sine data fordi det er det riktige å gjøre, men de må få vite hvordan dataene skal brukes, legger han til.

Dette blir særlig problematisk når vi kommer til analyser av store og tildels ustrukturerte datamengder fra mange og forskjellige kilder – store data («Big Data»). I helsesammenheng her til lands finnes det flere registre som det kan være nyttig å koble sammen, for å lete etter ny innsikt og hittil ukjente sammenhenger. Disse dataene lar seg ikke anonymisere, fordi i de fleste tilfellene er pasientens personnummer det som gjør det mulig å sette sammen disse registrene. I tillegg er konsesjonene for bruk av sensitive persondata slik at de kan kun brukes til en, på forhånd bestemt, anvendelse. Det er helt grunnleggende i motsetning til tenkingen omkring analyser av store data.

-- Hvis jeg ønsker å gjøre en studie på en spesiell sykdom, så må jeg få tillatelse til å bruke dataene til akkurat dette. Da har jeg ikke lov til å bruke dem til noe som helst annet. I Big Data-sammenheng er dette problematisk, fordi jeg ikke har noen hypoteser i utgangspunktet. Da er det umulig å spørre pasientene om tillatelsen til en spesifikk anvendelse. Hele lovgivningen er lagd for forskning som tester hypoteser jeg kan skrive ned på forhånd. Slik er det ikke lenger, vi starter ikke med en hypotese. Gi meg genene dine, så skal jeg finne ut hvilke sykdommer som kontrolleres av hvilke gener, det vet jeg ikke ennå. Reglene må være helt annerledes i framtiden, fastslår Frigessi.

Tjenester for sensitive data (TSD)

På Universitetets senter for informasjonsteknologi (USIT) møter vi Hans A. Eide. Han er seksjonssjef for Seksjon for IT i forskning på USIT, som altså er leverandøren av it-tjenestene som forskerne på UiO benytter seg av, blant annet tungregning og storskala datalagring. Her er det på sin plass å gjøre klart at USIT ikke er direkte involvert i den tekniske leveransen av it-tjenestene til Big Insight, det er det Norsk Regnesentral som gjør.

Likevel tenker Eide på mange av de samme problemstillingene som Frigessi gjør. En viktig del av arbeidet til Eides seksjon er tungregning og «tunglagring», først og fremst levert via UiOs to HPC-klynger Abel og Colossus. Til tross for navnet, er ikke Colossus den kraftigste maskinen av de to, men den har siden i fjor vært UiOs superdatamaskin som behandler sensitive data. Dette er svært viktig for helseforskerne ved universitetet, for tidligere var det ikke mulig å utføre analyser på sensitive data i den skala som det er nå.

-- Det er vanskelig å bygge et tilstrekkelig sikkert system som også er anvendelig, og det er enda vanskeligere å få det godkjent for bruk på de mest sensitive data, kommenterer Eide. I TSD forskes det på de mest sensitive data som tenkes kan, som videoopptak av intervjuer med pasienter i psykiatrien, opptak av intervjuer av Utøya-overlevende, videoopptak av annen forskning, i tillegg til persondata som MR-bilder og DNA-sekvenser. Det er opplagt at dette er informasjon som må beskyttes, og som er underlagt et svært strengt sikkerhetsregime.

TSD er derfor bygd som en separat fysisk infrastruktur, i sitt eget datarom på USIT. Her har ikke engang Eide normalt fysisk adgang til rommet der maskinen befinner seg. Rundt maskinen er det bygd opp sikkerhetstiltak med to-faktor autentisering, portaler for fjernaksess og krypterte forbindelser. Til sammen gjør dette det mulig for brukerne å aksessere systemet, selv fra lokasjoner utenfor UiO.

-- TSD er et «mini-USIT» i sikker versjon, og har vært en skikkelig suksesshistorie, sier Eide.

Han forteller videre at i skrivende stund er det drøyt 100 prosjekter som bruker TSD, og det er flere på vei inn. Disse kommer ikke bare fra UiO, men blant andre Oslo Universitetssykehus ser også mulighetene med denne løsningen.

Personvern

Det er åpenbart at det skjer mye, og mye bra innenfor it og helse i Norge. Det foregår langt mer forskning på området enn det vi har hatt plass til å presentere her, og det lover godt for framtiden.

Samtidig er det grunn til å påpeke vanskelighetene ved akkurat denne typen forskning. På den ene siden bruker denne virksomheten noen av de aller mest personlige data som finnes, på den andre siden er dette kanskje noe av den viktigste forskningen for hver enkelt av oss – vi kommer alle til å ha behov helsetjenester før livet er omme, og da ønsker vi den beste behandlingen som tenkes kan.

-- En konsesjon fra Regional Etisk Komité kan gi hjemmel for bruk og lagring av sensitive data i en periode, og deretter, når konsesjonen utløper, må dataene i mange tilfeller destrueres. De kan derfor ikke arkiveres for fremtidig utnyttelse. Det er potensielt en ødsling med samfunnsressurser. Noen av disse dataene går ikke inn i sentrale historiske dataregistre, og må derfor slettes. Vi vet ikke hvilket gull som kan ha gått tapt, men heldigvis har vi ihvertfall gode registre i Norge og Norden som gir oss fantastiske muligheter, sier Eide.

-- I fremtiden tror jeg at data ikke kommer til å være private lenger. Det er et kjempeproblem for økonomien, som er basert på at råvarer koster noe, mens dette er en råvare som ikke koster noe. Så vi går tross alt i retning av en bedre verden, takket være it, håper professor Frigessi avslutningsvis.