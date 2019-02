Skatteetaten satte i gang prosjektet i 2016, som skal være ferdigstilt senere i 2019. Moderniseringen skjer i tråd med den nye folkeregisterloven som trådte i kraft i oktober 2017.

Loven skal åpne for nye tilganger, modernisere tjenester og gjøre det enklere å dele informasjon. Det blir også bedre tilgangsstyring gjennom såkalte rettighetspakker. Det kommer også strengere krav til brukerne av folkeregisteropplysninger som skal kontrollere, hvem som bruker opplysningene og hvordan disse brukes.

Parallelt med med moderniseringen av folkeregisteret jobber Skatteetaten med et syntetisk folkeregister. Her er målet å kunne bruke data som et representativt utvalg av den virkelige befolkningen, med syntetisk data som ikke skal kunne spores tilbake til faktiske brukere.

Computerworld har stilt spørsmål rundt det syntetiske folkeregisteret til Gruppeleder for Testsenteret, Marianne Rynning, og Testleder i Prosjektet, Margrethe Myrstad Bedregal, begge fra Skattetaten.

Hvorfor er det så viktig med et syntetisk folkeregister, og hvorfor må dataen være syntetisk?

Test med syntetiske data er vesentlig for å ivareta sikkerhet og personvern. Dette er spesielt viktig for Folkeregisteret, som inneholder mange personopplysninger, også av sensitiv art, og noe prosjekt modernisering av Folkeregisteret har jobbet målrettet med siden oppstart.

Ved å tilby kun syntetiske testpersoner sikrer vi at persondata ikke kommer på avveie. Representative testdata, som gjenspeiler sammensetning av personer og hendelser i produksjon, sikrer at brukerne får en høy kvalitet på testen uten at vi risikerer å eksponere ekte data.

Har de, som dere først ser for dere skal teste på det nye datasettet, klare syntetiske miljøer allerede?

Ja, de som er i gang allerede, tester fra syntetiske testmiljø. Etter hvert som vi vil åpne for flere konsumenter, vil kravet om syntetisk testmiljø inngå i avtalen før aktøren får tilgang til Folkeregisterets syntetiske testmiljø.

Best for test

Hvordan tester man en løsning man selv har laget for syntetisk data, uten å måtte sammenligne denne med reell data?

Prosjekt modernisering av Folkeregisteret vil ta i bruk maskinlæring for å genere modeller fra produksjon. Modellene blir så brukt i test for å lage testpersoner med representativ sammensetning og hendelser. Prosjektet har flere metoder for å teste løsningen:

Vi jobber med å sikre riktig rekkefølge på hendelsene i test, slik at hendelsene kommer i logisk rekkefølge. For eksempel kan ikke en person som er registrert død i folkeregisteret bli skilt eller endre adresse.

Vi tester at hendelsene er bygget opp riktig, dvs. de inneholder riktige informasjonselementer.

I tillegg samarbeider vi tett med en utvalgt gruppe brukere av Folkeregisteret, som har begynt testing mot det nye registeret, som gir oss verdifulle tilbakemeldinger.

Hvor tidlig i prosessen har «kunden» vært involvert i dette prosjektet?

Kunden, eller brukerne av Folkeregisteret, har vært involvert i styringsstrukturen helt fra forprosjektstadiet. Ideen om et syntetisk folkeregister oppstod allerede i starten av prosjektet, i forbindelse med utarbeidelse av teststrategien. Prosjektet har intervjuet de største interessentene for å få innspill til løsningen.

Det er i tillegg etablert et tverretatlig samarbeid, der etatene det siste året har fokusert på et langsiktig mål for tverretatlige testdata. Etatene ønsker å legge til rette for realistiske testdata, som representerer variasjon og særtilfeller fra produksjon. Målet er at de som har ansvar for en nasjonal felleskomponent tilrettelegger for bruk av syntetisk testdata slik at man får en verdikjede på tvers av de nasjonale felleskomponentene. Utforming av det syntetiske folkeregisteret er godt forankret i det tverretatlige samarbeidet.

Utfordringene

Hva er de største utfordringene for prosjektet?

De fleste etatene ser nå på syntetiske testdata som et godt og sikkert alternativ til test med skarpe data, men det er modningsprosess. Med økt samhandling mellom både etater og næringsliv ser vi at det er et økende fokus på sikkerhet og personvern. Personvernforordningen (GDPR) og Datatilsynet har bidratt til at dette har blitt et aktuelt tema for mange.

Har dere noen «drømme-caser» dere ser for dere som denne dataen kan brukes til?

Drømmescenariet er at testdataene blir brukt på tvers av etater og næringsliv og at fremtidige tverrsektorielle digitaliseringsprosjekter kan dra nytte av løsningen og erfaringene. Det å ha et felles testdatasett vil bidra til mer effektiv utvikling og test, og er en forutsetning for å lykkes samhandling på tvers.

