Datamatikk takk

KOMMENTAR: Datavolumene vokser, mer enn spådommene. Det er sosiale, tekniske og vitenskapelige data som virkelig utfordrer.

Publisert Sist oppdatert

Forskningsavdelingen til McKinsey har sagt det.

I løpet av dette tiåret trenger vi mer enn 150.000 fagfolk som verden til nå ikke har hatt.

Faget er en blanding av forretning, it og statistikk, på engelsk kalt Data Scientist eller datamatiker.

I USA skriker de allerede etter denne kompetansen. Så hvis det er noe område en it-fagperson bør kaste seg over så er det datamatikk. De med bakgrunn i matematikk, statistikk og BI har et fortrinn. De forstår og ser klart hvordan data i alle former nærmest eksploderer rundt oss.

Utdanningen innen Data Science har kommet kort. North Carolina State University har holdt på i to år. En rekke Master-studier i USA starter i år. I Norge har vi brokker av fagfeltet. Statistikkspråket R er ikke lenger eksotisk. Her bør universiteter og høyskoler vurdere en innsats, for vi må i løpet av dette tiåret lære å tøyle dataeksplosjonen rundt oss.

For vi må kunne finne frem til viktige data, for å ta bedre beslutninger. Det krever løpende analyse, ikke bare i ettertid, som de analyseverktøyene vi til daglig bruker. Å forstå trender er bra, men det gir lite etter at de er over.

I løpet av tusener av år har vi lært om tall og utviklet fagfeltet matematikk. I løpet av seksti år har vi lært om informasjonsteknologi og utviklet informatikk. Ordet er navngitt av Phillipe Dreyfus teknologidirektør i daværende Cap Gemini Sogeti.

Nå må vi virkelig lære om data. Det er ikke nok at vi har utviklet nye databaser, parallelle filsystemer, store lagringssystemer og virtualisering. Vi må forstå hvordan data påvirker samfunnet på en skjellsettende måte. Det moteriktige utrykket er Big Data. I øyeblikket er Store Data et opphauset uttrykk.

På enkelte områder har vi vært flinke i Norge. Vi har datamaskin, ikke computer. Vi har informatikk, ikke Computer Science. Med disse ordene understreker vi at det er data og informasjon som er viktig. Compute eller beregninger er et virkemiddel.

Innen teknisk og vitenskapelig analyse er beregninger helt vesentlig, derfor kaller vi det tungregning, ikke High Performance Computing. Moderne helsevitenskap er helt avhengig av tungregning. Moderne astrofysikk kan ikke få nok timer på de største tungregnemaskinene.

Interessen for Store Data er ikke stor i Norge. Men Statoil jobber med universiteter og konsulentselskaper for å lære hvordan data kan påvirke alt fra lagring, til tolkning, til endring av tidsintervaller. For Statoil er forståelse for data grunnlaget for bedre inntjening.

Også for andre virksomheter er dataforståelse grunnlaget for ekstra omsetning. General Custer som nå jobber i EMC, kaller forståelse og bruk av Store Data et paradigmeskifte og vår neste killer-app.

Men tiltroen til analyse av store data er foreløpig ikke stor i Norge. Vi sitter litt på gjerdet og venter, venter på noen som kan demonstrere verdien. Vente har et fortrinn. Vi får tid til å lære av hva andre har gjort. Vi får tid til å bygge opp kompetanse. For kunnskap er et vesentlig element.

En datamatiker må kunne snakke med forretningssiden om verdien av Store Data, for det nytter ikke å være så teknisk at ansatte mister interessen. En datamatiker må kunne snakke med it-fagfolkene om analyse basert på datareduksjon som Hadoop, og andre typer arkivsystemer.

Store Data vil enten gå inn i det generelle forretningsvokabularet, eller bli borte i løpet av noen år som SOA ble det. Tjenestearkitekturen SOA skulle kombinere applikasjonene til beste for virksomheten.

Forskjellen er at SOA er viktig på et teknisk nivå, Store Data understreker at noe må gjøres for å dra nytte av verdens samlemani. Klima er et område vi trenger å samle data, som ved analyse virkelig kan vise hva som skjer i naturen rundt oss.

For internasjonal virksomhet vil Store Data bli helt uvurderlig for å forstå det som skjer på de ulike markedene. Kultur og kjøpeevne er viktig å forstå. Det finnes foreløpig få store homogene markeder utover det amerikanske.

Forskning tilsier at virksomheter som tar beslutninger basert på Store Data er fire til seks prosent mer produktive enn de som tar beslutninger basert på erfaring og magefølelse. Alt for mange beslutninger kan karakteriseres ved HIPPO, Highest Paid Person`s Opinion.