Jeg fant, jeg fant!

Jeg fant, jeg fant!

KOMMENTAR: Big Data får mye oppmerksomhet. Få forstår hva Big Data kan bidra med, men håpet er å finne utviklingstrekk og viktige data som kan medføre raskere og bedre beslutninger.

Vi har samlet i takt med prisutviklingen. Kostnadene for å lagre en database har stupt, nærmest til null i løpet av de seneste 25 årene. I 1970 var et platelager eksotisk, for tre år siden var SSD basert på flash eksotisk.

Nå er det bare et spørsmål om hvor mye data vi vil samle og hvor raskt vi vi vil utnytte dem. Ifølge spåmenn vil vi i løpet av de neste to år lagre like mye som vi gjort opp til nå. Det er virkelig skremmende. Vi har glemt å være kritiske til hva vi lagrer.

Hver gang vi samler mer data blir kvaliteten på det vi har dårligere, med mindre vi raskt klarer å samkjøre nye data med eksisterende. Det er ikke lenger tilfredsstillende å masere data om hva som har skjedd. Det er et behov om å finne ut hva som skjer nå.

At det var strålende vær i går sier for lite om hvordan været vil bli i dag. Derfor er meteorologene de første virkelige brukere av Big Data eller Store data, hele tiden på jakt etter bedre regelverk for analyser, mer detaljerte data og større bearbeidingskapasitet.

Vi kaller det tungregning å lage et godt varsel. Nå kommer tungregningen til virksomheter med krav til bedre beslutningsgrunnlag basert på mye data.

I Norge er vi raske til å ta i bruk nye hjelpemidler, men konservative med hensyn til forandringer når noe er godt innarbeidet. BI, Business Intelligence, er godt innarbeidet. Det gjøres analyser på tilrettelagte data i datavarehuset, men oppsett, innsamling og bearbeiding av data settes det spørsmålstegn ved av spesialfirmaene på BI. Fornyelse er nødvendig.

I lys av Store data må alt som kalles BI vurderes på nytt. Det er lite interessant å vite hvorfor utviklingen ble som den ble, tre måneder etter. Det er det som skjer i øyeblikket virksomhetene må ta stilling til. Beslutninger basert på teft kan gi store feilutslag. Derfor er beslutninger basert på et godt datagrunnlag avgjørende. Det viser forskning.

Det er ikke rart at virksomhetenes BI er som den har vært. Prioriteringene til virksomhetene i 2013 er til forveksling lik prioriteringene fra 2003 ifølge analyseselskapet Gartner.

Noen ledere har forstått at Store data kan gjøre en forskjell. Kristin Skogen Lund i NHO fremhever at med Store data må man lære å sile og lære seg å stille de riktige spørsmålene. Kristin Idebøen i Sparebank1 understreker målet om gode kundeopplevelser med den konsekvens at man må jobbe systematisk for å forstå kundenes handlingsmønstre.

I de to utsagnene ligger essensen av store data. Vi må ta de store datamengdene spre dem over mange datamaskiner og sile ut det viktige ved hjelp av Hadoop og Map Reduce. Skal vi bedre kundeopplevelsene må vi analysere alt om kunden. Det betyr analyse på sosiale nettverk hvor viktige trekk plukkes opp.

Spørsmålet er i hvilken hastighet. Ideelt sett skjer det løpende, det vil si i sann tid, men det er kanskje ikke nødvendig. Beslutninger tas ikke løpende, men beslutningsgrunnlaget må bygges opp løpende slik at de seneste dataene er med i i grunnlaget.

Andre typer data må behandles der og da. Det er data som strømmer, gjerne fra sensorer eller videoer hvor hendelser kan ha stor betydning. Sile vil stå som et viktig stikkord. Ingen skal bruke tid på å se en video hvor det i mer enn nitti prosent av tiden ikke skjer noe.

I øyeblikket har vi enorme forventninger til hva Store data kan bidra med. De første forsøkene viser dessverre liten gevinst. En investert krone gir 55 øre tilbake. Drømmen var fire kroner. Grunnen er sammensatt. For uklare problemstillinger, for lite polerte verktøy og manglende kompetanse sørger for tap istedenfor gevinst.

Stor data som fenomen er raskt på vei ned i skuffelsens dal. Først når verktøyene er blitt bedre og enklere å bruke og virksomhetene har tilgang til kvalifiserte fagfolk som kan klargjøre problemene og utføre nødvendige analyser, vil Store data få innflytelse på forretningsvirksomheten.

For Store data er ikke neste generasjons BI. Store data handler utelukkende om analyse. Da er analyse i minnet vesentlig. På samme måte som virksomheten har kontrollere for å bedre bunnlinjen, trengs datamatikere for å bedre topplinjen. R bør ikke være ukjent.

Ahlerts Hjørne