Hadoop er produksjonsklar

Hadoop er produksjonsklar

Analyseplattformen Apache Hadoop har kommet i versjon 1.0 etter sju års utvikling.

Opp mot sju år med utvikling og finspikking har det tatt, og nå er Apache Hadoop-rammeverket omsider sluppet i versjon 1.0, klart til bruk i produksjon.

- Brukere kan stole mye mer på at denne versjonen vil bli støttet av åpen kildekode-miljøet. Det vil ikke lenger være forvirrende hvilken versjon av Hadoop som har hvilke funksjoner, sier Arun Murthy, administrerende direktør for Hadoop Apache.

Det er tre funksjoner som særlig gjør at pakken fortjener 1.0-stempelet, mener han. Den største er det gjennomgående sikkerhetsfokuset. Hadoop kan sikres gjennom et helt nettverk via Kerberos-autentiseringsprotokollen.

Big Data

Det andre er muligheten for å bruke webhdfs’ Rest Api, som kan gjøre Hadoop enklere å implementere i bedriften via web-teknologier. Sist men ikke minst er 1.0 første utgaven som fullt ut kan kjøre Hbase, som gir administratoren en mer bekjent relasjonsdatabasestruktur på datalagringen.

Hadoop brukes for å lagre og analysere store datasett, populært kalt Big Data for tiden. Den opprinnelige tanken var at den skulle hjelpe store søketjenester, men Hadoop har funnet sin vei inn i bedriften også, ifølge Murthy.

Systemet er kjekt for dem som har datasett som er for store for vanlige relasjonsdatabaser eller i tilfeller der bedrifter samler inn masse data som de ikke helt vet hvilken analyse de skal kjøre på.

Mange storbrukere

Blant brukerne finner man søketjenesten Yahoo, Jpmorgan Chase som bruker den til å avdekke svindelorsøk og håndtere risiko, Ebay bruker den for å bygge ny auksjonssøketjeneste og Facebook er også på brukerlisten.

Det er også verdt å nevne at IBM har pakket Hadoop inn i Infosphere Biginsights-dataanalysepakken og at Microsoft har en kopi av Hadoop kjørende i Windows Azure-skytjenesten, skriver Computerworlds nyhetstjenete.