EGEN UTVIKLING: Produktsjef Line Meland viser Eternus som er Fujitsus lagringssystem basert på egen utvikling. Den kommer i tre versjoner, en generell for ekstern tilkobling basert på blokk og fil, en for sikkerhetskopiering og en for store arkiver med programvarestyrt lagring basert på Red Hats programvare med Linux, Open Stack og filsystemet Ceph.

Kostnadstilpasser med åpen kildekode

Ti ganger mer data på samme gulvflate er hva Fujitsu lover med sin andre generasjon programvaredefinerte lagring. Også kostnadene reduseres betydelig for et datasenter.

Publisert Sist oppdatert

Fujitsu tilbyr fire forskjellige lagringssystemer, tre egne og Netapps FAS for de som ønsker et alternativ. Alle Fujitsus egne lagringssystemer betegnes Eternus. Det er Eternus DX, CS og CD10000.

-- Den nye CD10000 har betydelig redusert kostnad i forbindelse med vekst, sier Line Meland, produktsjef for lagring i Fujitsu.

Det første Eternus DX, er for håndtering av data i form av blokk og fil fra modell 60 til 8900 med en kapasitet på mange Petabyte. Flere av de mellomstore er i bruk i Norge.

For sikring av data tilbys Eternus CS med modellene 800 og 8000. Disse systemene sørger for sikkerhetskopier av data samtidig som unødvendige kopier fjernes ved deduplisering. I tillegg foretas det komprimering.

Andre generasjon

Eternus CD10000 S2 er andre utgave av Fujitsus programvaredefinerte lagringssystem. Første versjon ble lansert for litt under ett år siden. Den vesentligste forbedringen sett fra et kundesynspunkt er redusert kostnadsnivå.

Kostnadsreduksjon på det interne nettverket i lagringskabinettene er en av grunnene til at CD10000 har blitt rimeligere. Tidligere brukte Fujitsu Infiniband for sammenkobling. Nå benyttes Ethernet.

Skal man tro Fujitsu er det ikke behov for Infiniband på det nåværende tidspunktet. Men Fujitsu har tro på Infiniband.

-- Kundene kan få Infiniband for sammenkobling på Eternus DX, forklarer Line Meland.

Det er to viktige ingredienser, programvare fra miljøet fra åpen kildekode og store platelagre på 6 TB.

CD10000 S2 er først og fremst et enormt programvaredefinert arkiv med en kapasitet på 224 lagringsmoduler. Hver modul kan bestå av en, to eller tre hyller. Til sammen gir dette mulighet for 42 PB rå kapasitet.

Ingen kommer til å anskaffe maksimal kapasitet, men behovene for arkivering øker for hver dag. Det skapes enorme datamengder daglig. Spørsmålet er om mye er støy eller om det meste må tas vare på. Skal det tas vare på er Eternus CD10000 S2 et godt alternativ.

Underlig

Det underlige er at det ikke er mange flere systemer som Eternus CD10000 S2. Målet er å bygge ut et enormt arkiv basert på et beskjedent startgrunnlag med en arkitektur som lar arkivet vokse til et nivå som er minst fem ganger hva man ser for seg. 50 PB er et slikt nivå. 10 PB i dag kan være for kostbart.

10 PB i løpet av tre år kan være en fornuftig tilnærming. Det er bedre og rimeligere lagringsmoduler som bidrar. Forskjellige generasjoner lagringsmoduler kan jobbe sammen. Ideen er skrittvis, kontinuerlig oppgradering, ikke fem års bruk og så fullstendig utskifting.

Datasentre har behov for å arkivere enorme datamengder for sine kunder, spesielt hvis de ser for analyser, typisk ved hjelp av Hadoop.

Andre oppgaver er arkivering av video, for kunder med behov for video på forespørsel, arkivering av tidsskrifter og dokumenter, eksempelvis alt innen helse. Sensitive helsedata som skal analyseres er et typisk eksempel.

I Norge ser Fujitsu for seg at mediekonsernene er mulige kunder. NRK er orientert om teknologimulighetene.

Også private skyer trenger et lagringssystem som først og fremst er et analysearkiv. Datavarehus, Data Lake er typiske bruksområder.

Redusere kostnader

Da CD10000 ble lansert så Fujitsu for seg at arkivet ville bruke enorm mengde lagringsmoduler basert på Flash, men i den nyeste versjonen er Flash først og fremst et virkemiddel for økt hastighet ved å bruke flash som buffer, ikke for meget rask tilgang til data.

Det er behovet for å redusere kostnadene for kundene som har vært styrende for versjon S2. Lagringsmodulene er derfor redesignet.

Første kunde var Darmstädter Rechenzentrum (Darmstadt Data Center, DARZ) som bygget sitt datasenter for de mest restriktive krav slik at Darz kunne være et grunnlag for Deutsche Börse Cloud Exchange. Det er de meget strenge kravene til sikring av data CD10000 skal bidra til.

Derfor anbefaler Fujitsu alternative tilnærminger til sikring av dataene. To lagringssystemer side om side med synkronisert lagring er første tilnærming. Doble lagringssystemer geografisk adskilt er ytterligere sikring når dataene er kritiske.

-- Programvaredefinert lagring gir mange nye mulige scenarioer, fremholder Line Meland.

Derfor benyttes åpen kildekode. Det er Red Hats programvare basert på Red Hats Linux og Open Stack som i praksis brukes for styring av CD10000 med Ceph filsystem for å kunne favne det enorme potensielle lagringsbehovet.

Modulær utbygging

For at kundene skal få en modulær utbygging tilbys fire alternative lagringsmoduler. Forskjellen er hvor mye lagring de styrer. Hver modul eller node som Fujitsu kaller det består av en datamaskin RX2540 som har en kapasitet på 44 TB.

Alternativene er med en tilkoblet lagringshylle på 48 TB, to lagringshyller hver på 48 TB eller tre hyller.

Grunnmodellen av Eternus CD10000 S2 består av fire lagringsmoduler, hver med 44 TB og en administrasjonsmodul med filsystemet Ceph plassert i et 42 tommers kabinett. Prisen er på rundt 1,6 millioner kroner. Fullt utbygget vil et CD10000 S2 komme på rundt 75 millioner kroner. Dette er ikke rimelig, men en slik kapasitet ville ha kostet mange hundre millioner kroner for få år siden.