Fremtidens lagring?

Fremtidens lagring?

Med god skalerbarhet, selvhjelpende mekanismer og lavere utgifter er CAS en svært spennende lagringsteknologi - selv om den er totalt uegnet for databaser.

CAS-teknologien ble introdusert i stor stil i 2002 da EMC lanserte sin Centera-løsning. Dette var imidlertid et resultat av EMCs oppkjøp av FilePool året før, så selve teknologien ble unnfanget i sin første generasjon i 1999.

- Den største utfordringen innen lagring er nå å få folk til å tenke nytt. Hierarkiske filsystem later til å ha grodd fast når man tenker på lagring, sier Paul Carpentier - mannen bak CAS-teknologien, til Nettverk & Kommunikasjon. Carpentier solgte altså FilePool til EMC i 2001, og startet i 2005 selskapet Caringo som tar CAS-begrepet et par steg videre.

Dette er CAS

Når et objekt lagres i CAS, får dette objektet en unik id som det har i resten av sin levetid. Denne typen adresse kalles for en «content address» og eliminerer behovet for et sentralt register. Grovt sett kan CAS sammenlignes ved å levere fra seg jakken på et restaurantbesøk. Man leverer inn jakken og får tilbake en billett. Etter besøket leveres billetten og man får tilbake riktig jakke. Som gjest bryr man seg lite om hva som står på billetten eller hvor jakken egentlig oppbevares under besøket.

En CAS-billett opprettes ved å knytte et unikt fingeravtrykk eller merke på informasjonen som skal lagres. Denne billetten endres aldri - heller ikke om dataene flyttes. En stor fordel med CAS er at teknologien reduserer lagringsplassen og forhindrer hva enkelte vil kalle en data-tsunami (overveldende oppbygning av informasjon hvor mye er foreldet, overflødig eller unødvendig). Ved hjelp av en peer-to-peer (p2p) teknologi, eliminerer Caringo muligheten for at data kan overskrives eller flyttes slik at man ikke finner dem igjen.

Smart og effektivt

Caringo har rullet ut versjon 2.0 av sin CAStor-programvare. Denne versjonen gir forbedringer når det gjelder skalerbarhet og ytelse, men også replikeringsmuligheter over LAN og WAN.

Med CAStor kan man benytte seg av ordinære x86-baserte maskiner. Disse kan startes via netboot, CD eller en USB-nøkkel. Operativsystemet som kjøres er Linux-basert og filsystemet som benyttes er Caringos ZFS (Zero File System). CAStor oppretter et flatt adresseområde på ett lag uten fil- eller kataloghierarkier. Teknologien som brukes for å finne frem til dataene er basert på et subsett av standard HTTP.

Det er mulig å mikse x86-baserte maskiner fra ulike leverandører, og de ulike lagringsnodene har alle samme rolle. De nodene med mest RAM får automatisk de minste filene. Konseptet går ut på at de nodene som egner seg best for å ta imot en fil på for eksempel 5 MB skriker ut ved en forespørsel. Slik justerer systemet seg selv, og kan nærmest betraktes som en levende organisme. Filene i systemet kan også flytte seg etter at de er lagret, hvis det er mest hensiktsmessig å heller ligge på en annen node i lagringsklyngen. Justering, selvreparasjon, balansering og sjekking av dataene foregår kontinuerlig.

Løsningen støtter foreløpig ikke hotswap, men gjenoppretting av en node skal ifølge Carpentier gå svært raskt og smertefritt. - Hvis man for eksempel har 100 noder og en går ned, vil de gjenværende 99 nodene gjenoppbygge den noden som byttes ut. Alle nodene har litt informasjon om de andre, og således blir dette et utvidet RAID-konsept, forteller Carpentier.

En såkalt health-prosess sjekker kontinuerlig at det finnes en replika av hver fil i klyngen. Hvis denne replikaen mangler, vil systemet sjekke status for den aktuelle disken. Får den signaler om at disken er ødelagt, kan en gjenoppretting starte umiddelbart. Det er ellers mulig for administrator å sette forsinkelser slik at det er tid til diskbytte før en slik gjenoppretting starter. Man kan også definere hvor mange replikaer man skal operere med.

Ønsker man å trekke en node ut av klyngeløsningen, kan man gjøre dette ved en SNMP-kommando. Da vil den pensjonerende noden sørge for at filene er trygt forvart på de resterende nodene. Ønsker man CIFS- og NFS-tjenester, må man i tillegg til nodene bruke selskapets File System Gateway. Dette er et databasedrevet tynt kartleggingslag som gir direkte tilgang til CAStor for applikasjoner som har grensesnitt til CIFS eller NFS. Administrator får et webbasert grensesnitt, og systemet har ingen øvre grense på filene når det gjelder antall og størrelse.

CAS kan gi bedriften primærlagring til svært lave kostnader. Mens kanskje 10 prosent av databasedataene bør kjøres i et eget SAN, kan resten håndteres i vår løsning, avslutter Carpentier. Mer informasjon finnes på www.caringo.com og www.proact.no.