Se arkivet over internetts historie

Se arkivet over internetts historie

En ny gigantdatabase lagrer 85 milliarder websider helt tilbake til 1997.

Organisasjonen Internet Archive lanserer en ny gigantisk database for å lagre gamle websider, med en kapasitet på to petabyte. Tjenesten vil gjøre det mulig å finne tilbake til alle slags websider fra 1996.

For fem år siden, da tjenesten startet, huset den 30 millioner websider, nå er tallet 85 milliarder.

Målet med arkivet er å ha en samling av gamle forsider til nettsteder, akkurat om man kan lagre forsider til papiraviser eller magasiner. Siden websider endrer seg kontinuerlig, vil en vanlig bruker ikke kunne hente tilbake forsiden til gårsdagens VG, Aftenposten eller Computerworld. Det er nettopp det tjenesten Wayback Machine kan gjøre. Her kan man se en webside akkurat hvordan den så ut for to, seks eller ti år siden.

Irak-krigen

Fra vår amerikanske søsterblad Computerworld ligger den første utgaven fra 26. mai 1997. De første årene ligger bare noen få sider lagret, men fra 2001 har Wayback Machine 66 forsider i arkivet, fra 2004 278 sider og året etterpå hele 625 forsider.

Og hva med for eksempel CNN? Hvis du ønsker å lese tilbake hvordan de skrev om Bush og Irak-krigen, kan man bla tilbake til 21. mars, dagen etter offensiven mot Saddam Hussein startet. Eller man kan gjenoppleve 11. september, eller andre dramtiske hendelser, fortrinnsvis fra USA.

Tjenesten inneholder også norske nettsteder, som VG, Dagbladet og Aftenposten. Også norske IDG og Computerworld er med, med sider helt tilbake til 1996.

Alt-i-ett datasenter

For å vedlikeholde utviklingstakten regner organisasjonen med å øke lagringsmengden med 100 TB per måned.

Internettarkivet er speilet til Bibliotheca Alexandrina, det nye biblioteket i Egypt, som et sikkerhetstiltak for systemgjenoppretting i tilfelle noe går galt.

Ifølge Computerworlds nyhetstjeneste er arkivets infrastruktur på vei fra et tradisjonelt datasenter med mange standard Linux-servere til et senter med Solaris 10 med ZFS på Sun Fire x4500s servere i et Sun Modular Datacenter.

Internet Archive er en ikke-kommersiell organisasjon som har kontor i Presidio i San Francisco. Datasentrene ligger i Redwood City og Mountain View. Arkivet lagrer ikke bare kopier av websider, men også bilder, videoer, programvare, bøker og lydklipp.

Se mer på Wayback Machine.

Sosiale Medier