Danske biologer vil ha Linux

Det danske senteret for biologisk sekvensanalyse har gått til anskaffelse av en SGI Altix 3000, den første standard tungregnemaskinen med Linux på Itanium 2.
Altix 3000 skal bearbeide biologiske modeller i forbindelse med det menneskelige Genome, det vil si den totale arvemassen. Arbeidet vil bestå i å finne frem til hvilke gener som har høy korrelering til kjente helseproblemer.

-- "Human Genome Project" har skaffet oss så mye data som vi trenger å bearbeide for å finne frem til spesifikke gener. Vi trenger å analysere enorme mengder rådata. I den forbindelse må vi ha et virkelig stort felles minne, sier Søren Brunak, professor og grunnlegger av det danske senteret for biologisk sekvensanalyse.

Minne som ressurs

For å avhjelpe de danske forskerne leveres Altix 3000 med 196 GB minne og 10 TB med lagringskapasitet.

-- Altix har 8Single System Image8 med 64 prosessorer, fremhever Morten Bjørnsvik, systemingeniør i SGI.

"Single System Image" er evnen til å bruke alle prosessorene på samme oppgave. Med 64 prosessorer er Altix en av verdens kraftigste maskiner med Linux. Det krever to skap. Ifølge SGI er kostnaden for en Altix 3000 med 64 prosessor en tredjedel av IBM P690 og halvparten av HP Superdome.

Det er Altix evne til å se hele minnet som en ressurs som har fått danskene til å velge denne nye datamaskinen.

Også i Oslo

Som bearbeidingskapasitet benyttes 64 Itanium 2 prosessorer. Sannsynligvis leveres tredje generasjon (Madison) som ble lansert 30. juni. Også Universitet i Oslo vil benytte denne prosessoren i sin HP Superdome som oppgraderes til 64 prosessorer i august/september.

Utslagsgivende for valget av Altix 3000 var sannsynligvis at SGIs Unix-maskiner allerede ble benyttet. Det danske senteret for biologisk sekvensanalyse har både en SGI Origin 300 og en SGI Origin 2000. Disse maskinene benytter Irix som er SGIs Unix for sin tungregnemaskin Origin.

-- Vi hadde planer om Irix på Itanium, men i 1999 ble det bestemt at vi skulle benytte Linux, sier Morten Bjørnsvik, systemingeniør i SGI.

Svensk database

Som database vil danskene benytte MYSQL som utvikles av det svenske databasefirmaet med samme navn. De har fått teknologi fra SAP for å forbedre databasen for store volumer. Teknologien fra SAP har sitt opphav fra Nixdorf og Software AG som SAP overtok.

-- MYSQL optimalisert for 64 bit Linux på Itanium 2, kan håndtere nærmest uante mengder med data. Vi er stolte over å være partner til SGI for å løse det danske senteret for biologisk sekvensanalyses databasebehov, understreker Bertrand Matthelie, direktør for allianser i MYSQL.

Målet for Altix er tusenvis av prosessorer som kan bearbeide en oppgave. I første omgang er antallet færre, for det handler om Linux sin evne til å jobbe med mange prosessorer på en oppgave.

De aller fleste maskiner er ikke effektive med mer enn 16 prosessorer. Grunnen er behovet for effektiv minneadministrasjon og samarbeid mellom alle prosessorene.

Det er modifisering av Linux-kjernen og SGI Propack, programvare som forbedrer vekstmulighet, datahåndtering og ressurshåndtering, som til sammen gjør håndtering av 64 prosessorer. Propack er basert på årelang erfaring med vekstbehov på Origin 2000 og 3000. Programvaren utnytter biblioteker for tungregning.

Forskning

-- Altix egner seg for forskning, utvikling, tekniske beregninger og "High End Media", fortsetter Morten Bjørnsvik.

Altix bruker Numaflex, samme arkitektur som Origin 3000. Oppbyggingen er modulær med moduler for prosessoring, kommunikasjon, inn/ut og lagring.

Fire prosessorer med to styringsenheter og 32 GB minne utgjør en prosesseringsmodul. Videre benyttes moduler for kommunikasjon mellom de inntil 16 prosesseringsmodulene, to typer inn/ut-moduler og eventuelt lagringsmoduler.

Altix 3000 kan godt leveres i mindre utgaver enn det maksimale. Altix 3300 kommer med fire, åtte eller tolv Itanium 2 prosessorer, hver med en klokkefrekvens på 900 MHz i en høykommode. Altix 3700 leveres med 16 ) 64.

Trengs store systemer kobles 64 og 64 sammen via Numalink.

-- Numalink er billig og raskt med 3,2 GB per sekund hver vei mellom nodene. Med 50 nanosekunders latens er det inntil 200 ganger raskere enn vanlige svitsjer, hevder Morten Bjørnsvik.

En node er i dette tilfelle et system med 64 prosessorer. For adressering av minne tilknyttet en annen prosessor i et 128 prosessor system kreves det fire omkoblinger via styringsenhetene ifølge SGI.

Målet er 2.064 prosessorer med 16 TB med minne.