It avgjørende for Higgs-jegere

It avgjørende for Higgs-jegere

Jakten på mysteriene rundt «big bang» står og faller på ville mengder 0-ere og 1-ere. Dette er Big Data i ekstremsport-format.

GENEVE/SAINT-GENIS-POUILLY/OSLO: Det sies at Cerns første tungregningsmaskin var nederlenderen Wim Klein. Den underholdende matteartisten fikk jobbtilbud etter at han ved en misforståelse besøkte Cern som et ledd av sin matteturné i 1958.

- Datamaskiner var ikke veldig utviklet, og fysikere programmerte dem ikke på det tidspunktet. Fra ’58 til 65’ var det bra for meg. Så gikk det nedover, fordi yngre fysikere drev med sin egen programmering, og de ikke trengte meg så mye som før, har Klein uttalt i boka «The Great Mental Calculators».

Likevel forble Klein ved Cern flere år til, og fikk en verdensrekord fra Guinness da han i 1976 fant fra til 73-roten av et 500 talls nummer på to minutter og 43 sekunder. Mot slutten av samme år sa han opp, før han ble funnet knivstukket i Amsterdam 1986, et mord som aldri ble oppklart.

Da hadde datamaskiner for lengst gjort sitt store inntog ved forskningskonsortiet som stiller de store spørsmålene, som medfører de store mattestykkene. Den første, en Ferranti Mercury, ble bestilt i 1956 og var på plass i ‘58. Deretter vokste Cern fra dem en etter en, inkludert det kjente gjennombruddet for vår egen Rolf Skår og Cern-kontrakten med Norsk Data anno 1972.

Det siste som er kjent når det gjelder Cern og norske datamaskiner, er at fysikkgiganten valgte Ungarn som datasenternasjon i stedet for Norge. Det skjedde etter at Cern fant ut at de har vokst ut av datasenterkapasitet på egen eiendom.

Enorme datamengder

På innsiden av datasenteret ved Genève, er det riktignok flere rack som er langt fra fulle. Det store problemet er strøm. Utenfor er det allerede bunkret opp med tilsynelatende tilfeldig plasserte strømskap, og kapasiteten er sprengt nå som den er på 3,5 megawatt. Derfor sendes nå dataene via to 100-gigabits linjer til et datasenter Ungarn, som gir 2,5 megawatt ekstra.

Årsaken til at forskningen på kjernekraft – slik Cern bedriver – krever så mye, er blant annet de enorme mengdene data som skal kvernes i ulike algoritmer og analyser og lagres.

Blant annet letes det etter Higgs, en overraskende og massiv krabat det ble formulert en teori om første gang i 1964. Teorien ble ført i pennen av Peter Higgs, selv om flere kan tilskrives æren for å finne det som også tidvis kalles gudepartikkelen (opprinnelig på grunn av en bok som het «God Damn Particle», der ukvemsordet ble sensurert i USA).

Vitenskapelig forskningstalsmann ved Cern, Jens Vigen, fleiper med at Asbjørnsen og Moe var inne på noe påfallende Higgs-teoriaktig da eventyret «Askeladden og de gode hjelperne» ble nedskrevet rundt 1850. Han som tilsynelatende er lik Askeladden selv, men som må tynges ned med syv skippundslodder for å ikke sveve av gårde, og som har som partytriks å fare til verdens ende på fem minutter, har mangfoldige likheter med oppførselen til Higgs-bosonet.

Det er snakk om en ny type partikler som beveger seg gjennom vakuum. Det store problemet med å oppdage Higgs, er hastigheten. Higgs-bosonet skal ha oppstått i et ørlite tidspunkt rett etter «big bang», og dette er blant øyeblikkene forskerne prøver å gjenskape ved å skyte atomkjerner på kollisjonskurs gjennom vakuumrør på flere kilometer.

Protonene svever rundt en 27 km lang bane 11.000 ganger per sekund i åttetimersskift 24 timer i døgnet, og skal kollidere på nøye planlagte steder fylt av lag på lag med sensorer. Ved en riktig gjennomført kollisjon, kan man se sporene av Higgs, selv om man altså ikke får sett Higgs «himself».

- Higgs henfaller til andre partikler. Det er som når du står på ski, og ser spor etter en hare, da vet du at en hare har gått over skisporet, sier Vigen.

Kjapp rakker

Higgs-bosonet i seg selv er for kjapt til å bli oppdaget med dagens teknologi, men kollisjonene skaper vrakrester i form av nye konfigurasjoner av protoner. Forskerne bruker datamaskiner for å finne avvik fra hva de forventer å finne. Fysikkprofessor ved Universitetet i Oslo, Alexander Read, fra Atlas-prosjektet til LHC forteller at jakten på Higgs ofte sees på som å finne en nål i en høystakk.

- Egentlig er det derimot som å finne et høystrå i en høystakk. Heldigvis er det snakk om å finne en liten opphøyning av høystrå et bestemt sted i en høystakk, sier fysikeren, som i likhet med sine likemenn gjerne omtaler seg selv som Higgs-jeger.

Høystråene i høystakken fant Higgs-jegere første gang 4. juli i 2012, en oppdagelse som fikk selv den mest beinharde fysikernerd til å ta til tårene – og som ga Nobels fysikkpris til Peter Higgs og Fracois Englert i år.(En småkomisk digresjon er at det viste seg nesten like vanskelig å finne personen Peter Higgs som selve Higgs-bosonet i forbindelse med utdeling av prisen.)

- Oppdagelsen av Higgs-bosonet er det største vitenskapelige gjennombrudd på 50 år, noen sier 100. Det er det nærmeste man kommer Beatlemania eller Bieber innen vitenskap, forteller Read.

Det var ikke gitt at man skulle finne Higgs-bosonet, mange blant selv den fysikk-intellektuelle eliten hadde liten tro – det sies for eksempel at Stephen Hawking tapte 100 dollar på et veddemål. Mange mente man måtte beskytte fysikken mot urealistisk matte.

- Utfordringen er at vi leter etter cirka 10.000 Higgs-bosoner i en million-milliard proton-proton-kollisjoner, påpeker Read.

Detektorer avgjørende

Det er der datamaskinene kommer inn. Kollisjonene fanges av sensorer og avanserte kameraer. Atlas-detektoren har for eksempel et 3D-kamera på bortimot 90 millioner megapiksler og får bortimot en milliard proton-proton-kollisjoner per sekund ved å kjøre togsett bestående av hundre milliarder protoner mot hverandre i en hastighet du ikke engang kan forestille deg.

Kollisjonene kan gi 60 millioner megabytes i sekundet, som gjør at en ninjakjapp filtreringsprosess må til umiddelbart. Først filtreres «støy» bort 2 mikrosekunder etter kollisjonen, og her forsvinner mye. Så går det til nivå to, som gjør en nærmere analyse av dataene og plukker ut funn som karakteriseres som interessante. Til slutt blir det gjort en detaljanalyse, og data fra rundt 200 kollisjoner (hendelser, som de proffe kaller det) per sekund blir igjen. Dette sendes til selve datasenteret for offline analyse.

- For å vite hva vi skal lete etter i jakten på sjeldenheter som Higgs, er det helt avgjørende å forstå hva som skjer i detektoren, sier Farid Ould-Saada, UiO-professor og leder for den norske Cern-forskningen i høyenergi partikkelfysikk.

Årlig blir det rundt 3200 terabyte i Atlas, og dette er bare én av flere slike maskiner.

For du har jo eksempelvis også 10.000 tonns tunge Alice, som har spesialisert seg på jakten etter en godbit kalt kvark-gluon-plasma. All materie er nemlig bygget opp av såkalte kvarker og gluoner, og noe som kalles kvark-gluon-plasma tilsvarer universets tilstand en milliondels sekund etter «big bang».

Når det skjer kollisjoner i Alice er det i sentrum av kollisjonen temperatur en milliard ganger solas temperatur, og de såkalte kvarkene får en bitte liten stund en anti-kvark. Det er en lang historie, og likevel er konklusjonen så langt at man egentlig vet minimalt. Man vet lite om kvarker, og heller ikke standardmodellen kan bidra til fullstendig oppklaring.

Lag på lag

Da er det bra man har datamaskiner for å kverne data, så kanskje man kan finne ut mer. Det gjør forskerne i noe de kaller «gridden».

- Selv om Norge også bidrar til drift av detektorene, er det vi først og fremst gjør å studere data. Da trenger vi masse datakverning, og det får vi via «Grid Computing», sier professor ved Universitetet i Bergen, Dieter Röhrisch, fra Alice-prosjektet.

I «Gridden», som den gjerne kalles blant lokale nordmenn, er det nevnte datasenteret i Genève og dets alter ego i Ungarn helt sentralt, men det finnes også flere nivåer et hakk utenfor selve kjernen. Over 140 datasentre avlaster dataduoen Genève & Budapest.

- Her har vi cirka 10.000 servere med 90.000 prosessorkjerner og cirka 100 petabyte lagring, sier seksjonsleder i Cerns it-avdeling, Nils Høimyr, mens han spankulerer rundt i datahallen i Genève.

Hallen er produsert i 1970 og byr også på historiske kuriositeter som utstilling av lagringskassetten IBM 3590-J, en 20 Gigabytes sak som ble brukt fra ’95 til ’06. Men om du tror kassetten har utspilt sin rolle som aktiv spillebrikke i datasenteret, er svaret blankt nei. Blant annet er et større IBM TS1140-kassettsystem med innebygget robot og 46 avspiller i aktiv sving, og rett borti samme gata finner man noe svære tilsvarende Storagetek-systemer fra Oracle.

- Filer ligger på disk og bånd. Det som har vært analysert og ikke hentes frem så ofte lagres på bånd, sier Høimyr.

- Kassetter er fortsatt noe av det mest verdifulle. Det er ikke så mye feil med arkivene, legger sjef for forskning og vitenskapelig it, Sergio Bertolucci til.

Det er rundt 1800 harddisker som går dunken årlig, av totalt rundt 7000 årlige maskinvareendringer.

Tilbake til «gridden», beskriver Høimyr dette som et hierarkisk system der CERN og Ungarn utgjør Tier 0. Et skall utenpå dette, som inkluderer Nordic Data Grid Facility og 10 andre, utgjør Tier 1, og et skall utenpå dette igjen, blant annet inkludert USIT ved Universitetet i Oslo og rundt 130 andre lokasjoner, utgjør Tier 2.

- De 10.000 serverne her i Genève er bare 15 prosent av nok for å dekke kapasiteten. Da bruker vi det vi kaller Grid for å forene kreftene. På samme måte som web gir tilgang til informasjon, gir Grid tilgang til regnekapasitet, sier Høimyr.

30 peta i 2012

Grid er ikke en klynge, det er snarere en måte å koble flere datasenter sammen på. Data som kommer inn fra detektorene kopieres også ut til et av de andre sentrene for redundans.

- I 2010 var Grid et godt kjent moteord. Nå er det mer nettsky man snakker om.

Selv nå som alle de vitenskapelige maskinene er slått av for vedlikehold og oppgradering, produseres det for tiden data i dette nettverket av datasentre.

- Det er ikke så mye data som skrives nå som vi er i «shutdown», men det er fortsatt masse data som leses, sier Høimyr.

Faktisk er det rundt 250.000 jobber som kjører på nettverket med LHC avslått, ifølge Bertolucci.

Det hele fungerer slik at man kan bruke sine innloggingsdetaljer til å registrere en jobb, gjerne et tallknuserprogram skrevet i C++. Jobben legges inn i det CERN kaller middleware, mellomvare, en type programvare som organiserer og styrer dataressurser i gridden.

Du kan ikke registrere ubegrenset med jobber, da blir du svartelistet. Ifølge en fysiker vi slår av en prat med, er det derfor slettes ikke uvanlig å låne kontoen til sine kolleger for å få kjørt inn en ekstra programvariant.

Årlig blir resultatet fra de ulike kalkuleringene rundt 25 petabyte samlet, for 2012 var tallet 30. Primært er det CPU-er som brukes, datasenteret i Genève har kun et par GPU-rack til testing.

- Datanalysen fra LHC og det meste av fysikkprogramvaren er heltallbasert, og da passer det bedre med CPU. Derimot finnes det simuleringsprogram for akseleratorfysikk som er vektorbasert, disse kan kjøres på GPU, forklarer Høimyr.

Norge har, i tillegg til Grid-modellen, vært godt involvert i utviklingen av en del av programvaren som brukes. Det går i åpen kildekode. Linux, Openstack og hjemmebakte saker som CernVM og Root for analyse.

- Vi har åpen programvare og har også begynt med åpen maskinvare, ifølge sjef for kunnskapsoverføring, Vetle Nilsen.

Jakten på mørk materie

Og slik går det til at Read kan jakte på Higgs, Röhrisch på kvark-gluon-plasma og UiO-professor i teoretisk fysikk Are Raklev jakter mørk materie. Ja, vi har kanskje ikke snakk om mørk materie ennå? Her kommer et krasjkurs.

Det man så langt vet, er at man kun kjenner til toppen av isberget. Vi er laget av vanlige atomer, men det er en liten del av kaka. 80 prosent av stoffet i universet har vi rett og slett valgt å kalle mørk materie, av mangel på bedre kunnskap. Men hvordan vet vi så at vi har mørk materie?

- Grunnen til at vi i det hele tatt ved dette, er at vi ser på hvordan det påvirker universet gjennom gravitasjon. Hvordan galakser roterer og hvordan de påvirker hverandre. Vi har ganske god peiling på hvor mye av stoffet finnes, men aner ikke hva et er, sier Raklev.

- Eksotisk? Tja. Et kjapt overslag gir oss det interessante faktum at det hvert eneste sekund går en milliard mørk materie gjennom kroppen i en hastighet på 3–400 km i timen. Men de har svak vekselvirkning, som betyr at de strømmer gjennom deg uten at du tar skade.

Det er neimen ikke lett å bygge en maskin for å fange opp disse greiene heller, ifølge Raklev.

- Problemet er at hvor enn fancy disse detektorene er så strømmer materien rett gjennom. Mørk materie er nøyaktig like usynlig i underjordiske labber i millionkronersklassen som på overflaten.

Man håper derimot å kunne produsere mørk materie ved å kollidere to protoner, forteller professoren. De har funnet en smart måte for å kunne oppdage det de ikke vet hvordan ser ut.

- Vi ser på kollisjonen av ting som skjer i en av detektorene, så ser vi på ting vi kjenner til i standardmodellen. Hvis vi tar summen av alt vi ser og det ikke går, ikke lar seg balansere, da vet vi at vi mangler noe som har forsvunnet.

Verdens undergang

Raklev leter også etter tegn på supersymmetri, at alle partikler har en motpartikkel. En lang historie. Uansett, av fiffige ting han har funnet ut så langt, er blant annet potensialet for verdens undergang. Ettersom dette ville fått konsekvenser for alle verdens datamaskiner og internett som vi kjenner det, må vi nevnte dette – til tross for at vi heter Computerworld og ikke Supersymmetriworld.

- En av de rare egenskapene vi har funnet med Higgs, er at om målingene vi har nå stemmer, forutsetter det et ustabilt univers, sier Raklev.

Universet sitter ifølge teorien på en liten fjellhylle. Den ligger forholdsvis stabilt, men et lite energispark ville sendt den over humpen som ville fått verden til å rulle ned fra stupet.

- Om vi hadde ramlet ned, ville vi fått et annet univers enn det vi har nå. Dette er et mysterium. Men at verden ikke har gått under de forrige 14 hundre milliarder år tyder på at det neppe skjer de neste 14 heller. Det er altså en liten sannsynlighet.

Raklev leter også etter ekstra dimensjoner. Han tror det kanskje finnes en dimensjon som er så liten at vi ikke ser den.

Vil ha rett tunnel

Mange spørsmål er altså fortsatt ubesvart om verden og universet.

- Med vår intellektuelle arroganse fra de siste 3000 år, er alt vi nå vet at vi ikke vet mer enn fire prosent av hva som er rundt oss, sier vitenskapssjef Bertolucci.

Rundt 100 tilfeller av Higgs har de funnet via fysikkeksperimentene, de håper å finne mange flere i årene som kommer for å bli bedre og bedre på å profilere eventuelle varianter av denne luringen.

- Vi har funnet Higgs, men ikke funnet noe direkte bevis på for eksempel supersymmetri eller mer eksotisk fysikk utover standardmodellen, forklarer Ould-Saada.

Med oppgraderinger i systemet venter forskerne en dobling i antall kollisjoner, og da kan overraskelsene komme, tror han.

- Vi har bare produsert noen få prosent av all data som er planlagt for hele LHC-programmet 2010–2030. 98 prosent av dataene skal ifølge anslaget kommer fra 2015.

UiO-professor Steinar Stapnes kan forklare at det nå jobbes med en ny type lineær akselerator, som skal gå opp mot 50 km langs Jurafjellene. I dagens rundtur er det for så vidt lett å få fart på kollisjonstogene, men stråling tapes hver gang togene må avbøyes i en sving, så håpet er at en rett vei skal gi mer presise målinger.

I mellomtiden må gridden også holde takt med utviklingen. Bertolucci håper datasystemet også etter hvert kan få nytte for andre forskningsmiljø.

- Svakhetene til systemet er at det i bunn og grunn er skreddersydd for ett enkelt miljø. I prinsippet kan potensialet i denne måten å organisere it på bli utvidet til andre vitenskapelige miljøer. Teknisk sett kunne vi for eksempel bidratt til mer forskning på ehelse på denne måten, og vi ville vært glade for å kunne bidra på dette området, sier han.

Så hvem vet, kanskje får vi en dag svar på sentrale spørsmål som hvem vi er, hva vi er skapt av, hvor vi kommer fra, om vi er alene, hva meningen med livet er – og det største mysteriet av alle: hvem i huleste drepte mattegeniet Wim Klein?