Hurra for alle it-feilene

Hurra for alle it-feilene

KOMMENTAR: De indre feilene oppdages først ved svikt.

Det svikter og det svikter. Endelig viser nettverkenes svakhet seg frem for alle. Vi skriker som aldri før. Det er på tide å lære.

Altinn svikter, EDB Ergogroup svikter, mobilnettet svikter. Ahus nærmest bryter sammen, er inntrykket som sitter igjen. Men det har ikke vært fare for liv og helse hos Ahus. Det kunne ha vært fare for liv da mobilnettet brøt sammen mens flommen raste i Gudbrandsdalen.

Én feil håndteres, men det er ikke bare én feil. Det er doble. Doble tekniske feil eller teknisk og menneskelig. Doble feil skal ikke forekomme, men de gjør det stadig. Det er det vi må lære av.

Sårbare systemer

De seneste månedene har vist sårbare systemer. Vi er blitt alt for avhengig av nettverk, nettverk man tar for gitt at fungerer, fordi det virket da det ble tatt i bruk.

Til nå har oppmerksomheten vært rettet mot ytre angrep med viruser og annen faenskap. De indre feilene oppdages først ved svikt. Da er det grunn til å rope hurra. De indre feilene må finnes før det blir ytterligere problemer.

Hos EDB Ergogroup viste en test at systemet var underdimensjonert. Det ble oppgradert, men ikke reserveløsningen. Da hovedsystemet feilet i påsken, feilet naturligvis også reserveløsningen. Finanstilsynet er ikke nådig i sin kritikk.

Hos Ahus opplevde de at systemet bombarderte seg selv som om det skulle vært angrepet utenfra. Det skjedde dermed en tjenestenekt. Slike har man vendt seg til, men ikke at nettet selvdestruerer.

Nettverket er datamaskinen. Suns slagord fra 25 år tilbake, formulert av sjefsforsker John Gage, viser sin berettigelse om igjen og om igjen. Uten nett synes vi å bli mer og mer hjelpeløse. Derfor må nettverksløsningene ikke bare settes opp, dupliseres, men også krisetestes.

Krisetesting er noe annet enn å slå av strømmen og se hvordan reservesystemet tar over. Feil som nettverksproblemene på Ahus vil ikke bli oppdaget i slike tilfeller.

Forståelse for nettverkstrukturer og samspill med datamaskiner må spesifiseres og settes opp av fagfolk som kan gjøre de riktige valgene i oppsettet. Alt for ofte viser det seg at nettverkstilkobling ikke forstås.

Det er ikke selve det praktiske, men hvordan nettverk og datamaskiner jobber sammen både i normale og unormale situasjoner fagfolkene må lære seg.

Slike situasjoner kan veldig ofte ikke tenkes ut på forhånd.

Må være robuste

Nettverkssystemer må være robuste. De må være satt opp til å håndtere mye mer kapasitet enn man kan tenke seg de nærmeste tre årene. For hele tiden viser det seg at de villeste drømmene for behov ikke bare slår til, men overgås.

Det er hva Telenor opplever i mobilnettet. Telenor bør prise seg lykkelig for at de bare har tre millioner brukere i Norge. Telenor bør prise seg lykkelig over at de norske brukerne benytter avanserte apparater som jobber på en annen måte enn enkle mobiltelefoner.

Oppkobling er enkelt. Å følge opp og sikre overføringene til og fra smarttelefoner og nettbrett er verre. De setter helt andre krav. Dette må nettleverandørene lære seg.

Det krever etterforskning av årsakene når mobilnettet bryter sammen. Det krever forskning på behovet for videre utbygging med tilhørende teknologier for å øke kapasiteten når frekvensspekteret er begrenset.

For i veldig mange tilfeller skjer svikten når det oppstår to feil. Hos EDB var det teknisk sammenbrudd i hovedløsningen etterfulgt av sammenbrudd i reserveløsningen. Hos Telenor var det brudd på den ene fiberringen etterfulgt av brudd på den andre, første gang det sviktet. Feilen var ikke Telenors, men det går ut over Telenors kunder og dermed Telenor.

Hos Ahus var det sammenbrudd i en svitsj for bladmaskinene i kombinasjon med en feil i oppsettet for en Ethernet-forbindelse.

En reserve er derfor ikke godt nok. Det må tas høyde for kapasitet selv med to feil ved kritisk infrastruktur. Det krever mer avansert administrasjon. Maskenett er et stikkord.

Les om: