LEDER | Språkmodeller
Norskutviklede språkmodeller – forsk nå!
Digital suverenitet er vel og bra, men kulturell suverenitet er ikke mindre viktig.
Førstkommende mandag arrangerer Digitaliseringsdirektoratet (Digdir) og Språkrådet en mer enn normalt interessant teknologikonferanse i Oslo. Konferansens overskrift er «Språkmodeller og nasjonal selvråderett». Det river kanskje ikke skinnet av pølsa for alle, men det er lett å argumentere for at dette – intet mindre – er blant de viktigste konferansene som arrangeres i Norge i år.
Kunstig intelligens er som kjent kommet for å bli. Det kreves neppe her en konsekvensanalyse om hva det vil bety samfunnsutviklingen fremover – Computerworlds publikum er godt orientert om KIs potensial, både med positivt og negativt fortegn – det holder å si at den vil bli ustoppelig og massiv.
Den vissheten gjør det skremmende på flere nivå at ingen av de store språkmodellene som generativ KI i dag lener seg på er spesielt gode på norsk, eller for den saks skyld, nynorsk og samisk. Aller først er det spørsmålet om digital suverenitet. I en stadig mer utrygg verden er det trolig ikke klokt å legge alle eggene i kurven til store amerikanske og kinesiske teknologigiganter.
Men like viktig er de trolig mange negative effektene av å veve inn språkmodeller, som både kulturelt og språklig er utviklet langt fra en norsk virkelighet, tett inn i norsk forvaltning og samfunnsliv.
Direktør Åse Wetås i Språkrådet er blant dem som har advart mot en slik utvikling. Hun peker på at generativ KI allerede i dag innvirker på språkutviklingen i Norge. KI-generert tekst ensretter ordvalg, syntaks og stil, og produserer også en stor mengde anglisismer.
Wetås sin konklusjon: Norge trenger norskutviklede språkmodeller for å kunne ivareta både norsk kulturarv og språkpolitiske mål. Det var imidlertid ikke konklusjonen til Forskningsrådet da den mye omtalte «KI-milliarden» ble delt ut i fjor. Ingen av de seks forskingssentrene som fikk støtte har språkmodeller som sitt hovedfelt.
Og der er vi tilbake til starten. Fordi NCLM (National Centre for Language Models) ble vurdert som for lett av Forskningsrådet, har Nasjonalbiblioteket, NTNU og UiO slått sine krefter sammen i «Språkmodellklynge Norge» for å sikre at forskning på norske språkmodeller ikke tørker fullstendig ut.
Og spesielt i en periode der KI-utviklingen raser videre og avhengigheten av utenlandske aktører er størst. Dette er et ualminnelig viktig og prisverdig initiativ.
På mandag klokken 11.35 presenterer Jon Atle Gulla fra NTNU og Lilja Øvrelid fra UiO klyngens anbefalinger for «forskning og utvikling av store, åpne språkmodeller i Norge». Både forsknings- og digitaliseringsministeren bør følge med.