TALETRENGT: Microsoft har kommet langt på vei når det kommer til talegjenkjenning. (Foto: Istockphoto)

Talerør eller bare rør

Kan du lese denne kommentaren, vinner microsoft

Publisert Sist oppdatert

denne kommentaren leses inn i microsoft word ved å diktere tale til tekst i applikasjonen som nå støtter norsk språk. Norge er for øvrig ett av de få landene i verden hvor språket støttes, og dette er en test av hvor godt programvaren klarer å oversette tale til tekst.

Kommentaren skal ikke redigeres før publisering, og alle feil og mangler, også når det gjelder skilletegn tom komma og punktum, bør dukke opp. I tidligere tester har vi vært imponert over hvor nøyaktig talegjenkjenningen har vært, og det er ikke vanskelig å se for seg scenarioer det er diktering kan spille en viktig rolle kommer som for eksempel for elever med lese og skrivevansker.

For min egen del kan det være gull verdt å transkribere lyd filer fra intervju opptak.

Under transkriberingen får du opp ordene i et word dokument med kun noen sekunders forsinkelse, og om man leser sakte er det mulig å holde et øye med på hvor nøyaktig ordene går fra muntlig til skriftlig .

Norsk nei som sagt ett av de første språkene utenfor engelsk som er tilgjengelig, dette er fordi nasjonalbiblioteket har gitt fri tilgang til mange tusen timer med transkribert tale, noe som har gjort arbeidet drastisk enklere for microsoft

foreløpig er diktering fra tale til tekst tilgjengelig i både word, outlook, vond lukt og powerpoint. De er en gratis tjeneste for de som har disse produktene. Microsoft har ikke satt en dato for når dette skal være tilgjengelig også i office appene til android og IOS.

Talegjenkjenning er uten tvil en av de store teknologitrendene kanskje spesielt med tanke på stadig mer populære tale assistenter som siri, alexa, gull og nå microsoft egen cortana. Navne cortana er forøvrig hentet fra spillserien heilo.

Taleassistentene er også den egentlige nøkkelen til smarte hjemmet, og er kanskje den delen av forbrukerteknologi og utviklingen skjer raskest. Både alfabet eide gull og er sånn kutter enorme ressurser i talegjenkjenning og selv om markedet hovedsakelig eksisterer på engelsk er det fremskritt også å melde innen det norske språket.

For å øke støtten til andre språk enn engelsk trengs derfor mer samarbeid, slik microsoft nå har me nasjonalbiblioteket og språkrådet . Det sier seg selv lokale ressurser er helt nødvendige når du kommer til språk. Både danmark og sverige følger nå i norges fotspor med tanke på samarbeid, og er de neste språkene som skal få støtte hos microsoft.

Nasjonalbiblioteket fortsetter arbeidet med microsoft, og vil blant annet gi tilgang til lydopptak av høringer på stortinget. Dette skal også hjelpe med dialekt forståelse, som er ett av de største hindrene til kunstig tale forståelse i språket vårt. Ai og maskinlæring spiller selvsagt på lag , men en virkelig ut utvikling skjer ikke før man har et stort nok datagrunnlag.

Microsoft lager ikke det dikterer inn i deres applikasjoner dette er gode nyheter for personvernet, men man kan leke djevelens advokat å stille spørsmålet om ikke tjenesten hadde lært raskere om den fikk tilgang til talen også i ettertid.

Tilslutt, noen vanskelige ord kolon cllou on , i matrikulert, og noe mat og poet icon, høyesterettsjustitiarius, riksmeklingsmannen, idiosynkratisk i, indisponert.

PS: Testen er gjennomført i et relativt sakte lesetempo, med østlands-dialekt. Teksten er merket visuelt med gjennomstryking der det er mangler eller feil i transkriberingen.