Mobilen kan lese

Xerox er kjent for sine kopimaskiner og skrivere. Og sin forskning, som har gitt oss ikoner, mus og ethernet. Men det er dokumenter som gjelder.
GRENOBLE: Selskapet som står bak fotokopiering og de første laserskriverne holder seg til dokumenter. Mens andre har tjent penger på oppfinnelsene som oppsto i Xerox' laboratorier og som varslet det papirløse kontor, tjener de på at papiret fortsatt er det foretrukne mediet for å distribuere tekst.

I Grenoble i Frankrike har Xerox sitt europeiske forskningsinstitutt. De forsker på bilder, "images". Vi mangler et godt ord for dette på norsk. Et bilde er noe vi har av familien, en "image" kan være et dokument.

Og det er nettopp hva Xerox-forskerne i Grenoble jobber med. En Nokia-telefon med kamera er omgjort fra et relativt dårlig familiekamera til en dokumentskanner.

La mobilen lese

Fra før av har Xerox laget løsninger som gjør web-kameraer og digitalkameraer om til dokumentskannere. Nå har de klart det samme med en mobiltelefon. Ideen er at du skal ha tilgang til raskt å gå fra å lese en tekst til å gjøre den tilgjengelig for datamaskinen.

Chris Dance leder forskningen på bruk av kameraer som enheter for å hente inn tekst. Han forklarer Xerox' interesse for dette slik:

-- Skanner kan du ha på pulten. Da må du legge dokumentet eller avisen på den, og lese inn teksten. Det tar plass, og ikke minst tar det tid. Dersom du kan hanke frem mobiltelefonen og skanne på den måten, er det enklere, raskere og mer hendig.

Derfor har Xerox-forskerne laget et program for mobiltelefon som lar deg bruke telefonens kamera til å skanne et dokument. Og det er ikke enkelt. Du tar bilde av dokumentet; så langt er alt vel. Deretter skal dette bildet renses for en rekke problemer; farger skal fjernes for å lage entydig tekst.

Så skal det gjøres skarpt, forstørres og gjøres binært. For tekst er billedmessig én til én: Forgrunn og bakgrunn. Ved hjelp av den relativt enkle prosessoren i en mobiltelefon har altså Xerox-forskerne greid å få til dokumentbehandling i forkant av OCR.

Skjønne teksten

OCR -- Optical Character Recognition -- er en selvsagt del. Det skal skje på pc-en eller andre datamaskiner. Her kommer mobilen til kort. Men de vaskede bildene fra mobilen lar seg lett håndtere på en pc. Forskerne ved Xerox Research Center Europe viste hvordan du enkelt kan knipse et avissitat og gjøre det til egen tekst.

Mobiltelefonen er ennå for svak til å gjennomføre full tekstforståelse, men de operasjonene Xerox-forskerne håndterer på den er avanserte nok til at du kan skrive ut et bilde av en tekst til en skriver via Bluetooth. Du kan til og med å rette opp perspektivet i et bilde av en tekst.

Mens ganske mange kritiserer mobilprodusentene for å utstyre sine forkjellige modeller med kamera kun til privat nytte, mener altså Xerox-forskerne i Grenoble at kameraet gir nytte langt ut over å dokumentere siste lunsj eller middagsfestligheter.