Guglerier

Guglerier

KOMMENTAR: Vi googler mer og mer. Men er du klar over at du ofte får et helt annet svar hvis du sender ditt spørsmål til Yahoo eller Kvasir?

Når vi bruker en av søketjenestene, tror vi at vi får et representativt utvalg av det som er tilgjengelig. Det er feil.

En studie som sammenlignet svarene på det samme spørsmål sendt til Google, Yahoo, ASK og Microsofts MSN viste bare 12 prosent sammenfallende svar på den første siden. Og det var ikke slik at alle fire skulle vise det samme, det var nok at to av dem gjorde det. 88 prosent av svarene på de første sidene var unike. Holder du deg til bare én søketjeneste, kan du gå glipp av det du leter etter.

Det er flere grunner til dette. Søketjenester samler masser med informasjon. Tjenestene sender ut "agenter" som gjennomsøker Verdensveven med tett mellomrom og plukker med seg informasjon, bygger en kopibase og en svær indeks. Denne søkingen gjennomføres på ulike måter og med ulikt nedslagsfelt.

Flere meninger

Ingen av tjenestene går gjennom hele Veven. En tjeneste som bygger sin indeks ut fra en milliard sider har mer å vise enn en som tar med seg det halve. Dette er en opplagt grunn til at svarene blir forskjellige – men ikke den eneste grunnen.

Når du sender et søk, bør tjenesten oppfatte hva du er ute etter. Å tolke annet enn de mest rett frem spørsmål kan være krevende fordi ord eller en kombinasjon av ord har flere meninger. Ordet "lønn" har tre ulike betydninger, "bane" har fire. Jaguar betyr i hvert fall to helt ulike ting. Google er ikke spesielt god til å skjelne meninger, for den er et søkeord et søkeord, basta.

Så kommer C-momentet – å vurdere relevansen av svarene. Inneholder vevsiden informasjon som er av nytte for den som spør? Jo mer intelligent en søketjeneste er, desto mer forstår den av konteksten. Blir konteksten misforstått, får vi en haug med irrelevante svar. Det skjer stadig vekk. Det interessante er at vi som brukere har tilpasset oss søketjenestenes svakheter. Får vi en haug med irrelevante svar, så sier vi ikke "drittjeneste!" og går til en annen, men prøver lydig å finne en annen måte å stille spørsmålet på. Om og om igjen.

Neste trinn er å bestemme rekkefølgen når svarene skal presenteres, den såkalte ranking. Hvilke er de beste svarene? Det er her "hjulet treffer asfalten". Google leverer tusener av svar på de fleste spørsmål, tilsynelatende hulter til bulter. I virkeligheten ligger det lurt uttenkte formler som avgjør rekkefølgen.

Pagerank

Google kom sent, men vant verden fordi gründerne fant en ny og kreativ måte å bestemme relevansen og rekkefølgen på svarene, PageRank. De færreste gidder å bla gjennom mer enn to-tre sider av svarene de får. Fordi Google og for eksempel Yahoo bruker ulike rankingprinsipper, blir innholdet på de første sidene helt forskjellig.

Google har stor makt. For en liten bedrift betyr det å komme høyt på lista når folk søker liv eller død. Dukker den opp som nummer en eller to, kan bedriften få mye business. Kommer den på side 12, kan den pakke sammen – eller i hvert fall finne andre måter å nærme seg sitt marked.

Et velkjent eksempel er KinderStart som selger produkter og tjenester for småbarn. Salget foregår fra et nettsted. 19. mars 2005 falt antallet besøkere med 70 prosent. Årsaken var at PageRank-verdien ble drastisk senket, KinderStart var ikke lenger synlig. Bedriften saksøkte Google blant annet for brudd på ytringsfriheten, men vant ikke frem. Google hevdet at relevansen var lav fordi nettstedet ikke inneholdt originalt innhold, bare lenker. Dommen viser tydelig at Google kan gjøre hva de vil med sin egen indeks. Brukte man Yahoo, var det mye enklere å finne KinderStart – og det er mitt poeng.

Cloaking

Google har makt, og makten pleier å bli utfordret eller motarbeidet i det skjulte. En metode er å lure søketjenesten til å høyne relevansen på akkurat ditt nettsted. Vet du hvordan tjenesten vurderer relevans, kan du få det til. Det holdes kurs i dette "faget". Et skittent triks går ut på å skape forskjell mellom den teksten som Google indekserer fra og den side som blir vist frem.

Teksten kan inneholde nøkkelord, gjentatt mange ganger slik at relevansen stiger, men som ikke blir presentert på skjermen. Cloaking heter dette. Google slår hardt ned på slike forsøk. Budet er eminent: "Du skal lage dine nettsider for brukerne, ikke for søketjenestene". Av og til avsier de en dødsdom – de fjerner rett og slett nettstedet fra sin indeks. Det opplevde BMW. Makta rår sa kjerringa, hun heiv ut katta.

P.S. Jeg har hatt mye glede av en ny bok "Blown to bits", lettlest og stimulerende selv om den er skrevet av tre eldre professorer: Abelson, Ledeen og Lewis.

hidas@online.no

Les om: