Tuesday, August 28, 2007

Zoekmachines: scheidsrechters van zichtbaarheid

"searchers of the web (which others call the universe) are generally blithely unaware not only of just how results are selected (we are all unaware of that!) but of the very fact that the issue might be controversial"

Ian H. Witten, Marco Gori, Teresa Numerico


"We want to make you uneasy about how everyone has come to rely on search engines so utterly and completely", schrijven de auteurs van het boek Web Dragons (gespot, gekocht, gelezen). En inderdaad, ik ben op een prettige manier wakker geschud uit mijn comfort zone. (en da's prima want "comfort is just boredom with good PR" :-))

Het boek is "gegeten", maar nog niet verteerd. In deze post probeer ik een begin te maken ..

Informatie is niet neutraal. En is dat ook nooit geweest. Archieven worden vaak gezien als de schatkamers van ons verleden. Maar de implicatie van het hébben van een archief is dat er ook dingen zijn die het NIET bevat. Er is een binnen en een buiten. "Archives do violence to the truth", schrijven de auteurs. Enkel en alleen omdat ze bestaan. De medaille heeft twee kanten.

Op het web wordt de toegang tot documenten mogelijk gemaakt via een tussenpersoon (de zoekmachine) die er zijn eigen waarheid (selectiemethoden) op na houdt. Het aantal links naar jouw pagina (een indicatie voor de autoriteit) bepaalt mede waar je pagina in de zoekresultaten verschijnt. Maar mensen kunnen alleen naar jouw pagina linken als ze je pagina vínden. En de meeste documenten worden gevonden met .. zoekmachines.

De zoekers onder ons klikken echter zelden verder dan
- pak 'm beet - het 100e zoekresultaat. Dit maakt vele pagina's onzichtbaar. Ze zouden er net zo goed niet kunnen zijn. Hoewel het heel democratisch klínkt dat de pagina's met de hoogste autoriteit bovenaan in je resultatenlijst komen te staan, heeft dit proces een aantal unwanted side-effects:
  • Veel pagina's worden nooit door de zoeker ontdekt, zelfs al behoren ze niet tot het deep web
  • Ranking gaat over populariteit en niet persé over autoriteit
  • The rich get richer, the poor do not stand a chance
  • Gevolg: "A single point of view on the universe (which others call the web)"
De huidige zoekmachines zien het web als één geheel. Ze wegen verschillende gezichtspunten alsof het objectieve waarheden zouden zijn. Hoe zorgen we ervoor dat een zoekmachine niet degenereert tot een orakel dat steeds hetzelfde antwoord uitspuugt. Hoe bewaren we diversiteit?

De auteurs voorzien een shift (en dit is al gaande) van information retrieval naar het het erkennen van de sociale natuur van kennis. Het zoeken op het web wordt contextueel! (informatie = feiten in context) En personalisatie is nog maar het begin van het contextuele web. De evolutie van zoekmachines gaat verder. Ze zullen het belang in gaan zien van communities (een netwerk van mensen met een gedeelde interesse).

"The web is an assemblage of millions of interlinked communities. A community is more than a subset of the universe. It is a perspective on it".

Communities kennen hun eigen perspectief, selectie, ranking, waarheid. Door te zoeken bínnen die communities (door de auteurs gedoopt tot digital libraries vanwege de schatten die ze herbergen) wordt het mogelijk om - in return - aan die communities gepersonaliseerde diensten aan te bieden. Er zullen ranking technieken komen die het mogelijk maken je perspectief te kiezen.

Ook nu heeft de medaille twee kanten:

"Tradeoff between personalization (diversity, if you will) and privacy will be one of the most challenging questions to arise in years to come".

Tot nu toe was ik nog huiverig om me aan te melden voor Personalized Search. Maar nu zie ik dat ik mezelf (en andere onontdekte pagina's out there) te kort doe met slechts één perspectief op het universum (which others call the web).

Wie zegt dat het perspectief dat ik straks te zien krijg, beter is? Niemand. Of zoals de filosoof Immanuel Kant zegt:

"We don't know when we have arrived at the truth, because we do not know what the truth is"

Maar het lijkt me wel goed haar van zo veel mogelijk kanten te bestuderen. Voor nu betekent dat voor mij:

Google, Let's get personal!

M.

Foto via

4 comments:

Unknown said...

Ik plaats nu echt een verzoek tot aanschaf!

Dank.

Edwin

Marina Noordegraaf .... said...

leuk! benieuwd hoe jij het boek verteert ..

Daniëlle said...

Hé Marina, naar aanleiding van je reactie bij Edwin heb ik het 1e hoofdstuk gedownload. Dat heb ik overigens nog niet gelezen maar ik wil het volledige boek na jouw beschrijving wel lezen. Bedankt voor de attendering.

Marina Noordegraaf .... said...

leuk! hoe meer point of views, hoe beter!

www.flickr.com