Nada

Laboration 5:
Informationssökning

Laboration onsdag 3 december 1997

Jussi Karlgren

Uppgift i korthet

Uppgiften är att använda en serie program och modifiera dem något litet för att utvärdera effekten av olika informationssökningsalgoritmer på en testkorpus skapad för ändamålet.

Förberedelse

Läs materialet till föreläsningen om informationssökning.

Arbetsgång

Redovisning

Som redovisning lämnas in

% precision

100  +
     |
     |
 80  +
     |
     |
 60  +
     |
     |
 40  +
     |
     |
 20  +
     |
     |
     +---+---+---+---+---+---+---+---+---+---+-
         10  20  30  40  50  60  70  80  90 100
  antal dokument räknade från toppen av rankinglistan

Eftersom det är tidsödande att beräkna precisionen för alla dokument räcker det om du ritar kurvorna från 0 till 10 dokument (räknade från toppen av rankinglistan).

Extrauppgift

Gör någon uppenbar förbättring på de rätt så enkla sökprogrammen. Till exempel vägs nu alla termer ihop lika starkt: ett svagt resultat på en term kan vägas upp av ett lika mycket starkare på en annan. Det kanske borde vara så att en text som får mediokert på flera termer borde vägas upp jämfört med en text som får ett bitvis glimrande men i stort ojämnt resultat? Rota i sådan fall i koden i search.perl.

^ Upp till kursplanen.


Sidansvarig: Jussi Karlgren <jussi@nada.kth.se>
Senast ändrad 5 december 1997
Tekniskt stöd: <webmaster@nada.kth.se>