Nada

Stavningskontroll

Viggo Kann

Kortfattat innehåll
Beskrivning av programmet Stava. Algoritmer och datastrukturer för snabb sökning i och kompakt lagring av ordlistor.
Litteratur
Bredvidläsningslitteratur

Innehåll

Exempel på tentafråga

Fråga

Ge exempel på två metoder som kan användas vid automatisk rangordning av rättelseförslag i ett rättstavningsprogram.

Svar

Förfinad metrik
Alla ord på editeringsavstånd ett (t ex her - hyr) är förstås närmare än ord på editeringsavstånd två (t ex her - term), men vissa ord på avstånd ett är troligare än andra. Exempel:
Ordfrekvenser
Föreslå ord som i vanligare i språket före ord som är ovanligare. Vanliga ord som kan felstavas som her är till exempel har, här och hur.
I ett rättstavningsprogram utnyttjar man lämpligen båda metoderna och viktar ihop resultatet.

Uppsatsuppgift

Programmet Stava har suffixregler som gör att alla böjningsformer inte behöver finnas i ordlistan. Däremot saknas det för närvarande regler för fogemorfem. Man skulle till exempel vilja ha en regel som säger att om ordet xxx-ing finns i ordlistan så ska xxx-ings vara ett tillåtet förled i sammansättningar. Skapa ett antal lämpliga fogemorfemsregler, och försök få en uppfattning om ungefär hur stor del av förleden man kan täcka in med dessa generella regler och hur stor del man måste specialbehandla (alltså stoppa in i förledsordlistan).

^ Upp till kursplanen.


Sidansvarig: Viggo Kann <viggo@nada.kth.se>
Senast ändrad 18 augusti 2003
Tekniskt stöd: <webmaster@nada.kth.se>