bild
Skolan för
datavetenskap
och kommunikation

Detaljerad kursplan för F2D5381 Språkgranskningsverktyg

Lärare

Schema

Lokal: KTH Nada, skolan för datavetenskap och kommunikation, Lindstedtsvägen 5, plan 5, seminarierum 4523.
måndag 3 oktober 2005
9.15-17.00, intensivdag 1 på KTH
tisdag 4 oktober 2005
8.15-16.00, intensivdag 2 på KTH
oktober-december 2005
eget arbete med datorlabbar på distans
tisdag 10 januari 2006
10.00-17.00, redovisning av individuell uppgift på KTH

Kursupplägg

Föreläsningar under intensivdagarna på KTH
 • Föreläsning 1, 3 oktober 9.15-11.00: inledning (Viggo och Ola)
  • kursinnehåll och kurskrav
  • köp av kursbunt, utkvittering av datorkonton
  • granskningsverktyg
  • språkriktighet och grammatikalitet, vad är en bra text
  • felanalys
  • skrivprocessen
  • olika typer av granskning
  • användarperspektiv
 • Föreläsning 2, 3 oktober 11.15-12.15: rättstavningsverktyg (Viggo)
  • snabb uppslagning
  • hantering av böjningar och sammansättningar, sammansättningsdisambiguering
  • rättelseförslagsgenerering och rangordning
 • Föreläsning 3: 3 oktober 13.30-15.00 grammatikgranskning (Ola)
  • inledning
  • olika metoder för grammatikgranskning (Skribent, Scarrie, ändliga automater, Grammatifix, Granska, ProbGranska, SnålGranska)
  • Granskas uppbyggnad
 • Föreläsning 4, 3 oktober 15.30-17.00: grammatikgranskningslingvistik (Ola)
  • felkorpusar och felannotering
  • feltypologi
  • Granskas regelspråk
  • konstruktion av granskningsregler
 • Föreläsning 5, 4 oktober 8.15-10.00: regelbaserad och statistisk grammatikgranskning (Viggo, Jonas)
  • implementation av granskning med reguljära uttryck
  • implementation av granskning med granskningsregler
  • statistiska metoder för granskning
  • ensemblegranskning
 • Föreläsning 6, 4 oktober 10.15-12.00: användarorienterad grammatikgranskning (Ola)
  • användaranpassning (svenska som andraspråk)
  • interaktion, återkoppling och trovärdighet (Grim)
  • utvärdering av användbarhet (gränssnitt, diagnoser etc)
 • Föreläsning 7: 4 oktober 13.15-15.00 utvärdering av språkgranskningsverktyg (Jonas)
  • utvärdering av funktion (täckning, precision, detektion och korrektion)
  • automatisk utvärdering
  • utvärdering av robusthet
  • utvärdering av snabbhet
 • Föreläsning 8: 4 oktober 15.15-16.00 i seminarierum 1535 (Viggo, Ola, Jonas)
  • information om labbkursen
  • information om individuella uppgiften
  • tid för avslutningsdagen i januari
Avslutningsdag på Nada (10 januari)

Redovisning av individuella uppgifter.
Schema. Resultat av individuella uppgiften.

Examination

 • Inlämningsuppgift, skriftlig redovisning av kurslitteraturen. Välj ut 10 av artiklarna i kurslitteraturen, läs dessa och skriv ner kort vad du tycker är intressantast i varje artikel. Sammanlagt 500-700 ord plus referenser. Sista redovisningsdag 18 oktober 2005.
 • Fyra datorlaborationer som görs på distans.
 • Skriftlig och muntlig presentation av en individuell uppgift. Var och en definierar sin egen uppgift, men uppgiften måste diskuteras med någon av lärarna innan den påbörjas. Det finns några uppslag till individuella uppgifter.

Kurslitteratur

 • Ola Knutsson: doktorsavhandling (kappa och 5 artiklar)
 • Ola Knutsson: Automatisk språkgranskning av svensk text, TRITA-NA-01-5, licentiatavhandling 2001, kapitel 3: Granskas regelspråk.
 • Johnny Bigert: Automatic and Unsupervised Methods in Natural Language Processing, TRITA-NA-0508, doktorsavhandling 2005, kapitel 4 och 10
 • Karen Kukich: Techniques for Automatically Correcting Words in Text, ACM Computing Surveys, 1992
 • Michele Banko, Eric Brill: Scaling to Very Very Large Corpora for Natural Language Disambiguation, Proc. ACL 2001
 • Anna Sågvall Hein: A grammar checking module for Swedish, Reports from the SCARRIE project, 1999
 • Sylvana Sofkova Hashemi, Robin Cooper, Robert Andersson: Positive Grammar Checking: A Finite State Approach, Proc. CICLing 2003
 • Juhani Birn: Detecting grammar errors with Lingsoft's Swedish grammar checker, Proc. Nodalida 1999

^ Upp till kursens hemsida.

Sidansvarig: Viggo Kann <viggo@nada.kth.se>
Uppdaterad 2006-01-31