Detaljerad kursplan för F2D5381 Språkgranskningsverktyg
Lärare
Schema
Lokal: KTH Nada, skolan för datavetenskap och kommunikation,
Lindstedtsvägen 5, plan 5, seminarierum 4523.
- måndag 3 oktober 2005
- 9.15-17.00, intensivdag 1 på KTH
- tisdag 4 oktober 2005
- 8.15-16.00, intensivdag 2 på KTH
- oktober-december 2005
- eget arbete med datorlabbar på distans
- tisdag 10 januari 2006
- 10.00-17.00, redovisning av individuell uppgift på KTH
Kursupplägg
Föreläsningar under intensivdagarna på KTH
- Föreläsning 1, 3 oktober 9.15-11.00: inledning (Viggo och Ola)
- kursinnehåll och kurskrav
- köp av kursbunt, utkvittering av datorkonton
- granskningsverktyg
- språkriktighet och grammatikalitet, vad är en bra text
- felanalys
- skrivprocessen
- olika typer av granskning
- användarperspektiv
- Föreläsning 2, 3 oktober 11.15-12.15: rättstavningsverktyg (Viggo)
- snabb uppslagning
- hantering av böjningar och sammansättningar, sammansättningsdisambiguering
- rättelseförslagsgenerering och rangordning
- Föreläsning 3: 3 oktober 13.30-15.00 grammatikgranskning (Ola)
- inledning
- olika metoder för grammatikgranskning (Skribent, Scarrie,
ändliga automater, Grammatifix, Granska, ProbGranska, SnålGranska)
- Granskas uppbyggnad
- Föreläsning 4, 3 oktober 15.30-17.00: grammatikgranskningslingvistik (Ola)
- felkorpusar och felannotering
- feltypologi
- Granskas regelspråk
- konstruktion av granskningsregler
- Föreläsning 5, 4 oktober 8.15-10.00: regelbaserad och statistisk grammatikgranskning (Viggo, Jonas)
- implementation av granskning med reguljära uttryck
- implementation av granskning med granskningsregler
- statistiska metoder för granskning
- ensemblegranskning
- Föreläsning 6, 4 oktober 10.15-12.00: användarorienterad grammatikgranskning (Ola)
- användaranpassning (svenska som andraspråk)
- interaktion, återkoppling och trovärdighet (Grim)
- utvärdering av användbarhet (gränssnitt, diagnoser etc)
- Föreläsning 7: 4 oktober 13.15-15.00 utvärdering av språkgranskningsverktyg (Jonas)
- utvärdering av funktion (täckning, precision, detektion och korrektion)
- automatisk utvärdering
- utvärdering av robusthet
- utvärdering av snabbhet
- Föreläsning 8: 4 oktober 15.15-16.00 i seminarierum 1535 (Viggo, Ola, Jonas)
- information om labbkursen
- information om individuella uppgiften
- tid för avslutningsdagen i januari
Avslutningsdag på Nada (10 januari)
Redovisning av individuella uppgifter.
Schema. Resultat av individuella uppgiften.
Examination
- Inlämningsuppgift, skriftlig redovisning av kurslitteraturen. Välj ut 10 av
artiklarna i kurslitteraturen, läs dessa och skriv ner kort vad du tycker är
intressantast i varje artikel. Sammanlagt 500-700 ord plus referenser.
Sista redovisningsdag 18 oktober 2005.
-
Fyra datorlaborationer som görs på distans.
-
Skriftlig och muntlig presentation av en
individuell uppgift.
Var och en definierar sin egen uppgift, men uppgiften måste
diskuteras med någon av lärarna innan den påbörjas.
Det finns några uppslag till individuella uppgifter.
Kurslitteratur
- Ola Knutsson: doktorsavhandling (kappa och 5 artiklar)
- Ola Knutsson: Automatisk språkgranskning av svensk text, TRITA-NA-01-5, licentiatavhandling 2001, kapitel 3: Granskas regelspråk.
- Johnny Bigert: Automatic and Unsupervised Methods in Natural Language Processing,
TRITA-NA-0508, doktorsavhandling 2005, kapitel 4 och 10
- Karen Kukich: Techniques for Automatically Correcting Words in Text,
ACM Computing Surveys, 1992
- Michele Banko, Eric Brill: Scaling to Very Very Large Corpora for Natural Language Disambiguation,
Proc. ACL 2001
- Anna Sågvall Hein: A grammar checking module for Swedish, Reports from the SCARRIE project, 1999
- Sylvana Sofkova Hashemi, Robin Cooper, Robert Andersson: Positive Grammar Checking: A Finite State Approach,
Proc. CICLing 2003
- Juhani Birn: Detecting grammar errors with Lingsoft's Swedish grammar checker,
Proc. Nodalida 1999
Upp till kursens hemsida.
|