Nada

Laboration 1:
Språkmiljön Grim

Ola Knutsson

Syfte

Syftet med laborationen är att undersöka språkmiljön Grim som har utvecklats på KTH. Grim ger en bra bild över de verktyg som har utvecklats på Skolan för datavetenskap och kommunikation på KTH sedan 1992. Här följer en lista över de verktyg som ingår:
Stavningskontrollen Stava
Grammatikkontrollen Granska
Grammatikkontrollen ProbGranska
Ytparsern GTA
Ordklasstaggaren Tagger
Ordböjaren Inflector
Webbservern för lexikonet Lexin. Åtta olika språkpar utvecklade av Myndighteten för skolutveckling.
Textsammanfattaren SweSum
Klienten Grim som är en enkel ordbehandlare med gränssnitt mot verktygen ovan.

Uppgift

Uppgiften är att undersöka Grims olika delar samt att fundera på deras användbarhet. Uppgiften går också ut på att reflektera över vad man egentligen kan göra med språkteknologi, och hur pass mycket av verktygens användbarhet som ligger i designen av interaktion och grafiskt gränssnitt. En grundläggande fråga i laborationen är: om det alltid är de språkteknologiska verktygens grundläggande algoritmer som måste förbättras för att språkverktygen skall bli enkla och tillförlitliga?

Starta Grim

Instruktioner för hur du startar Grim finns på installationssidan för Grim

Hjälp

Om du behöver ytterligare hjälp; skicka e-post till knutsson@nada.kth.se

Redovisning

Redovisa genom att skicka en skriftlig rapport till knutsson@nada.kth.se Rapporten skall vara på cirka 1000 ord. Sista redovisningsdag är den 31 oktober 2005.

Deluppgift 1: Bekanta dig med Grim

För att bekanta dig med Grim använder du den text som finns under menyn "Arkiv" "Öppna exempel". Vad händer? Undersök resultatet, vad tycker du om granskningsresultatet? Vilka ytterligare fel borde ha hittats?
Är det enkelt att förstå hur man använder programmet, eller förutsätter Grim gedigen datorerfarenhet. Skulle man kunna ha designat programmet på något annat sätt? Diskutera och argumentera. Ståndpunkten att allt är bra eller dåligt i Grim godkänns inte utan det krävs argument.

Deluppgift 2: Markering av fel i texten

Du kan byta färger på feltyperna i vänsterkolumnen genom att dubbelklicka på en feltyp. Byt till exempel färg på feltypen "Sannolika".Under denna döljer sig ProbGranska som är en statistisk grammatikgranskare. Fundera över om det är bra med flera granskningsmetoder i samma program. Testa att skriva i texten, hur upplever du feedbacken från Grim. Även om du skriver på något annat språk än svenska kommer programmet att försöka analysera dina ord. Skulle man kunna tänka sig att feedbacken från Grim ges på något annat sätt? Får du någon känsla för hur de olika verktygen i Grim fungerar? Går det att överhuvudtaget att skapa ett sådant program - som kan beskriva sitt eget beteende, sina beslut? Är det nödvändigt för att programmen skall vara begripliga för språkligt osäkra användare? Med andra ord, om programmen kan förklara hur de analyserat ett språkligt fenomen så skulle användarna hypotetiskt kunna avgöra om de har gjort rätt eller fel.
I Verktygs-menyn kan du välja "Anmärkningar" så kommer du att få diagnoser och ersättningsförslag från granskningsverktygen.

Deluppgift 3: Testa återkoppling från ordklasstaggare och ytparser

En vanlig uppgift för inlärare av svenska som andraspråk är att undersöka till exempel alla verb som man har skrivit i sin text. I andra fall kan det vara läraren som markerar till exempel alla substantiv i en text. Med Grim kan detta göras automatiskt och i vilken text som helst. Välj någon svensk text, och välj alternativet "Markera ordklasser" under Verktygsmenyn. Reflektera över om detta alltid är bra. Ordklasstaggaren som används i Grim har en träffsäkerhet på 95 %. Hur pass stor betydelse har det när den används i Grim? Både ordklasstaggaren och ytparsern kommer att analysera all text oberoende om den är grammatisk eller inte. Undersök detta genom att ladda exempeltexten från deluppgift 1. Notera att du också får ordklass- och frasinformation i högerkolumnen i Grim.

Deluppgift 4: Automatisk ordböjning

I Grim ingår också ordböjaren Inflector. Undersök denna lite kort. Är det bra eller dåligt att även felstavade ord ibland får ett böjningsförslag? Den böjer t.ex. ordet "glacierer". Reflektera över att denna liberala språksyn samsas med den mer strikta synen på språk som representeras av stavnings- och grammatikkontrollerna i Grim.

Deluppgift 5: Lexin

Lexikonet Lexin finns med i Grim. Men hur är det egentligen med dess täckning? Hur många ord måste ett lexikon hantera för att det skall bli ett ultimat språkverktyg. Ta en text, och testa 10 ord som du anser är lite svårare än de övriga. Hur många av dessa fanns med i Lexin? Hur går det egentligen med sammansatta ord? Hur skall till exempel en andraspråksinlärare få reda på vad en flugfiskelina är för något? Föreslå en väg mot en lösning av problemet.

Deluppgift 6: SweSum

Testa sammanfattaren SweSum på någon text, till exempel en text från Dagens nyheter. Vad tycker du om resultatet? I utdata från SweSum listas ett antal nyckelord. Hur stämmer de med din bedömning av vilka ord som utgör nycklar till en tolkning av texten?
Sidansvarig: Ola Knutsson <knutsson@nada.kth.se>
Senast ändrad 1 oktober 2005
Tekniskt stöd: <webmaster@nada.kth.se>