Nada

Laboration 4:
Grammatikkontroll

Laboration onsdag 26 november 1997

Ola Knutsson och Rickard Domeij

Syfte
att förstå uppbyggnaden av ett grammatikkontrollprogram genom att själv experimentera med det och skriva egna regler.
Uppgift
att skriva regler som beskriver en rad språkliga felaktigheter eller problem och testa dem på en längre text.
Material
Granskaprogrammet, användarinstruktion för Granska (fasthäftat i den skriftliga versionen av labben), demoregelsamling, demotext, fil med felexempel, testtext.
Hjälp
Om du behöver ytterligare hjälp; skicka e-post till knutsson@nada.kth.se
Redovisning
Redovisa på den ordinarie terminalövningen eller skicka dina lösningar till knutsson@nada.kth.se
I Granska ingår det material extraherat ur SUC (Stockholm-Umeå Corpus). All kopiering av detta material och övriga filer som ingår i Granska är absolut förbjuden.

Datormiljö

Labben ska göras i Windows NT-miljö i datorsalarna Voljären och Terrariet. För att få tillgång till programmet Granska måste du logga in på ditt nya personliga konto som troligen ligger i domänen nada.kth.se. Användarnamnet är samma som på Nadas Unixsystem. Lösenordet ska du ha fått i en fil på katalogen .nt/ på ditt Unixkonto. Ta helst reda på vilket lösenord du har innan du kommer till terminalövningen.

Mer information om Windows NT finns under http://www.nada.kth.se/datorer/nt/.

Deluppgift 1: Testa Granska

För att bekanta dig med reglerna och Granska ska du testköra programmet med en given regelsamling. Starta Granska genom att välja ikonen Granska på Skrivbordet eller i Start-menyn. Du är nu inne i Granska och ska öppna regeldatabasen demoregler.rgl under Verktyg-menyn. Den text som ska granskas heter demo.txt, den öppnar du under Arkiv-menyn. För att granska texten använd kommandot Granska text under Verktygs-menyn. Undersök resultatet genom att klicka på det rödmarkerade området med vänster musknapp och därefter klicka en gång med höger musknapp. Vad tycker du om granskningsresultatet? Vilka ytterligare fel borde ha hittats? Varför uppstår de falska alarmen?

 

Allmän instruktion till deluppgifterna nedan

Formulera regler som beskriver de feltyper som omtalas i deluppgifterna nedan. En regel i Granska beskriver normalt ett till fyra ord. Alla regler utgör endast en beskrivning av en del av en mening. Regelmatchningen sker på tecken, ord eller ytsyntaktisk nivå, se användarinstruktion för Granska. Reglerna ska vara så generella som möjligt utan att ge upphov till för många falska alarm. Det går oftast inte att beskriva felen/problemen fullständigt med reglerna. Ibland kanske inte alla fel täcks av regeln eller också ger regeln upphov till falska alarm. Gör en avvägning mellan täckning och precision för att hitta en bra balans. Pröva reglerna mot filen med felexempel som heter fel.txt. Skriv gärna in egna exempel. Kommentera när du anser att en regel inte har tillräcklig täckning. Försök också komma på exempel som ger upphov till falska alarm.

När du är klar ska du granska texten kontroll.txt med din regelsamling. Se på resultatet och formulera om reglerna om det behövs.

Varje deluppgift ska redovisas med:

Deluppgift 2: Apostrof vid genitiv

Ett vanligt fel är att sätta ut apostrof framför genitiv-s i svenska substantiv efter engelskt mönster som i exemplet nedan. Dock är det tillåtet att sätta ut apostrof efter ett namn som slutar på -s, till exempel Lars'.

Exempel:
Lotta's krog är ett trevligt ställe, synd bara att firmanamnet innehåller ett teckenfel.

Deluppgift 3: Subjektsform efter preposition

I dagens språkbruk blir det allt vanligare att skriva subjektsform efter preposition i stället för objektsform, särskilt framför ordet som. Vissa tycker att detta är en styggelse. Försök att hitta regler för följande exempel.

Exempel:
1. Han ondgör sig över de som skriver subjektsform efter preposition.
2. Dom gav en present till han på födelsedan.
3. De frågade han om han hade en tändsticka.

Deluppgift 4: Dubbelsupinum

Dubbla supinum förekommer i talat språk men anses fel i skrivet språk.

Exempel:
1. Jag har inte kunnat sovit på hela veckan.
2. Han har inte hunnit åkt skidor en enda gång i år.

Deluppgift 5: Kommer utan att

Kommer utan att börjar bli så vanligt att många inte längre anser det vara fel. Andra vill fortfarande undvika att skriva så.

Exempel:
1. Han kommer lista ut svaret på gåtan.
2. Nä, han kommer inte göra det.
3. Kommer han inte göra det?
4. Den man som kommer gillar jag inte.

Frivillig uppgift: Inkongruens i substantivfraser

Inte bara språkbrukare med svenska som andra språk gör böjningsfel som: en hus, den lilla huset. Många fall uppstår också som ordbehandlingseffekter, det kan till exempel vara tangentbordsfel eller när skribenten använder ersättfunktionen. Det går att åstadkomma inkongruens i nominalfraser på väldigt många sätt. Börja med att skriva regler för exemplen nedan.

Exempel:
1. Den gamla damen bor i ett rött villa.
2. Den nya dator som vi köpt är ett ganska värdelös maskin.
3. Jag drömmer om att bo i ett rött hus vid ett liten sjö.

Extrauppgift

Gör ett enkelt interaktivt granskningsverktyg för Word 95 i Visual Basic på basis av den inbyggda sök- och ersättfunktionens reguljära uttryck.

Sidansvarig: Ola Knutsson <knutsson@nada.kth.se>
Senast ändrad 23 november 1997
Tekniskt stöd: <webmaster@nada.kth.se>