Nada

Morfologi

Ola Knutsson

Innehåll

Litteratur

 • Ljusbilder i pdf från föreläsningen på 2D1418 den 2 september 2002.

  Bredvidläsningslitteratur

  Richard Sproat. 1992. Morphology and Computation. MIT Press.

  Instuderingsfrågor

 • Vad är en omskrivningsregel? Ge exempel.
 • Vad är stemming/stamning?
 • Hur fungerar Porters stemmer/stammare?
 • Vad skall man med morfologisk analys till?
 • Vilka morfologiska särdrag (features) har ordet "bilen".
 • Vad är morfologisk generering?

  Läsanvisningar

 • Skumma 3.1 i Jurafsky & Martin.
 • Läs 3.2 i Jurafsky & Martin, kombinera med Ahrenbergs kompendium.
 • De formella defintionerna av ändliga automater och transduktorer behöver ni inte kunna, men ni bör känna igen dem.
 • Läs 3.3, 3.4 och 3.6 i Jurafsky & Martin.

  Exempel på tentafråga

  Fråga

  Beskriv ett par egenskaper hos mänskliga språk som gör automatisk morfologisk analys bökig.

  Svar

  Språk böjer ord oregelbundet och på många olika sätt: infix mitt inne i ord, eller stamförändringar (dricka-drack) eller stamutbyte (vara, är/ liten, mindre). Men det mesta går att ordna, eftersom det sällan kommer till nya oregelbundenheter. En del språk har komplicerade och oförutsägbara avlednings- och sammansättningsregler; en del har enkla och förfärligt vanliga sammansättningar. Svenska är ett exempel på det senare. Det kan bildas nya ord utan förvarning lite hursomhelst. Många språk, oavsett hur komplex deras morfologi är i övrigt, är besvärliga att ha att göra med för böjningsmönstren är alldeles för lika mellan olika ordtyper. På svenska är verbpresens och substantivplural samma ändelse, till exempel. Det räcker inte med information om ändelsen för att avgöra om "gillar" är verb eller substantiv.

  Uppsatsuppgifter

  Tvånivåmodellen

  Redogör för vad tvånivåmodellen är och hur den kan användas för att beskriva svenskans (eller annat språks) morfologi.

  En enkel stemmer för svenska

  Bygg en enkel "stemmer" för svenska. Implementera några regler (i valfritt språk/verktyg) som plockar bort ändelser från till exempel substantiv och verb. Se till exempel till att substantivet "bilen" och verbet "bila" kommer ner till samma stam. Redovisa regler och beskriv dina erfarenheter. Hämta inspiration från till exempel Porters Stemming Algorithm, se Appendix B i Jurafsky & Martin.

  PC-KIMMO

  Utforska PC-KIMMO och tvånivåmorfologi. I PC-KIMMO kan man skriva sina egna tvånivåregler. PC-KIMMO kan laddas ner här . Implementera några regler och lexikala poster för svenska. Beskriv dina erfarenheter av PC-KIMMO och presentera några olika regler.

  Svenska ord

  Här är ett projekt, Svenska ord, med demonstrator som skall göra svensk morfologi tillgänglig för alla.

  ^ Upp till kursplanen.


  Sidansvarig: Ola Knutsson <knutsson@nada.kth.se>
  Senast ändrad 5 september 2002
  Tekniskt stöd: <webmaster@nada.kth.se>