Nada

Morfologi

Föreläsning tisdag den 9 september 2003, 10-12 i sal L21

Ola Knutsson

Innehåll

Litteratur

  • Ljusbilder i pdf från föreläsningen den 2 september 2002.
  • Bredvidläsningslitteratur

    Richard Sproat. 1992. Morphology and Computation. MIT Press.

    Exempel på tentafråga

    Fråga

    Beskriv ett par egenskaper hos mänskliga språk som gör automatisk morfologisk analys bökig.

    Svar

    Språk böjer ord oregelbundet och på många olika sätt: infix mitt inne i ord, eller stamförändringar (dricka-drack) eller stamutbyte (vara, är/ liten, mindre). Men det mesta går att ordna, eftersom det sällan kommer till nya oregelbundenheter. En del språk har komplicerade och oförutsägbara avlednings- och sammansättningsregler; en del har enkla och förfärligt vanliga sammansättningar. Svenska är ett exempel på det senare. Det kan bildas nya ord utan förvarning lite hursomhelst. Många språk, oavsett hur komplex deras morfologi är i övrigt, är besvärliga att ha att göra med för böjningsmönstren är alldeles för lika mellan olika ordtyper. På svenska är verbpresens och substantivplural samma ändelse, till exempel. Det räcker inte med information om ändelsen för att avgöra om "gillar" är verb eller substantiv.

    Uppsatsuppgifter

    Tvånivåmodellen

    Redogör för vad tvånivåmodellen är och hur den kan användas för att beskriva svenskans (eller annat språks) morfologi.

    En enkel stemmer för svenska

    Bygg en enkel "stemmer" för svenska. Implementera några regler (i valfritt språk/verktyg) som plockar bort ändelser från till exempel substantiv och verb. Se till exempel till att substantivet "bilen" och verbet "bila" kommer ner till samma stam. Redovisa regler och beskriv dina erfarenheter. Hämta inspiration från till exempel Porters Stemming Algorithm, se Appendix B i Jurafsky & Martin.

    PC-KIMMO

    Utforska PC-KIMMO och tvånivåmorfologi. I PC-KIMMO kan man skriva sina egna tvånivåregler. PC-KIMMO kan laddas ner här . Implementera några regler och lexikala poster för svenska. Beskriv dina erfarenheter av PC-KIMMO och presentera några olika regler.

    Svenska ord

    Här är ett projekt, Svenska ord, med demonstrator som skall göra svenska morfologi tillgänglig för alla.

    ^ Upp till kursplanen.


    Sidansvarig: Ola Knutsson <knutsson@nada.kth.se>
    Senast ändrad 21 augusti 2003
    Tekniskt stöd: <webmaster@nada.kth.se>