Nada

Textgenerering


Hercules Dalianis

Kortfattat innehåll

Textgenerering är läran om hur man automatiskt skapar en sats eller (text)diskurs från någon datorrepresentation i motsats till parsning där man går från text till representation. Föreläsningen kommer att handla om tekniker och metoder för hur man genomför textgenerering.

Kursmaterial

Jurafsky & Martin kap 20
Hur genererar datorn text? av Hercules Dalianis.

Ljusbilder från föreläsningen

Textgenerering, PDF

Innehåll

Man brukar dela upp textgenereringsteknikerna i två stora block Vad som ska sägas och Hur det ska sägas eller djupgenerering och ytgenererering. Djupgenereringen innehåller beslut som: Hur ska texten byggas upp? Vilka element ska den innehålla? Vad vill en läsare av texten veta? Vad vet datorn om läsaren? Ytgenereringen innehåller beslut som: Vilka syntaktiska strukturer och ord ska användas?

Textgenering kan användas för slutsteget i maskinöversättning (dvs från representation till text) för att automatiskt skapa väderprognoser från väderdata eller börsinformation från börsdata, eller för validering av formella specifikationer mm. En viss fördjupning kommer att ske om hur textgenerering kan tillämpas för parafrasering och förklaring/validering av standardiserade objektmodeller som UML och STEP/EXPRESS.

För den intresserade finns det även tillgång till en textgenerator kallad ASTROGEN som går att köra på i SICStus Prolog.

Instuderingsfrågor

Vad är skillnaden mellan djup- och ytgenerering?
Vad är en användarmodell i textgenerering?
Vad är parafrasering?

Exempel på tentafråga

Fråga

Vad är textplanering i textgenerering?

Svar

Textplanering är den del i djupgenereringen där textens diskurs bestäms dvs hur ska de olika ingående satserna skall ordnas så att diskursen blir koherent. Påverkande faktorer är givetvis vilken fråga användaren ställer och vilket budskap som ska skapas.

^ Upp till kursplanen.


Sidansvarig: Hercules Dalianis <hercules@nada.kth.se>
Senast ändrad 19 augusti 2002
Tekniskt stöd: <webmaster@nada.kth.se>