Upp till kursens hemsida.

Aktuell information om 2D1418, Språkteknologi

Senaste nytt

Kursanalysresultaten finns här !

Alla godkända på tentan ! resultat finns på plan 3 anslagstavlan,
Tentor i studentexpeditionen


Jag vill tacka för en trevlig kurs och skulle bli glad om ni kunde fylla i kursenkäten

Tryck här för att hämta kursenkäten:


Tenta 17 oktober 2002 (PDF)

Tentalösningar 17 oktober 2002 (PDF)


För att få tentera måste ni skicka in era uppsatser


Att skapa PDF:ar gör så här:

På Nadas Unixdatorer finns programmet distill som konverterar från Postscript till PDF.
Skriv

module add distiller

distill fil.ps

för att konvertera fil.ps till fil.pdf.

Ett dokument som ska konverteras till PDF bör bara ha skalbara typsnitt.
Om dokumentet är skrivet i LaTeX får man enklast en PDF-fil med skalbara typsnitt genom att skriva

module add tex

latex2pdf fil.tex

Eller använd programmet Acrobate Distiller på Mac och PC.

Nyare versioner av Word har inbyggd Word till PDF konvertering


Redovisningar inlämningsuppgift mån-tid 7-8 okt 2002
Ni har 15 min på er att presentera.
10 min prat och 5 min frågor från publiken.
Vi kör i 2+ timmars pass, ni behöver bara närvara på "ert" pass
Jag vill ha en PDF/HTML fil eller länk till en PDF/HTML till inlämningsuppgiften

Kolla lite längre ner på denna text för tid och plats

Martin Hassels ljusbilder, textsammanfattning:
http://www.nada.kth.se/~xmartin/kurser/spraktek/textsam.pdf
Textsammanfattningslabben som utgick för de som vill titta på den:
http://www.nada.kth.se/kurser/kth/2D4130/laborationer02/labtextsam.html

Textgenerings-OH-bilder, stort format:
http://www.nada.kth.se/kurser/kth/2D1418/forelasningar02/textgenStoraOH.pdf

Nu är det dags att välja en uppsats eller en labbuppgift.
Ni får gärna göra den två och två
Maila mig Hercules - era namn, titel på uppgift och när ni vill redovisa
(se schemat på webben)

Labb 5 Textsammanfattninglabben utgår och ersätts av ytterligare en informationssökninglabb

Vi har from nu, 13 sept, två labbsalar Matsalen och Konsthallen till vårt förfogande.

Schemat som gäller för kursen är detta
http://www.nada.kth.se/kurser/kth/2D1418/kursplan02.html
dvs det som låg i kursbunten


Redovisning av inlämningsuppgift

Måndag den 7 oktober 2002, kl 10-12
Birgitta Bokinge - Ordföljd, Ordföljdskartor
Sannamari Huhta - Tornedalsfinska, Meän kieli
Daniel Kristensen - Textsammanfattningstekniker
Per-Jonny Käck och Petrus Wrangö - Stava-labben
Niklas Vargensten -Kan datorn förstå någonting egentligen
Martin Gülich och Joel Sjöstrand - Ett granskningsverktyg för Word med Visual Basic.
Fredrik Bergholtz & Florent Delgoulet - "Text=>TPEG, Automatic generation of language independent traffic.

Måndag den 7 oktober 2002, kl 13-15
Olivier Chadenat och Thibaut Raballand - Predictive Text for mobile devices with reduced keyboards
Mark Peldius och Albin Finne - Persiska
Miguel Tena - The meanings of the word "language"
Johanna Eriksson - Särskrivning
Per-Anders Staav, Max Laager och Stefan Freyhult - Att minimera inmatningen av text till ett dialogsystem: en praktisk studie.
Jonas Skubic - Ordklasstaggning

Tisdag den 8 oktober 2002, kl 10-12
Robert Zettinger -Klustring - hur bra fungerar det och vad kan det användas till?
Carl Stångberg - "Språkverktygens konsekvenser"
Sjur Bakka - Svadagenerator - Generator of pseudo-random text with a 'high fog index'.

Tisdag den 8 oktober 2002, kl 13-15
Malin Bergenstråhle och Johan Kannala - Anpassning Astrogen. 1, 2, 3
Emma Johansson - Hur påverkar språk och tänkade varandra
Benny Ferander och Stefan Westlund - Internationalisering/lokalisering på webben
Fredrik Söderström - Taltaggning
Bassam Saffar & Samuel Härgestam - Rangordning av rättningsförslag med ordprediktionsmetoder
Veronika Mattsson - Tvåspråkighet
Jill Rhoads och Stig Erik Blomkvist - Fonetisk Reduktion
Josefin Hallberg - En utredning av vilka lingvistiska stöd som finns hos några populära sökmotorer.

Lärare

Kursledare är Hercules Dalianis Mottagningstid är måndagar klockan 14.00-15.00, telefon 08-790 91 05. Övriga föreläsare är Viggo Kann, Ola Knutsson och Martin Hassel. Dessutom medverkar Mikael Goldman , Peter Svanberg, Rickard Domeij,Anders Green, Jonas Sjöbergh och Rolf Carlsson, som gästföreläsare.

Kurslitteratur

Kurslitteraturen ska läsas på egen hand parallellt med kursen. Kursboken ger en allmän introduktion till hela området men bara en del av kursinnehållet. Därför rekommenderar vi alla att följa kursen aktivt och gå på alla föreläsningar.

Kursbok

Speech and Language Processing av Jurafsky & Martin, ISBN 0-13-095069-6 Prentice Hall, finns på kompendieförmedlingen. Pris cirka 500 kr.

Läsanvisningar kursbok kopplade till föreläsningar

(Kursbunten kompletterar kursboken se nedan)

Föreläsning Kapitel i kursboken
Formella språk och syntaxanalys 2, 9, 10
Morfologi 3
Stavningskontroll 5
Särdrag, lexikon och syntax 8, 9, 10, 11
Syntax och formalismer 9, 10
Parsning 1 10
Parsning 2: Constraint Grammar 8.4
Språkstatistik 1: Ordfrekvenser 6
Språkstatistik 2: Informationsteori och Markovmodeller 6
Språkstatistik 3: Ordtaggning 8
Semantik 14, 15, 16
Pragmatik, Diskurs och Talakter 18, 19
Informationssökning 17
Textgenerering 20
NL-tillämpningar 21
Textsammanfattning 17.4
Augustprojektet Talteknologi 7

Kursbunt

Kursbunten kan köpas på första föreläsningen och därefter på Nadas elevexpedition för 100 kr. Papper som delas ut under kursens gång kommer att finnas i en pärm i hyllan utanför expeditionen.

Kursuppläggning

Varje vecka hålls två föreläsningar, en tillämpningsföreläsning och en terminalövning. På föreläsningarna gås teorin igenom. På tillämpningsföreläsningarna visas hur teorin kan tillämpas i en språkteknologisk produkt. På terminalövningarna får du själv tillämpa teorin i liten skala.

Kursplan

Följande kursplansschema visar vad som kommer att behandlas när i kursen. Varje föreläsning och labb presenteras kort på en egen webbsida. Ha för vana att läsa igenom den webbsidan innan du går till undervisningen, för där står vilken litteratur som kommer att gås igenom och ifall det är något du bör förbereda först.

Kursregistrering

Om du vill gå kursen ska du anmäla det i förväg till kansliet/studievägledningen för ditt utbildningsprogram. Ingen förhandsanmälan ska göras till Nada.

Endast de teknologer som studievägledningen lagt in i Ladok som studerande på en kurs kan godkännas på kursen. Vill du läsa en kurs som inte är obligatorisk för dig måste du alltså först välja kursen vid ditt programs studievägledning som måste godkänna ditt val.

Så snart kursen börjat måste du registrera dig på den. Detta görs med kommandot

res checkin sprakt02

på någon av Nadas unixdatorer. Registrera dig så snart som möjligt efter att kursen börjat!

För din egen skull bör du också ge kommandot

course join sprakt02

Detta kommando gör tre saker:

När du är klar med kursen ger du kommandot

course leave sprakt02

för att återställa allt.

Laborationer

Labbkursen består av fem laborationer och en obligatorisk demo som görs i grupper om högst två personer. Dessa labbar utgör kursmomentet LAB1, värt 2 poäng.

Enstaka labbar får inte sparas till annan kursomgång. Om du inte fullgör alla fem labbarna inom ett år från kursens slut har kursledaren rätt att kräva att du gör samtliga labbar i den nya kursomgången.

Bonuspoäng

Vi tillämpar ett bonussystem för att uppmuntra eleverna att ligga i fas med undervisningen. För varje labb som redovisas på rätt redovisningstillfälle erhålls en bonuspoäng. Summan av dessa poäng adderas till den på tentan uppnådda poängsumman. Detta gäller ett kalenderår räknat från kursstart. Bonuspoäng kan endast fås det år som labbresultatet rapporteras. När du är inloggad kan du se vilka labbar du är godkänd på genom att ge kommandot

res show sprakt02

Hederskodex

Grundregeln är att det jobb du gör i kursen (labbar, inlämningsuppgifter, tentor m.m.) ska du göra själv, förutom att labbarna kan göras i tvåmannagrupper. Vid redovisning av labbar ska båda i gruppen kunna redogöra i detalj även för vad labbkompisen skrivit.

Ibland, speciellt när man skriver program, kan det vara nödvändigt att fråga någon annan (en kamrat eller en handledare) om hjälp med att hitta fel. Detta är tillåtet förutsatt att du uppfyller följande villkor.

Varje annan form av samarbete och utnyttjande av andras lösningar betraktas som ett brott mot hederskodexen och kan bestraffas, t ex genom att du förlorar alla bonuspoäng eller får göra en ny uppgift.

Detta är en översatt och omarbetad version av den hederskodex som används i kursen Introduction to computer science vid Stanford University. Den tillämpas i många av Nadas kurser.

Examination

Tid och plats för ordinarietentan är torsdagen den 17 oktober 2002, 08-13, sal D34.

Inga hjälpmedel får användas på tentan.

Kursmomentet TEN1 (värt 2 poäng) examineras i två delar:

Tentaresultatet anslås högst tre veckor efter tentan på institutionens anslagstavla på plan 3 (rakt under elevexpeditionen). Klagomål på rättning av tentan lämnas in skriftligen till kursledaren inom tre veckor från det att tentaresultatet anslagits.

Slutbetyget är medelvärdet av betygen på inlämningsuppgiften och den skriftliga tentan, avrundat uppåt.

Anmälan till tentan

Du behöver inte anmäla dig till tentan. (Tentaanmälan var tidigare obligatorisk för D- och E-teknologer men Nada använder sig inte av detta anmälningssystem längre.)

Kurskatalog

Kursen har en katalog på Unixdatorerna: /info/sprakt02. På denna katalog finns textfiler, programskelett, program och liknande som har med kursen att göra.

Nadas terminalsalar

Terminalsalarna ligger i östra delarna av borggårdshuset, ovanför sal D2 och D3. Musiksalen och Konsthallen med Sundatorer finns på plan 5 och Voljären och Terrariet med NT-datorer finns på plan 4. Det finns arbetsmiljöregler för terminalsalarna. Dessa talar om hur man ska bete sig i salarna.

Kommandot local-info plan5o (plan4o) talar om när terminalsalarna är bokade av andra kurser.

Endast D-elever har normalt tillträde med kårkortet till de östra terminalsalarna. Du som inte går på D kommer att få tillträde lagom till första terminalövningen om du checkar in på kursen under första kursveckan.

Synpunkter på kursen

Eftersom denna kurs kommer att ges för många elever under flera års tid är vi tacksamma för synpunkter på kursen. En datorstödd kursutvärdering kommer att göras. Synpunkter kan lämnas till lärarna.

Språktekniklänkar

NorDoknet (Nordisk språkteknologi)
Viggos samlade språktekniklänkar
.
Hercules länkar
Fredriks länkar.
NoDaLiNe - Nordisk datalingvistisk nettverk.
Knutpunkten - Språkteknologisk info-desk för EUROMAP.
Information Retrieval - C. J. van RIJSBERGEN


Upp till kursens hemsida.


Sidansvarig: Hercules Dalianis <hercules@nada.kth.se>
Senast ändrad 28 mars 2003
Tekniskt stöd: <webmaster@nada.kth.se>