Nada

^ Upp till kursens hemsida.

Aktuell information om 2D1425, Datorseende, avancerad kurs

period 4 2006

(Bildbaserad visualisering och klassificering)

Senaste nytt

2006-08-14

Omtentamen augusti


Följande gäller: De som ej var godkända på den ordinarie tentamen English version i maj kan redovisa lösningarna till denna skriftligen och muntligen till mig. För detta krävs att ni bokar tid via email: stefanc@nada.kth.se. Följande tider finns:
Tisdag 29 augusti 14-15
Tisdag 29 augusti 15-16
Onsdag 30 augusti 14-15
Onsdag 30 augusti 15-16
Torsdag 31 augusti 14-15
Torsdag 31 augusti 15-16
Fredag 1 september 14-15
Fredag 1 september 15-16

2006-06-11
Tentamen är rättad

Ex-jobb

2006-06-11

EXAMENSARBETEN MED ANKNYTNING TILL KURSEN


Bägge dessa exjobb handlar i huvudsak om klassificering fast de har lire olika inriktning.Den som är intresserad kan höra av sig direkt till mig
Stefan

MASTER THESIS SUBJECTS LIKED TO THE COURSE


These are both about classification. If you are interested, contact me and I will give you a description
Stefan

Exempelbaserad följning av mänsklig rörelse

Vid s.k. motion capture estimeras position hos specifika kroppspunkter på en persom. Denna information kan sedan användas till att analysera rörelsens karaktär eller att beräkna en 3D animerad modell. I laboratoriemiljö appliceras specifika markeringar på den peson för vilken rörelsen ska uppmätas. Personems rörelse registreras därefter med hjälp av video. I mer komplicerad miljö såsom sport evenemang är detta i allmännhet inte möjligt. Ett centralt problem i datorseende är därför att beräkna rörelsen för specifika kroppspunkter direkt från en videoinspelning, utan att applicera markeringar. Syftet med det här examensarbetet är att studera möjligheten till detta genom att konstruera en algoritm som beräknar en avbildning direkt från en bild till en uppsättning koordinater för kroppspunkter. Metodiken går ut på att först konstruera ett antal exempel på en sådan avbildning genom att välja ut kroppspunkter manuellt i ett antal bilder. Med hjälp av dessa exempel så konstueras en algoritm för avbildningen En lämplig typ av algoritm att använda baserar sig på support vector machines, d.v.s. problemet att identifiera kroppspunkter behandlas som ett klassificerings problem


Spatial integration av lokal information vid igenkänning

Vid bildbaserad igenkänning av klasser av objekt eller händelser så är den vanligaste metodiken att extrahera information om lokala egenskaper i bilden vilka är karakteristiska för klassen i fråga. Det kan t.ex. gälla att hitta ett öga då man letar efter ansikten eller ett hjul då man letar efter bilar. Genom att sammanställa ett flertal lokala egenskaper som extrahereas ur en bild så uppnår man en större säkerhet vid igenkänningen. Ett väsentligt problem är då att utnyttja de spatiala relationerna mellan de lokala egenskaperna, t.ex. det faktum att ögonen befinner sig på ett visst avstånd ovanför munnen i ett ansikte. Detta är i allmännhet mycket komplicerat eftersom alla lokala egenskaper inte alltid framträder i en bild. Examensarbetet går ut på att utföra en systematisk studie av värdet av spatial integration av lokal bildinformation vid igenkänning. Genom att välja ut lokal information manuellt från ett antal bilder av ett antal klasser så undvikes problemet med att alla lokala egenskaper inte framträder. De utvalda lokala egenskaperna sammanställs till en datavektor och på dessa appliceras en algoritm för klassificering. t.ex. SVM eller ADA-boost. Vid konstruktionen av data vektorn kan man välja att inkludera spatiala relationer eller inte. Genom att jämföra prestanda för klassificering med och utan spatiala relationer kan värdet av detta bestämmas.


2006-06-11
Jag skulle uppskatta om ni ville fylla i kursvärderingen Kursutvärdering 2006
Tryck här för att hämta kursenkäten:
2006-05-21
Tentamen kommer (med största sannolikhet) vara rättad 2 juni
För att få betyg på kursen så krävs det att ni registrerar er om ni inte reda gjort detta.(se kursregistrering)

2006-05-15

Examination 17 may

All material handed out and handbooks are permitted during the exam

Tentamen 17 maj

Allt utdelat kursmaterial samt ev. handböcker , är tillåtna på tentamen

2006-05-04
Nytt tillfälle för redovisning av lab 1: Fredag 5 maj 10-12, Spelsalen, (sista chansen för bonuspoäng)

Material från föreläsningarna 16 och 17 kommer att delas ut på föreläsningen 4 maj och finns därefter tillgängligt på stud.exp.

Inlämningsuppgiften i klassificering skall vara en skriftlig rapport med förklaringar och motiveringar. Den kan skickas elektroniskt till Staffan Ekvall ekvall@nada.kth.se eller lämnas till mig på föreläsningen

2006-04-16
Schemat för föreläsningarna i klassificering har uppdaterats

2006-04-04
Lösningar till problemsamlingen och två extentor finns utlagda vid studentexpeditionen

Schemat för föreläsningarna har uppdaterats så att föreläsningarna i klassificering inleds direkt efter påsk, tisdagen 18 april.

Kurslitteratur:

Följande material kommer att delas ut vid föreläsningarna och även läggas ut vid NADA:s studentexpedition.

1. Föreläsningsanteckningar datorgeometri:

För första delen som behandlar 3D rekonstruktion från kamerabilder så används följande kompendium: Geometric Computing in Image Analysis and Visualization (Uppdaterat mars 2005)

2. Föreläsningsanteckningar klassificering:

För den senare delen som handlar om metoder för klassificering så kommer vi att använda ett urval av föreläsningarna som finns på: Prism Lectures, Pattern recognition .
Dessa kommer att uppdateras och kompletteras med material som behandlar specifika igenkänningsproblem i datorseende såsom handskrivna tecken, ansikten, människor och objekt i allmänhet (Kommer att delas ut)

3. Laboration i visualisering:

Lab1: Geometry and Visualization

4. Inlämningsuppgift klassificering

Inlämningsuppgift1: Homework assignment

5. Problemsamling, extentor i datorgeometri och handskrivna lösningar

Problemsamling

Datorgeometritentan som gavs i maj 2002 : Tentamen 020527 (postscript) Examination (English) 020527 (postscript)
Datorgeometritentan som gavs i augusti 2002 : Tentamen 020821 (postscript)
Datorgeometritentan som gavs i maj 2003 : Tentamen 030528 (postscript) Examination (English) 030528 (postscript)
Datorgeometritentan som gavs i augusti 2003 : Tentamen 030827 (postscript) Examination (English) 030827 (postscript)
Datorgeometritentan som gavs i maj 2004 : Tentamen maj 04 (postscript) Examination (English) 030528 (postscript)
Datorgeometritentan som gavs i aug 2004 : Tentamen aug 04 (postscript)

Övrigt, ej obligatoriskt, material

Orienteringsmaterial om VRML VRML overview (slides)

För den intresserade finns böcker som behandlar kursinnehållet och dessutom ger en fördjupning.

För geometri och visualiseringsdelen rekommenderas:
Multiple View Geometry in Computer Vision,
Richard Hartley and Andrew Zisserman, Cambridge University Press, June 2000

Föreläsningarna om klassificering följer i huvudsak innehållet i boken:
Pattern Classification
Richard O. Duda, Peter E. Hart and David G. Stork Wiley Interscience

Föreläsningar och laborationer period 4 2006

Preliminärt innehåll och disposition (Detta kan komma att uppdateras under kursens gång.)

Ons 15 mar 13-15 D31 Frl 1. Introduktion och översikt. (ppt)
Visualisering
Tor 16 mar 13-15 D35 Frl 2. Exempel på 3D rekonstruktion från kamerabilder. Kameramodeller och projektioner: parallel och perspektiv projektion, Lec. Notes 1-8. Roterade kameror, enkel bild mosaik, enkel minsta kvadrat uppskattning av parameterar Lec. Notes 9-14
Fre 17 mar 10-12 D34 Frl 3. Externa och interna kameraparametrar, linjära avbildningar bild till bild, generell bildmosaik, generell behandling av minsta kvadrat problem Numerisk behandling av linjära problem: singulärvärdesuppdelning (SVD), Lec. Notes 14-21 Lec. Notes 48-56
Tis 21 mar 10-12 E32 Frl 4. SVD (fortsättning), Problemlösning
Tor 23 mar 13-15 D41 Frl 5. 3D Rekonstruktion från två kameror: translaterade kameror , två kalibrerade kameror, kalibrering m.h.a känt 3D objekt, kameraparametrar från projektionsmatris, Lec. Notes 23-27
Tis 28 mar 10-12 E32 Frl 6. Essentiella matrisen E, projektionsmatriser från E, allmänt om kalibrerad rekonstruktion Estimering av E matrisen ,Problemlösning Lec. Notes 27-34 Lec. Notes 58 - 60
Ons 29 mar 13-15 D41 Frl 7. Okalibrerad rekonstruktion, fundamental matrisen F, projektiva transformationer, projektionsmatriser från F Lec. Notes 34-40
Fre 31 mar 10-12 5O1Spe Lab handledning och redovisning
Tor 30 mar 13-15 D31 Frl 8.Rekonstruktion av ytor och rendering: texturavbildningar, bild baserad rendering, triangulering av punktmängder, interpolation, Lec. Notes 41-47
Tis 4 apr 10-12 E32 Frl 9. Plana ytor i två kameror, allmänna linjära avbildningar, Parallell projektion, faktorisering av godtyckligt antal kameror Lec. Notes 48 - 51
Tor 6 apr 13-15 E32 Frl 10. Automatisk beräkning av punkt korrespondens, robust statistik, automatisk 3D rekonstruktion, exempel på program, demonstrationer Repetition, tentamensräkning
Igenkänning och klassificering
Tis 18 apr 10-12 E32 Frl 11. Grundläggande problem vid mönsterigenkänning prism1
Ons 19 apr 13-15 D41 Frl 12. Bayesianskt beslut, binär klassificering, Icke parametrisk klassificering, flera klasser, nearest neighbour klassificering, prism2, prism4, prism5 prism8
Tor 20 apr 13-15 D31 Frl 13. principalkomponenter,identifiering av ansikten, (eigenfaces), Linjär diskriminantanalys prism9 prism10
Fre 21 apr 10-12 5O1Spe Lab handledning och redovisning
Tis 25 apr 10-12 E32 Frl 14. Linjära diskriminantfunktioner, Neurala nätverk prism17 prism18
Tor 27 apr 13-15 D31 Frl 15. Klustrering prism14 prism15
Fre 28 apr 10-12 5O1Spe Lab handledning och redovisning/Inl. uppgift redovisning. Redovisad lab 1 ger 1 bonuspoäng (av 15) på tentamen
Tis 2 maj 10-12 E32 Frl 16. Exempel på bildoperationer och särdragsextraktion, Histogram, transformationer
Tor 4 maj 13-15 D41 Frl 17. Inlärning,boosting, exempel på detektering av ansikten och fotgängare
Fre 5 maj 10-12 5O1Spe Lab handledning och redovisning Redovisad lab 1 ger 1 bonuspoäng (av 15) på tentamen
Mån 8 maj 13-15 D41 Frl 18. Support Vector Machines, exempel på klassificering av ansikten och igenkänning av handskrift. prism21 prism22
Tis 9 maj 10-12 E32 Frl 19. Översikt av aktuella problem inom igenkänning. prism21 prism22
Tor 11 maj 13-15 5O1Spe Redovisad inlämningsuppgift ger 1 bonuspoäng (av 15) på tentamen
Ons 17 maj 8 - 13 E31, E33 TENTAMEN

Laborationer och inlämningsuppgifter

Lab 1: 3D rekonstruktion
Inlämningsuppgift: Klassificering

Lärare

Kursledare och föreläsare är Stefan Carlsson, stefanc@nada.kth.se. Mottagningstid efter överenskommelse.
Assistenter är Hugo Cornelius hugocnada.kth.se och Staffan Ekvall ekvallnada.kth.se

Kurslitteratur

Kurslitteraturen ska läsas på egen hand parallellt med kursen.

Kursregistrering

Om du vill gå kursen måste du anmäla det i förväg till kansliet/studievägledningen för ditt utbildningsprogram. Ingen förhandsanmälan ska göras till Nada. Det finns ingen platsbegränsning.

Så snart kursen börjat måste du registrera dig på den. Detta görs med kommandot

res checkin dsak06

på någon av Nadas unixdatorer. Registrera dig så snart som möjligt efter att kursen börjat!

Kurskoden är:

2D1425

Kursomgångsförkortningen är

dsak06

För din egen skull bör du också ge kommandot

course join dsak06

Detta kommando gör tre saker:

När du är klar med kursen ger du kommandot

course leave dsak06

för att återställa allt.

Laborationer

Labbkursen består av en laboration som görs i grupper om två personer. Enstaka labbar får inte sparas till annan kursomgång. Fullgörs inte alla labbarna inom ett år från kursens slut har kursledaren rätt att kräva att alla labbar görs om. Elever som vill jobba ensamma får det, men vid redovisningstillfällen har tvåpersonersgrupper företräde.

Nadas terminalsalar

Kårkortet ger tillträde till Nadas terminalsalar dygnet runt, men terminalsalarna är dagtid ofta bokade för andra kurser. Ge kommandot

local-info tider

så får du reda på när det är bokat.

Det finns arbetsmiljöregler för terminalsalarna. Dessa talar om hur man ska bete sig i salarna.

Allmän handledare finns tillgänglig i terminalsalarna på plan 4 vissa tider varje vardag.

Kurskatalog

Kursen har en katalog på Unixdatorerna: /info/?. På denna katalog finns textfiler, programskelett, program och liknande som har med kursen att göra.

Köra hemma

Om du har en dator och ett modem hemma kan du koppla upp dig med modem mot Nadas datorer hemifrån. Information om hur du gör finns här.

Synpunkter på kursen

Eftersom denna kurs kommer att ges för många elever under flera års tid är vi tacksamma för synpunkter på kursen. En datorstödd kursutvärdering kommer att göras. Synpunkter kan lämnas till lärarna.

^ Upp till kursens hemsida.


Sidansvarig: Stefan Carlsson <stefanc@nada.kth.se>
Senast ändrad 14 augusti 2006
Tekniskt stöd: <webmaster@nada.kth.se>