Nada

2D1425, Datorseende, avancerad kurs, 5 poäng

(Bildbaserad visualisering och klassificering )

Aktuell kursomgång: period 4 05/06

Kursledare: Stefan Carlsson
Datorpostadress(er): stefanc@nada.kth.se

Allmän kursbeskrivning

Ny kurs som ersätter 2D1424 Datorgeometri i bildanalys och visualisering. Kursen behandlar grundläggande teori, modeller och metoder för geometriska och statistiska beräkningar i bildanalys och datorseende.

En central del i kursen är datorgeometri, dvs. problemet att bygga 3D-modeller från flera kamerabilder av en scen eller ett objekt. Det kan vara byggnader eller människor i rörelse m.m. Dessa 3D-modeller kan sedan betraktas från en godtycklig position i rummet. Problemet att automatiskt hitta korresponderande punkter i bilder kommer att behandlas i anslutning till 3D rekonstruktion men också bildigenkänning.

Kursen tar också upp statistiska metoder for igenkänning. Det kan gälla skrivtecken, 3D objekt eller händelser. I huvudsak studeras metoder som bygger på automatisk inlärning från exempeldata. Vi kommer att gå igenom grundläggande teori för detta samt algoritmer tillämpade på verkliga data.

Även aktivt seende tas upp. Aktivt seende är det vi människor har och som gör att vi kan sålla bland den visuella information vi tar in och t.ex. följa något som rör sig. Kursen är upplagd utifrån en föreläsningsserie och examineras med labbar och hemuppgifter.

Förkunskapskrav:

Grundkurs i linjär algebra. 2D1421 samt grunskurs i matematisk statistik D.v.s. kännedom om begrepp som vektor, matris, egenvärde, egenvektor, linjära ekvationssystem, sannolikhetsfördelningar, statistiska parametrar, väntevärde, varians, korrelation

Detta är INTE en fortsättningkurs. Bildbehandling och datorseende är EJ nödvändig som förkunskap.

Den är ett bra komplement liksom kurser i signalbehandling eller datorgrafik. Kursen handlar om att uttnyttja information som extraherats ur bilder i syfte att åstadkomma visualisering och/eller klassificering. Vi kommer att gå igenom den specifika bildbehandling som krävs för detta. Kursen ges i period 4 med Stefan Carlsson, stefanc@nada.kth.se, som kursledare.

Den första delen av kursen handlar om att beräkna 3D modeller från flera kamera bilder.
Här är ett par exempel


se image

se image

3D-modell av stadshuset från
flera kamera bilder
Liknande mer detaljerade 3D rekonstruktioner

3D-modell av trestegs
hoppare från två kameror


Den andra delen av kursen handlar om igenkänning av scener och objekt från kamera bilder.
Här är ett par exempel


se image

se image

Igenkänning av fotgängare
från bilbaserad kamera
(Mobileye)

Igenkänning av framförvarande
fordon från bilbaserad kamera
(Mobileye)


Studiehandbokstexten på svenska och engelska.

^ Upp till Nadas kurser.


Sidansvarig: <stefanc@nada.kth.se>
Senast ändrad 18 januari 2006
Tekniskt stöd: <webmaster@nada.kth.se>