Nada

2D1420, Datorseende, grundkurs, 5 poäng

Aktuell kursomgång:period 3 03/04


Vi människor använder synen som en de främsta källorna till att inhämta information om omvärlden. Ämnet datorseende handlar om att införliva motsvarande funktionalitet i seende datorer, dvs att utveckla algoritmer och beräkningsmodeller som automatiskt bearbetar och extraherar information ur (digitala) bilder.

Datorseende, grundkurs ger en introduktion till datorseende samt grunderna i de relaterade ämnesområdena bildanalys, bildbehandling och bildkompression. Avseende framtidsutsikter, är dessa ämnesområden för närvarande i mycket snabb utveckling, och ämnet kan förväntas få en alltmer ökande betydelse i takt med att informationsystem utvecklas och bildinformation och dess bearbetning blir allt viktigare. Bland tillämpningsområden kan nämnas seende robotar, medicinsk bildbehandling, automatisk inspektion, tre-dimensionell modellering, människa-dator-interaktion, avancerad bildkompression samt tolkning av flyg- och satellitbilder.

I Datorseende, grundkurs får du först lära dig grundläggande bildoperationer för att framhäva och extrahera olika typer av information från digitala bilder. Exempel på detta är grånivåtransformationer, filtreringsmetoder och detektion av särdrag såsom kanter och regioner (segmentering). Dessa metoder är av generell natur och är användbara som komponenter i såväl enklare system för datoriserad bildanalys, exempelvis automatisk avsyning och medicinsk bildbearbetning, som i mer avancerade seende system.

I den genuina datorseendedelen av kursen studerar vi olika grundmetodiker för att härleda tredimensionell information om omvärlden utgående från visuell information. Problemområden som behandlas är formbestämning från textur-, skuggnings-, stereo- och rörelseledtrådar. Som exempel kommer det att visas hur vi från naturliga antaganden kan angripa det rent matematiskt sett obestämda problemet att skapa tredimensionella tolkningar från tvådimensionella bilddata. Vidare visas hur man kan definiera storheter (s.k invarianter) i tvådimensionella bilder vars numeriska värden inte påverkas av perspektivavbildningen.

Som en utblick mot seende robotar kommer vi bla att se hur en rörlig robot kan undvika att kollidera med hinder genom att endast beräkna en enkel deskriptor (lokal tid till kollision) direkt från bilddata. Vi kommer också att studera metoder för objektigenkänning, deras komplexitetsproblem och begränsningar.

Sammanfattningsvis är ämnet datorseende starkt interdisciplinärt och har nära anknytning till teorier för biologiskt och mänskligt seende. I kursen kommer ett antal sådana kopplingar att illustreras. Vidare ingår en orientering om mänskligt seende (perception).

Datorseende, grundkurs ingår i kompetensinriktningen Autonoma system samt i fördjupningsblocket Datorseende med robotik och ges av forskningsgruppen Computational Vision and Active Perception Laboratory vid NADA. Denna forskningsgrupp (vars namn förkortas CVAP) omfattar cirka 30 personer som forskar i grundläggande teorier för datorseende samt deras tillämpningar mot robotik, medicinsk bildbehandling och visuell perception. För ytterligare information om CVAPs verksamhet, se gärna presentationen på vår egen (mer forskningsorienterade) hemsida.


Förkunskaper

Väl inhämtade grundläggande kunskaper i tillämpad matematik och datalogi, motsvarande de obligatoriska kurserna i matematik, datalogi och numerisk analys. Ytterligare någon kurs i signalbehandling och/eller numerisk analys kan rekommenderas. Kursen använder sig av förkunskaper över ett relativt brett spektrum av problemlösning i tillämpad matematik och datalogi, och lämpar sig därför bäst att läsas i fjärde årskursen.

Formell kursbeskrivning (det vill säga texten i studiehandboken).

Andra kurser som NADA ger för teknologer.

Kursomgång: period 3 02/03

Tidigare kursomgångar och resultat:

Informationen ändrades senast 17 november 2003. Kursledare är Danica Kragic.

^ Upp till kursöversikt.


Sidansvarig: <danik@nada.kth.se>
Senast ändrad 17 november 2003
Tekniskt stöd: <webmaster@nada.kth.se>