2D1421 Bildbehandling och datorseende
Kursen ges läsåret 2005/2006 i period 3 med Danica Kragic som kursansvarig.
MASTER THESIS PROPOSALS
If not stated diferently on individual slides, contact
Dani
for more details.
Download the presentation .
Vad är datorseende?
Vi människor använder synen som en de främsta källorna till att
inhämta information om omvärlden. Ämnet datorseende handlar om
att införliva motsvarande funktionalitet i seende datorer, dvs
att utveckla algoritmer och beräkningsmodeller som automatiskt
bearbetar och extraherar information ur (digitala) bilder.
Kursen ger en introduktion till datorseende samt
grunderna i de relaterade ämnesområdena bildanalys,
bildbehandling och bildkompression.
Avseende framtidsutsikter, är dessa ämnesområden för närvarande
i mycket snabb utveckling, och ämnet kan förväntas få en alltmer
ökande betydelse i takt med att informationsystem utvecklas och
bildinformation och dess bearbetning blir allt viktigare.
Bland tillämpningsområden kan nämnas
seende robotar, medicinsk bildbehandling, automatisk inspektion,
tre-dimensionell modellering, människa-dator-interaktion,
avancerad bildkompression samt tolkning av flyg- och satellitbilder.
I kursen får du först lära dig grundläggande
bildoperationer för att framhäva och extrahera
olika typer av information från digitala bilder.
Exempel på detta är grånivåtransformationer,
filtreringsmetoder och detektion av särdrag
såsom kanter och regioner (segmentering).
Dessa metoder är av generell natur och är användbara
som komponenter i såväl enklare system för datoriserad
bildanalys, exempelvis automatisk avsyning och
medicinsk bildbearbetning, som i mer avancerade
seende system.
I den genuina datorseendedelen av kursen studerar vi
olika grundmetodiker för att härleda tredimensionell
information om omvärlden utgående från visuell information.
Problemområden som behandlas är formbestämning från
textur-, skuggnings-, stereo- och rörelseledtrådar.
Som exempel kommer det att visas hur vi från naturliga
antaganden kan angripa det rent matematiskt sett obestämda
problemet att skapa tredimensionella tolkningar från
tvådimensionella bilddata.
Vidare visas hur man kan definiera
storheter (s.k invarianter) i tvådimensionella bilder
vars numeriska värden inte påverkas av perspektivavbildningen.
Som en utblick mot seende robotar kommer vi
bla att se hur en rörlig robot
kan undvika att kollidera med hinder genom att
endast beräkna en enkel deskriptor (lokal tid till kollision)
direkt från bilddata.
Vi kommer också att studera metoder för
objektigenkänning, deras komplexitetsproblem
och begränsningar.
Sammanfattningsvis är ämnet datorseende starkt interdisciplinärt
och har nära anknytning till teorier för biologiskt och
mänskligt seende.
I kursen kommer ett antal sådana kopplingar att illustreras.
Vidare ingår en orientering om mänskligt seende (perception).
Kursen ingår i kompetensinriktningen
Autonoma system
och ges av forskningsgruppen
Computational Vision and Active Perception Laboratory .
Denna forskningsgrupp (vars namn förkortas CVAP)
omfattar cirka 30 personer som forskar i grundläggande
teorier för datorseende samt deras tillämpningar mot
robotik, medicinsk bildbehandling och visuell perception.
För ytterligare information om CVAPs verksamhet,
se gärna presentationen på vår hemsida.
Förkunskaper
Väl inhämtade grundläggande kunskaper i tillämpad
matematik och datalogi, motsvarande de obligatoriska kurserna i
matematik, datalogi och numerisk analys. Ytterligare någon kurs i
signalbehandling och/eller numerisk analys kan rekommenderas.
Kursen använder sig av förkunskaper över ett relativt brett spektrum
av problemlösning i tillämpad matematik och datalogi, och lämpar sig
därför bäst att läsas i fjärde årskursen.
Studiehandbokstexten på
svenska
och
engelska.
|