Kursanalys 2004, Maskininlärning, 2D1431, 4 poäng

Kursdata

Mål

Maskininlärning handlar om hur datorprogram automatiskt kan förbättra sitt beteende genom att utnyttja sina tidigare erfarenheter. Ämnet ligger i gränslandet mellan artificiell intelligens, statistik, informationsteori, biologi och reglerteknik. Målet med kursen är att ge grundläggande kännedom om de teorier och algoritmer som används inom området.

Sammanfattning

Kursen är mycket uppskattad bland studenterna. Laborationerna utgör en viktig del av kursen och kräver en ordentlig arbetsinsats från studenternas sida. Resurserna för handledning är begränsade och det kan därför kännas svårt att hinna bli klar i tid.

Undervisningen

Undervisningen har bestått av 13 tvåtimmarsföreläsningar som var och en har haft ett tydligt tema, t.ex. en algoritm eller en grupp av relaterade metoder. Daniça Kragic har varit föreläsare på de tre föreläsningar som behandlar statistiska inlärningsmetoder medan Örjan Ekeberg har hållit i de övriga föreläsningarna. Dessutom har studenterna arbetat med fyra obligatoriska laborationer.

Examination

Kursen examineras genom muntlig redovisning av de fyra laborationerna samt en skriftlig tentamen. Laborationsredovisningen sker genom att studenterna anmäler sig via ett webb-baserat bokningssystem för ett 20-minuters redovisningspass. En handledare går igenom laborationen, med tonvikt på de frågor som finns i labbanvisningen, tillsammans med studenterna.

Tentamen består av ett antal frågor som testar förståelsen för hur de olika metoderna fungerar och vad de har för speciella egenskaper. Betyget sätts efter tentaresultatet men ett generöst bonussystem gör att de som redovisat alla laborationer i tid får ett stegs betyghöjning.

Kurslitteratur

Kursboken (Mitchell) definierar ganska väl kursinnehållet. Boken är förvånansvärt dyr, vilket gör att vi bör undersöka ifall det finns något bra alternativ. En annan nackdel med boken är att den är ganska gammal (1997), vilket naturligtvis inte är bra i ett område som utvecklas så snabbt som detta.

Teknikerna bagging och boosting beskrivs inte i boken och vi har därför kompletterat med några allmänna artiklar som beskriver dessa metoder.

Studentsynpunkter

Vid kursens slut gjordes en enkät som besvarades av 33 studenter. Resultatet finns här. De flesta tycker att det är en rolig kurs och är också nöjda med själva genomförandet. Föreläsningarna är uppskattade och den kritik som framförts är genomgående positiv. När det gäller laborationerna upplevs bristen av handledning ibland som ett problem, speciellt i kombination med den korta tid som finns till förfogande för själva genomförandet. De laborationspass som finns schemalagda används nästan enbart till redovisning.

Nytt för denna kursomgång var att alla föreläsningar gjordes med hjälp av dator. En fördel med detta är att materialet också funnits tillgängligt via webben. Detta är utnyttjats av många studenter. Vissa studenter har framfört önskemål om att materialet skulle finnas tillgängligt före föreläsningarna. Detta har inte varit praktiskt möjligt eftersom materialet har färdigställts parallellt med kursen, men till nästa kursomgång bör det inte vara några problem att tillgogose detta önskemål.

Kursens belastning för studenterna

Allt tyder på att belastningen för studenterna är "lagom".

Förkunskaper

Studenterna har varierande förkunskaper men det verkar ändå som att de flesta har kunnat tillgodogöra sig kursinnehållet. Nästan alla anger i enkäten att de hade tillräckliga förkunskaper. Bland kommentarerna finns både önskemål att via ska gå lite fortare fram och att det går för fort ibland. Detta kan tolkas som att vi ligger "ganska rätt" vad gäller svårighetsgraden.

Planerade förändringar

Kursen har nu gått i några år och börjar finna sin form. Inför årets kursomgång infördes en helt ny laboration som behandlar genetiska algoritmer. Denna laboration fungerade bra, men är ändock i behov av en genomgång för att städa bort vissa "barnsjukdomar". Flera studenter har bidragit med detaljerade och konstruktiva synpunkter som bör arbetas in i alla labbanvisningarna.

Sedan denna kurs infördes har relationen till kursen 2D1432 (Artificiella neuronnät och andra lärande system, ANN) varit oklar. Ett problem är att dessa två kurser kan läsas oberoende av varandra så ett visst överlapp i kursinnehåll måste accepteras. Många studenter väljer dock att läsa båda dessa kurser. Inför årets kursomgång har avsnittet om artificiella neuronnät i maskininlärningskursen kortats och vi har tagit bort laborationen som behandlar detta. Istället har vi utökat avsnittet om genetiska algoritmer och infört en laboration kring detta. Arbetet med att anpassa de två kurserna till varandra bör dock fortsätta även inför nästa kursomgång.

Till årets kursomgång gjordes en uppfräshning av laborationen om Bayes-klassning och boosting. Den laboration som nu känns mest angelägen att förbättra är den om belöningsbaserad inlärning (reinforcement learning). Den nuvarande laborationen är uppskattad, men känns lite "tunn" eftersom man egentligen aldrig kommer fram till att verkligen använda algoritmen.

Vi bör utreda ifall det finns en nyare och billigare kursbok som passar för kursen.