Olle Pettersson


Implementing LVQ for Age Classification

Abstract

This thesis is commissioned by the Mitsubishi Electric Corporation, Japan. The subject of this thesis is the problem of Age Classification. Specifically the task is to train and evaluate a classifier of grayscale face images. Furthermore, the classifier will be developed for integration into a Demo Application for gender and age classification. The Demo Application is a live classification system that captures images through a web-camera.

Initial studies shows that Age Classification is a new problem within the machine learning field. As such, specific approaches to this classification task are undocumented. Related techniques for face recognition and face classification will be given an overview in this thesis.

The method of Learning Vector Quantization (LVQ) is modified and implemented as a classifier with an optional pre-processing step using Principal Component Analysis (PCA). The current implementation of PCA as a pre-processing step did not help to improve the classifiers performance. And while LVQ performs fairly well as an age classifier – given its inherent simplicity – the conclusion is that some type of pre-processing is required for optimal performance, either by finding a different approach to pre-processing or further developing the PCA Pre-processing step.


Implementering av LVQ för åldersklassificering

Sammanfattning

Detta examensarbete är utfört på uppdrag av Mitsubishi Electric Corporation, Japan. Syftet med arbetet var att studera problemet åldersklassificering. Den specifika uppgiften som behandlas i denna rapport är att träna och utvärdera en klassificerare för gråskaliga bilder av ansikten. Klassificeraren kommer också att integreras med en demoapplikation för köns- och åldersklassificering. Demoapplikationen är ett realtidsklassificeringssystem som hämtar in bilder för klassificering via en webkamera.

Förstudier visar att problemet med åldersklassificering är väldigt nytt inom maskininlärningsområdet och att angreppssätt på detta problem är i stort sett odokumenterade. Rapporten kommer att ge en överblick av relaterade tekniker för ansiktsigenkänning och klassificering.

Algoritmen för Learning Vector Quantization (LVQ) kommer att modifieras och implementeras som klassificerare tillsammans med ett valfritt steg med förbehandling av data med hjälp av Principalkomponentsanalys (PCA). Analys visar att den nuvarande förbehandlingen med PCA inte ökar klassificerarens prestanda. Slutsatsen som dras är att LVQ ger bra resultat trots sin enkla struktur, men att någon form av förbehandling av data troligtvis krävs för optimal prestanda. Detta kan uppnås antingen med en alternativ förbehandling av data eller genom att ytterligare utveckla steget med PCA som förbehandlingsmetod.