Björn Sundman

A Probabilistic Model of Oncogenesis Progression

Abstract

Genomic aberrations are often seen in the analysis of solid tumors. Aberra- tions on a band level can be found by coloring the bands of the chromoso- mes with various dyes. When looking at the chromosomes in a microscope, a trained eye can identify missing or inserted regions. Early aberrations are believed to aect the probability of other aberrations to occur. This model views the cancer progression as a set of dependencies between the aberrations.

It is of interest to identify those aberrations that are important in the progression of cancer and to be able to distinguish between aberrations that are likely to occur early, probable starting points, or late, probably caused by earlier aberrations, in the progression.

This thesis presents a new statistical model based on a hidden markov model that has been modied to generate sets. The model can be used to predict the dependency network that is assumed between tumour aberrations. The work provides a solid theoretical foundation for continued research in the eld. The thesis also points to a number of problems that must be adressed to allow the developed theory to practically applicable on large sets of biological data.

En probabilistisk modell för progression av onkogenes

Sammanfattning

Genomiska förändringar observeras ofta vid analys av tumörvävnad. Förändringar på bandnivå kan ses genom att man färgar kromosomerna med olika färgningspreparat. När kromosomerna sedan analyseras i mikroskop, kan det tränade ögat se saknade eller inkopierade bitar. Tidiga förändringar på kromosomnivå tros kunna påverka sannolikheten för att ytterligare förändringar ska ske. Vår modell betraktar cancerutveckling som en mägnd beroenden mellan kromosomförändringar.

Det är mycket intresant att kunna identiera de förändringar som är viktiga i ett tidigt skede av cancerutvecklingen samt att kunna avgöra vilka förändringar som troligen orsakas av tidigare förändringar.

I denna rapport presenteras en ny statistisk modell som baseras på en dold markov modell, modierad för att kunna generera mängder. Modellen kan användas för att beräkna det samband som antas finnas mellan kromosomala förändringar. Modellen beskriver en solid teoretisk grund för vidare forskning inom området. Rapporten pekar också på en del problem som måste lösas för att modellen ska kunna användas praktiskt på stora mägnder biologisk data.