Ninoa Malki

Referat

Detta examensarbetet undersöker den adaptiva evolutionshistoria för TAED databasen, som innehåller evolutionära träd för 6672 familjer av nu levande ryggradsdjurs gener. Målet är att påvisa adaptiv evolution, d v s att visa att evolutionen beror inte endast av slump utan även på selektion. Förhållandet mellan andelen icke-synonyma och synonyma substitutionshastigheterna K_a/K_s, är en användbar metod för undersökning av adaptiv evolution. Att kvoten är större än ett innebär det en indikation på adaptiva evolutionen. Genom att rekonstruera anfaderssekvenser i evolutionära träd kan man studera substitutionerna över en gren och därmed beräkna förhållandet av K_a/K_s för grenen. I detta projekt har jag implementerat en marginell likelihood DNA- och kodon-rekonstrueringsmetod som rekonstruerar anfaderssekvenser i evolutionära träd, då substitutionshastigheten antas följa en gammafördelning. Jag har tyvärr inte kunnat studera förhållandet av K_a/K_s mellan närliggande noder på grund av tidsbrist. Däremot har jag med hjälp av mina handledare Bengt Sennblad och Jens Lagergren kunnat definiera en dynamisk programmeringsalgoritm som beräknar ett väntevärdet för K_a/K_s för varje gren i ett evolutionärt träd. Men efter att ha undersökt metodens komplexitet bestämde vi oss att jag inte skall implementera metoden. Detta på grund av att det skulle ta orimligt lång tid att beräkna väntevärdet K_a/K_s för alla grenar över ett evolutionärt träd.

Abstract

In this thesis I have studied the adaptive evolutionary history for phylogenetic trees for 6672 families of Chordate genes in the TAED database. The target is to examine the evolutionary history of these families in the search for genes under positive selection. Detecting a ratio of nonsynonymous to synonymous nucleotide substitution rates K_a/K_s significantly >1 is a common approach for detecting positive selection. To estimate this ratio on specific branches of a phylogenetics tree, ancestral sequances can be reconstructed across all nodes of the phylogenetics tree. I have implemented a marginal likelihood method for DNA and codon reconstruction of the ancestral sequences of the phylogenetics tree, when the substitution rate among the sites follow a gamma distribution. Unfortunately there was no time to studie the ratio on branches of a phylogenetics tree. I have also in this thesis defined a new dynamic programing algorithm which estimate the mean of K_a/K_s for each branch of a phylogenetic tree with marginal likelihood method. But after examining the complexity of the method, we decide us to not implement the method.