Nada

^ Upp till kursens hemsida.

Extenta 2

  1. Beskriv generellt hur heuristiska sökmetoder för sekvenslikhet fungerar (t.ex. de som används i Blast och Fasta) med utgångspunkt från hur dynamisk programmering för exakt sekvensjämförelse fungerar. Beskriv fördelar och nackdelar med heuristiska metoder. (3p)
  2. Vilka fördelar och nackdelar har dolda markovmodeller (HMMer) jämfört med s.k. reguljära uttryck för att hitta mönster i en proteinsekvens. (3p)
  3. Problemet att identifiera gener utan att använda information från andra sekvenser i en genomisk DNA-sekvens är mycket svårare för eukaryota än för prokaryota. Ange två separata anledningar till varför det är så. (2p)
  4. Med hjälp av tex databasen Pfam kan man göra statistik över förekomst (finns en viss familj) och frekvens (hur många proteiner tillhör familjen?) av olika proteinfamiljer i ett genom. Om man jämför sådan statistik för olika art såsom bananfluga (Drosophila melanogaster), nematod-masken (Caenorhabditis elegans) och människa, finner man snart att de skiljer sig åt. Förklara kort varför det är så, gärna med exempel. (2p)
  5. Du har fått en nukleotidsekvens (och dess proteinsekvens) från ett experiment. Det enda du vet är att det är en gen från människa. Vilka två databaser skulle du välja att söka i först för att få en uppfattning om vad det kan vara för gen? Förklara kort varför. (2p)
  6. Vad är "CASP" och varför har CASP varit viktigt för strukturprediktionsområdet? (2p)
  7. Du skattar ett orotat träd för en gen X och får det av ditt datorprogram beskrivet av strängen

    ((X_pig, X_fly), (X_mouse, (Xa_human, Xb_human)))

  8. Antag att du fått i uppdrag att studera en gen med mycket högt evolutionärt tryck och knappast någon variation i proteinsekvensen.

^ Upp till kursens hemsida.


Sidansvarig: Lars Arvestad <arve@nada.kth.se>
Senast ändrad 10 februari 2004
Tekniskt stöd: <webmaster@nada.kth.se>