Nada

^ Upp till kursens hemsida.

Lösningsförslag, extenta 2

En del lösningar här nedan är mycket knapphändiga och kortfattade. Ni måste var utförligare för att vara säkra på att få full poäng!
  1. Se boken! De letar efter små likheter utan insättning av blanka och om tillräckligt många hittas inom ett litet område försöker programmen utöka dem till långa lokala linjeringar. Fördelen: snabbhet. Nackdel: Sämre känslighet, eftersom många homologier missas.
  2. Den här frågan borde ha formulerats för profil-HMMer. Man kan lätt uttrycka ett reguljärt uttryck som en HMM. HMM kan ge sannolikheten för en matching. Dessutom kan de på ett säkrare sätt modellera osäkerhet och generalisera utifrån givna data eftersom man kan ge osedda data låg sannolikhet. Jag ser inga nackdelar! En profil-HMM kan ha svårt att modellera längdvariationer och upprepningar, något som reguljära uttryck är bra på.
  3. Det är tätt mellan generna hos prokaryota. Eukaryota gener innehåller exoner/introner. Prokaryota gener känns lätt igen på långa ORFar.
  4. De olika organismerna är bra på olika saker och har tex olika sinnen för känsel. En människa kanske har sämre luktsinne och därmed färre receptorer för dofter än masken. För att hantera doftrikedomen kan masken ha utvecklat många olika receptordomäner.
  5. Först SwissProt eftersom den är så välannoterad och kontrollerad. Förhoppningsvis hittar man en homolog där med beskriven funktion. Om inte SwissProt ger något kan man gå till EMBL eller Genbank för att hitta homologer med mindre förhoppning om bra annotering. Om SwissProt har en träff kan man tex gå till Unigene och hitta mer detaljerad information om genen.
  6. CASP står för "Critical Assessment of Structure Prediction" och har förenklat och förbättrat jämförelser av olika strukturprediktionsmetoder.
  7. Trädstruktur:
    X_mouse -----|  
                 |  |-- X_fly
    Xa_human--|  |--|
              |--|  |-- X_pig
    Xb_human--|
    
    Både mus och gris är betydligt evolutionärt närmare oss och vi har här ingen anledning att tro att det skulle ha skett duplikationer långt tillbaka i tiden, så de ser ut som om alla delningar utom nere hos människa beror på skapandet av nya arter. Därför borde fluga vara en sk utgrupp:
    X_fly -------------|
                       |--- rot
    X_pig ---------|   |
                   |---|
    X_mouse -----| | 
                 |-|
    Xa_human--|  |
              |--|
    Xb_human--|
    
    Om vi å andra sidan verkligen hade haft situationen så här:
    X_fly ----|
              |----|
    X_pig ----|    |
                   D--- rot
    X_mouse -----| | 
                 |-|
    Xa_human--|  |
              |--|
    Xb_human--|
    
    Då skulle det troligaste vara att 'D' är en duplikation långt tillbaka i tiden, och att haft två varianter väldigt länge, se nedan där utdöda linjer markeras med paranteriserade arter.
    X_fly -------------|
                       |---|
    X_pig ---------|   |   |
                   |---|   |
    (mouse) -----| |       |
                 |-|       |
    (human) -----|	       D-- rot
                  	       |
             	       |
    		       |
    (fly) -------------|   |
                       |---|
    (pig) ---------|   |
                   |---|
    X_mouse -----| | 
                 |-|
    Xa_human--|  |
              |--|
    Xb_human--|
    
  8. Titta på DNA-sekvensen istf proteinsekvensen. Åtminstone i tredje codon-position kan man hoppas att se lite skillnader. Om det är mycket lite variation även på DNA-nivå så är parsimony det bästa alternativet, eftersom distansmetoder kräver så pass mycket skillnader att man kan göra lite statistik på det.

^ Upp till kursens hemsida.


Sidansvarig: Lars Arvestad <arve@nada.kth.se>
Senast ändrad 20 februari 2004
Tekniskt stöd: <webmaster@nada.kth.se>