Mittwoch, 22. April 2015

Bäume aus selbst gemachten Sequenzen

Hypothese: Ähnliche Sequenzen bilden in einem phylogentischen Baum einen Cluster.

Künstliche Sequenzen:

S1: AAAAAAAAAA
S2: TTTTTTTTTT
S3: TTTTTTTTTT
S4: AAAAAAAAAA


Neighbor-Joining (NJ) Baum 1:
NJ-Baum 1 (original)
NJ-Baum 1 (Topologie)
Der auf diesen Sequenzen basierende Neighbor-Joining (NJ) Baum 1 besteht aus zwei Cluster. Wie zu erwarten bilden S2 und S3 einen und S1 und S4 einen weiteren Cluster.
Im Vergleich zu den sehr unterschiedlichen Sequenzen wollen wir nun auf ein Beispiel mit sehr ähnlichen Sequenzen schauen.

S1: AAAAAAAAAA
S2: AAAAAAAAAT
S3: AAAAAAAAAT
S4: AAAAAAAAAA

NJ Baum 2:
NJ-Baum 2 (original)
NJ-Baum 2 (Topologie)
Bis auf die Distanz der beiden Zweige unterscheidet sich der Baum nicht vom vorherigen.

In den vorangegangenen Beispielen ist die proportionale Distanz (p-Distanz) zwischen den Sequenzen das Maß welches im Baum notiert wird. Im ersten Beispiel sind 10 der Basen von S1 und S4 anders als bei S2 und S3. Also 100 % unterschiedlich. Im Baum wird das erkenntlich an der Summe der Distanz der verbindenden Zweige (50 % = 0.5). Im zweiten Beispiel ist nur eine der 10 Basen unterschiedlich was 10 % (= 0.1) Distanz entspricht.

Was passiert, wenn wir nun innerhalb einer der beiden Cluster einen weiteren Unterschied einführen?

S1: AAAAAAAAAA
S2: AAAAAAAAAT
S3: AAAAAAAATT
S4: AAAAAAAAAA
NJ-Baum 3 (original)
NJ-Baum 3 (Topologie)
Die Distanz zwischen dem Cluster S1+S4 und S3 beträgt 0.1+0.1 = 0.2 (20 % = 2 Basen). Die Distanz zwischen S2 und S3 sowie S2 und dem Cluster S1+S4 beträgt je 10 % (0.1 = 1 Base).

to be continued...

Keine Kommentare:

Kommentar veröffentlichen