next up previous contents
Next: Bootstrap-Verfahren Up: Methoden, Modelle und Algorithmen Previous: Suche nach dem optimalen

Erstellen von gewichteten Datensätzen

  Um eventuelle unerwünschte Effekte zu vermeiden, die durch hochvariable Bereiche in den Eingabesequenzen auftreten können, wurden teilweise gewichtete Datensätze erstellt. Gesucht wurden Gewichte für die einzelnen Spalten im Sequenzalignment, so daß hochvariable Spalten heruntergewichtet werden, während konserviertere Basen im Alignment ein höheres Gewicht erhalten.

Dazu wurde die Möglichkeit des Programms MacClade genutzt, Weightsets zu generieren (Maddison and Maddison, 1992). Dem Programm wurde ein ML-Stammbaum als Grundlage für die Gewichtung übergeben. MacClade generiert dann nach der Parsimony-Methode Sequenzen für die internen Knoten. Dieses geschieht so, daß möglichst wenig Mutationen für die Realisierung des Baumes nötig sind (siehe Kap. 1.4.3). Anschließend werden die notwendigen Mutationen in jeder Alignmentspalte gezählt. Die Anzahl der Mutationen S (Parsimony-Steps) ist die Grundlage zur Berechnung der Gewichte. Als Gewichtungsfunktion W wurde
\begin{displaymath}
W = \frac{1}{S}
 \end{displaymath} (10)
verwendet. Durch Verwendung der Option integral weights werden die einzelnen Werte W mit der gewünschen Anzahl an Gewichten multipliziert und anschließend auf den nächsten ganzzahligen Wert gerundet. Dieser Wert entspricht dem errechneten Gewicht. Spalten mit S=0, d.h. ohne Mutationen, erhalten ebenfalls das geringste Gewicht, da sie für die Stammbaumanalysen keine Aussagekraft besitzen. Es wurden im allgemeinen 10 Gewichte gewählt, die später bei der Analyse mit pfastDNAml jeweils einer Gewichtskategorie zugeordnet wurden.


next up previous contents
Next: Bootstrap-Verfahren Up: Methoden, Modelle und Algorithmen Previous: Suche nach dem optimalen
Heiko Schmidt
7/17/1997