next up previous contents
Next: Installation Up: pfastDNAml (Bedienungsanleitung und Beschreibung) Previous: Format der Eingabedaten

Ausgabedateien

Während bei der sequentiellen Programmversion die Ausgaben über Optionen, Parameter und Tätigkeiten des Programms auf der Standardausgabe, d.h. normalerweise dem Bildschirm, erfolgen, geschieht dies bei der Parallelversion in einer separaten Ausgabedatei mit Namen

pfastDNAml.mmdd-hhmmss.pid.
Der mittlere Teil setzt sich aus dem Tag, dem Monat, der Stunde, der Minute und der Sekunde der Startzeit zusammen. pid entspricht dem PARMACS-ID des Masterprozesses und ist im allgemeinen gleich der Anzahl der Slave-Prozesse. Bei einem Paralleljob mit 34 Prozessen, also 33 Slave-Prozessen, ist der Master-ID normalerweise ebenfalls 33. Wurde beim Compilieren des Programms im Makefile die Option PM_DEBUG gesetzt, so gibt auch jeder Slave-Prozeß eine Ausgabe-Datei aus, die sich von der des Master-Prozesses durch den ID (im Beispiel von 0 bis 32) unterscheidet.

Der Inhalt der Ausgabedatei unterscheidet sich im allgemeinen nicht von der Ausgabe von fastDNAml. Zwei Dinge werden allerdings noch zusätzlich ausgegeben. Dies ist zum einen die sogenannte Wallclocktime (die in Wirklichkeit vergangene Zeit) zwischen dem Startpunkt und dem Endpunkt einzelner Berechnungsschritte sowie die für die Analyse benötigte Gesamtzeit.

Außerdem wird bei Bootstrap-Analysen ausgegeben, wie oft jede Spalte im Alignment in der Bootstrap-Pseudostichprobe verwendet wurde. Dadurch ist es dann möglich, die in die Gesamtanalyse eingegangenen Stichproben zu vergleichen.

Neben der normalen Ausgabedatei gibt es noch zwei weitere: eine die Checkpoints, abgespeicherte Zwischenschritte, enthält und eine weitere für den endgültigen Baum, soweit dieser im den Eingabeoptionen gewünscht wurde.

Die in diesen Dateien enthaltenen Bäume bestehen normalerweise aus diesem Format:

  [Kommentar] (Teilbaum, Teilbaum, Teilbaum):Kantenlaenge;
Teilbaum besteht entweder aus
  (Teilbaum, Teilbaum):Kantenlaenge
oder aus
  Speziesname:Kantenlaenge

Zur Weiterverarbeitung der Bäume muß eventuell der Kommentar inclusive der eckigen Klammern entfernt werden. Hierfür ist ein Perlskript (Wall and Schwartz, 1991) namens remrem.pl (remove remarks) vorhanden, das aus einer Eingabedatei alle Kommentare herausfiltert und die gefilterte Datei an die Standardausgabe weitergibt, die dann ohne weiteres in eine Datei umgeleitet werden kann. Das so erhaltene Format kann dann von anderen Programmen wie z.B. von den PHYLIP-Programmen drawgram, drawtree und retree weiterbearbeitet werden (Felsenstein, 1993).

Die in der checkpoint-Datei enthaltenen Bäume sind die beim Abschluß eines Schrittes, wie Einfügen oder Rearrangement, gefundenen besten Bäume. Diese können bei einer eventuellen Unterbrechung der Berechnung herangezogen werden, um die Berechnung mit der Restart-Option (R) neu zu starten.

Die Namen der drei möglichen Ausgabedateien sind also:

  pfastDNAml.mmdd-hhmmss.pid
  treefile.mmdd-hhmmss.pid
  checkpoint.mmdd-hhmmss.pid


next up previous contents
Next: Installation Up: pfastDNAml (Bedienungsanleitung und Beschreibung) Previous: Format der Eingabedaten
Heiko Schmidt
7/17/1997