Da mir nur die IBM SP2 dauerhaft zu Verfügung stand, wurden dort die Untersuchungen zum Laufzeitverhalten von pfastDNAml durchgeführt.
Hierfür wurden Alignments verschiedenen Umfangs zusammengestellt. Der erste Datensatz (rrna10 ) bestand aus 10 unterschiedlichen Bakteriensequenzen und der zweite (rrna20 ) aus 20 unterschiedliche Eukaryotensequenzen. Die Sequenzen beider Datensätze stammen aus der RDP-Datenbank. Der dritte Datensatz (rrna28 ) enthielt rRNA-Sequenzen von 28 Organismen aus allen drei Überreichen, d.h. Archaebakterien, Eubakterien (mit Mitochondrien und Plastiden) und auch Eukaryoten. Diese Sequenzen wurden der rRNA-Datenbank in Antwerpen entnommen.
Alle Testläufe wurden mit der G-Option durchgeführt, d.h. es wurden am Ende jeder Analyse globale Rearrangements ausgeführt, um den bis dahin gefundenen Baum noch zu optimieren und die Fehler der Heuristik auszugleichen.
Die unterschiedlichen Testdatensätze wurden auf der IBM SP2 mit verschiedener Anzahl von Slave-Prozessen analysiert. Die durchgeführten Berechnungen und deren Ergebnisse waren bei den unterschiedlichen Knotenzahlen identisch, wie die inspizierten Ausgabedateien ergaben. Dies war auch erwartet worden, da nur die Bäume auf eine unterschiedliche Anzahl von Slave-Prozessen zur Berechnung verteilt wurden und der Ablauf sich ansonsten nicht änderte.
Die Laufzeiten der einzelnen Analysen der drei Datensätze
und die Anzahl der dabei untersuchten Bäume sind in
den Tabellen 5.1, 5.2 und 5.3
dargestellt.
Aufgrund der langen Laufzeiten des rrna28 -Datensatzes mit
wenigen Slave-Prozessen, wurden mit diesem Datensatz
nur Laufzeiten von Konfigurationen mit
32, 16 und einem Slave-Prozeß untersucht.