Wir betreten nun das Reich der Biologie. Da wir bereits einiges über Graphen wissen, knüpfen wir hier an und treffen zunächst einige Sprachregelungen:
so sind sie eindeutig als Knick, Verzweigungspunkte und freie Enden erkennbar. Bäume eignen sich hervorragend dazu, Verzweigungsprozesse darzustellen und sind zumindest als Baumdiagramme der Wahrscheinlichkeitsrechnung ein bekanntes Mittel im Mathematikunterricht. Sie können auch helfen, die Logik gewisser Argumentationen (Fallunterscheidungen in mathematischen Beweisen) und die Struktur von Programmabläufen in übersichtlicher Weise darzustellen. Eine besonders
nützliche Anwendung ergibt sich in der Biologie, und dieser wollen
wir uns nun zuwenden.
Biologische Arten (species) werden manchmal als "Fortpflanzungsgemeinschaften" charakterisiert. Obwohl Kreuzungen über die Artengrenzen hinweg nicht völlig ausgeschlossen sind, entspricht diese Definition der biologischen Realität. Jede Art besitzt ihren eigenen "Genpool", aus dem die erblichen Anlagen eines einzelnen Individuums (insbesondere im Fall der geschlechtlichen Fortpflanzung) mehr oder weniger zufällig "zusammengewürfelt" sind. Während langer Zeitabschnitte kann sich der Genpool einer Art ändern - das geschieht
Werden zwei Populationen einer Art räumlich voneinander getrennt oder besetzen sie verschiedene ökologische Nischen, so wächst ihre "genetische Distanz", bis ihre Nachkommen verschiedenen Arten angehören. Ein Prozess dieser Art wird meist in Form eines (binären) Stammbaums (pedigree) dargestellt:
Die Ecken entsprechen den - sich oft in vergleichsweise kurzen Zeiträumen vollziehenden - Aufspaltungen (Verzweigungen) von Arten, während die Kanten Arten repräsentieren, die über längere Zeiträume existieren (während derer sich der Genpool als Ganzes weiterentwickelt). Die Blätter entsprechen entweder den Arten, die ausgestorben sind, ohne Nachkommen zu hinterlassen, oder den heute lebenden Arten. (Die Zeit vergeht in dieser Darstellung nach oben nach unten). Aber auch innerhalb von Arten finden ähnliche Prozesse statt, wenn Gruppen getrennt werden (wie es zum Beispiel mit den Menschen geschah, die vor etwa hunderttausend Jahren von Afrika ausgehend die Erde bevölkerten). In diesem Fall sind zwar nachträgliche Vermischungen der Genpools möglich, aber die genetischen Spuren früherer Aufspaltungen lassen sich noch lange Zeit später nachweisen. Mit dem Konzept des Stammbaums steht eine hervorragende Möglichkeit zur Verfügung, die Geschichte des Lebens aus dem Blickwinkel der Abstammungs- und Verwandtschaftbeziehungen darzustellen. Wir wollen die evolutionären Einheiten, um die es geht (Arten oder Gruppen innerhalb einer Art), mit dem Sammelnamen Populationen bezeichnen. Im Folgenden werden
wir uns ansehen, wie Stammbäume aus heute zugänglichen Daten
rekonstruiert werden. Zuerst besprechen wir einige notwendige Grundannahmen,
danach wenden wir uns den Methoden und Problemen der Stammbaum-Rekonstruktion
zu.
Wie kommt die biologische Forschung zu den Stammbäumen der Evolution? Wichtige Datenquellen sind morphologische (körperliche) Merkmale der heute lebenden Organismen und, soweit verfügbar, die entsprechenden Merkmale von Fossilfunden. Mit Hilfe derartiger Methoden wurde bereits vor Darwin die Grundstruktur vieler Verwandschaftsbeziehungen erschlossen. Die moderne Biologie kann auf weitere, in mancher Hinsicht zuverlässigere Informationsquellen zurückgreifen:
Sowohl die Struktur von Biomolekülen als auch die Häufigkeit von Genvarianten sind ständigen Veränderungen durch eine Reihe von Zufallsprozessen unterworfen. Werden Populationen voneinander getrennt, so werden die Unterschiede in der Regel stetig zunehmen und stellen daher ein Maß für deren evolutionären Verwandtschaftsgrad dar. Gelingt es, sie quantitativ zu bestimmen, kann der Versuch einer Rekonstruktion der Evolutionsgeschichte unternommen werden.
Sehen
wir uns nun anhand zweier Beispiele an, wie man in der Praxis vorgeht.
Wie sind Kaninchen, Schwein und Gorilla miteinander verwandt? Um diese Frage zu beantworten, kann ein gut bekanntes Protein-Molekül benutzt werden: das Hämoglobin. Es (genauer: seine Alphakette) besteht aus 141 hintereinander aufgefädelten Aminosäuren. Die konkrete Abfolge der Aminosäuren (der "Buchstaben") weicht bei den drei Arten leicht voneinander ab. Werden die Unterschiede paarweise abgezählt, so ergibt sich folgende "Distanzmatrix" (nach Art der Entfernungstabellen für Städteverbindungen):
Ist die Annahme gerechtfertigt, dass derartige Unterschiede im Laufe der Zeit wachsen, und zwar (zumindest ungefähr) gleich schnell in allen Arten, so ergibt sich aus den Zahlenwerten, dass Schwein und Gorilla (Distanz 20) die nächsten Verwandten sind. Ihre Trennung muss die zeitlich jüngere sein. Der Stammbaum sieht daher so aus: Es fällt übrigens auf, dass die beiden anderen Zahlen gleich groß sind. Das passt recht gut zum Modell einer "molekularen Uhr", die - in jeder Evolutionslinie - in gleichen Zeiten durchschnittlich die gleiche Zahl von Mutationen hervorbringt. (So genau geht die molekulare Uhr leider nicht in allen populationsgenetischen Untersuchungen!) Übungsaufgaben:
Quellen:
Der gemeinsame Stammbaum einer großen Zahl von Populationen ist nicht leicht zu finden, da die Anzahl der möglichen Typen schnell anwächst. Für vier Polulationen gibt es zwei Typen:
Im allgemeinen Fall führt die Stammbaum-Rekonstruktion auf schwierige mathematische Probleme, da die Ausgangsdaten in der Regeln mit statistischen Fehlern behaftet sind: Welcher Stammbaum passt am besten zu den Daten? Welche Hypothese über die Abstammung der betrachteten Arten ist am wahrscheinlichsten? Mit welchen Unsicherheiten ist jede derartige Hypothese verbunden? Zur Beantwortung dieser Fragen werden aufwendige statistische Methoden entwickelt und mit Computerunterstützung durchgeführt. Nicht alle führen zu den gleichen Ergebnissen! Um
trotz aller Unsicherheiten zumindest eine erste Orientierung zu erhalten,
wurde eine leicht anwendbare Methode entwickelt, die wir nun anhand
eines realistischen Beispiels aus der Humangenetik besprechen. Es handelt
von den frühen Wanderungsbewegungen unserer Vorfahren.
Werden die "Ureinwohner" der fünf Kontinente Afrika, Amerika, Asien, Europa und Ozeanien (inklusive Australien) grob zu Populationen zusammengefasst, so lassen sich deren Genome vergleichen und daraus die Frage nach dem Stammbaum stellen. Eine derartige Untersuchung wurde von einer Forschergruppe um Luigi Luca Cavalli-Sforza durchgeführt. Auf der Basis des Vergleichs von 110 ausgewählten Genen wurden die "genetischen Distanzen" bestimmt.
Die Ausgangsdaten lagen in Form folgender Distanzmatrix vor:
Ähnlich wie im vorigen Beispiel stellen die Zahlenwerte ein Maß für die paarweisen Verwandschaftsgrade dar. Allerdings weisen sowohl die Daten als auch deren Interpretation als Indikatoren für Zeitabläufe erhebliche Unsicherheiten auf (die unter anderem von den Unwägbarkeiten des molekularen Zufalls, der begrenzten Anzahl an verfügbaren DNS-Proben und von Vermischungen aufgrund späterer Migrationen herrühren). Ein einfaches Verfahren, aus diesen Daten sinnvollen einen Stammbaum zu konstruieren, funktioniert wie folgt (es trägt den hübschen Namen UPGMA = Unweighted Pair Group Method with Arithmetic Mean): Zuerst machen wir den kleinsten Datenwert in der Tabelle ausfindig: das ist 8.9, die genetische Distanz zwischen Amerikanern und Asiaten, den nächstverwandten Populationen. Wir fassen diese zu einer Gruppe {Am, As} zusammen. Deren Distanzen zu jeder anderen Population X werden als Mittelwert der Distanzen von X zu Amerika und Asien veranschlagt. Damit erhalten wir eine neue, kleinere Tabelle:
Mit dieser verfahren wir auf die gleiche Art. Die kleinste auftretende Zahl ist 9.6, das ist die Distanz zwischen der Gruppe {Am, As} und Europa. Diese beiden Gruppen fassen wir zu einer weiteren Gruppe {{Am, As}, Eu} zusammen. Deren Distanzen zu den übrigen Populationen werden wieder als Mittelwerte berechnet, woraus sich die nächste Tabelle
ergibt. Wir wiederholen das Verfahren ein letztes Mal: Die kleinste vorkommende Zahl ist 12.9, die Distanz der Gruppe {{Am, As}, Eu} von Ozeanien, was zur Bildung einer weiteren Gruppe {{{Am, As}, Eu}, Oz} Anlass gibt, die gemeinsam mit Afrika übrig bleibt und von diesem die durchschnittliche Distanz 21.9 hat. Damit haben wir die für die Rekonstruktion des Stammbaums nötige Information und können die Verschachtelungen wieder aufrollen. Zuerst fand die Trennung der nichtafrikanischen Populationen von den Afrikanern statt: Das passt recht gut zu der aus dem fossilen Beleg gestützten These vom gemeinsamen Ursprung aller Menschen in Afrika. Danach spalteten sich Gruppen ab, die in der Folge die Inselwelt des pazifischen Ozeans und Australien besiedelten: Als nächstes trennten sich Völker, deren Nachkommen heute den Großteil der europäischen Bevölkerung ausmachen: Zuletzt wanderten asiatische Gruppen (in mehreren Wellen, wie wir aus anderen Quellen wissen) nach Amerika ein:
Die genetischen Distanzen dieser Untersuchung können auch dazu verwendet werden, die Zeitpunkte der Verzweigungen grob abzuschätzen, obwohl die Kalibrierung molekularer Uhren noch ein heiß umstrittenes Thema ist. Die erste Trennung dürfte etwa hunderttausend Jahre zurückliegen. Während der letzten Jahre
wurden ausgeklügeltere Methoden entwickelt, entwicklungsgeschichtliche
Verhältnisse menschlicher Populationen durch genetische Untersuchungen
aufzukären. Die effizientesten beschränken sich nicht auf
einen Distanzbegriff zwischen Populationen, sondern analysieren
Sequenzen von Biomolekülen einzelner Individuen -
wir werden einige Konsequenzen aus diesen Untersuchungen (vor allem
die berühmte "Ur-Mutter" aller Menschen) im letzten
Abschnitt kennen lernen.
Zuletzt wollen wir auf eine Beobachtung hinweisen, die sich aus der soeben angewandten Methode ergibt: Die Struktur eines binären Baums kann formal als verschachtelte Zusammenfassung der Blätter dargestellt werden. Im obigen Beispiel können wir den gesamten Stammbaum in der komprimierten Form {{{{Am, As}, Eu}, Oz}, Af} anschreiben, wobei die fünf Kontinente die Blätter bilden. Wenn es uns nicht auf die Namen ankommt, können wir das als {{{{*, *}, *}, *}, *} abkürzen und haben damit den Typ des Stammbaums in kompakter Form dargestellt. Solche Formen sich wichtig, wenn man Verzweigungsprozesse am Computer modellieren will. Übungsaufgaben:
Die zahlreichen im WWW bereitstehenden Ressourcen bieten zwar eine Fülle konkreter Daten und Hinweise auf Methoden, sind aber meist für Spezialisten gedacht und daher ein bisschen schwer verdaulich. Hinsichtlich der genetischen Distanzen ist zu beachten, dass es verschiedene Berechnungs- und Normierungsstandards gibt, so dass bei der Rekonstruktion eines Stammbaums die Daten aus verschiedenen Quellen nicht gemischt werden sollten.
Literatur zu Evolution, Genetik und Humangenetik:
Und für jene, die sich in die computerbasierten Methoden der modernen Biologie vertiefen wollen:
|
¬ Spaziergänge und Buslinien | Übersicht |
Bewertung von Webseiten durch Google ® |