Von Graphen, Genen und dem WWW
Online-Skriptum
Verwandtschaft 2
Inzucht,
d.h. die Fortpflanzung verwandter Individuen, ist in der Biologie ein
bedeutendes Phänomen. Dabei geht es nicht allein um uns Menschen.
Von Grundsatzfragen der Evolution über die traditionelle Tier-
und Pflanzenzüchtung und Maßnahmen zu Rettung bedrohter Arten
bis zur Kontrolle über genetisch wohldefinierte Linien von Versuchstieren
("Labormäusen") reichen die Gebiete, in denen dieses
Thema von Interesse ist. Einigen dieser Fragen werden wir in diesem
und im nächsten Abschnitt begegnen.
Verwandtschaftsgrade
in Graphen mit Inzucht sind mathematisch ein bisschen schwieriger in
den Griff zu bekommen als die oben besprochenen inzuchtfreien Familienverhältnisse.
Der Grund liegt darin, dass jedes Individuum an jedem Genort zwei
Allele besitzt. Unser seltenes Allel wird von einem der Gründer
in einfacher Ausführung in den Graphen eingebracht. Kommt es zu
Inzucht, so können beide Partner das Allel besitzen, und
daher können es alle Nachkommen dieser Verbindung in zweifacher
Ausführung besitzen, d.h. an dem betreffenden Genort homozygot
sein.
Hierin liegt
der Grund, warum Inzucht genetisch nachteilig sein kann. Es
gibt zahlreiche Allele, die sich friedlich verhalten (oder sogar von
Vorteil sind), wenn sie gemeinsam mit einem anderen Allel vorliegen,
aber zu Erbkrankheiten des Trägers führen, wenn sie doppelt
vorkommen, d.h. wenn der Träger an dem betreffenden Genort homozygot
ist. Interessanterweise können sich derartige Allele trotz ihrer
(statistisch gesehen seltenen) nachteiligen Wirkungen in einer Population
halten. Inzucht erhöht die Wahrscheinlichkeit, dass es zu diesen
nachteiligen Wirkungen kommt. In kleinen Populationen kann Inzucht
auch bei zufälliger Paarung häufig vorkommen. Sie wirkt
dann bremsend auf das Wachstum der Population, verringert deren genetische
Variabilität und verschafft Krankheitserregern, die das Immunsystem
knacken, einen Vorteil.
Das gilt aber
nur für Arten, bei denen Inzucht zwischen nahen Verwandten selten
ist. Für Termiten, über die wir im nächsten
Abschnitt sprechen werden, ist sie der Normalfall (während
die Paarung mit Nichtverwandten nur anlässlich der Gründung
einer neuen Kolonie stattfindet). Das führt dazu, dass jene Allele,
die sich in doppelter Ausführung schädlich auswirken, aus
dem Genom verschwinden. In der Tier- und Pflanzenzucht werden solche
genetischen Rosskuren absichtlich herbeigeführt. Werden verschiedene
derartige Inzuchtlinien miteinander gekreuzt, so sind deren Nachkommen
oft einige Generationen lang besonders gesund und ertragreich (Heterosis-Effekt).
Allgemeine
Verwandtschaftsgraphen |
Kehren wir zur
Formalisierung der Verwandtschaft zurück. Graphen mit Inzucht erfordern
ausgeklügeltere Methoden als die im vorigen
Abschnitt entwickelten. Weiters
interessiert in ihnen nicht nur der Verwandtschaftsgrad zwischen zwei
Individuen, sondern auch die Neigung eines Individuums, an einem Genort
mit größerer Wahrscheinlichkeit homozygot zu sein, als dies
ohne Inzucht der Fall wäre. Wir beschränken wir uns wieder
auf einen einzigen Genort, lassen einen zufällig ausgewählten
Gründer eines Verwandtschaftsgraphen ein "seltenes Allel"
tragen und betrachten zwei Individuen x
und y.
Beide sind in Besitz eines Allelpaar. Wird von jedem von ihnen
in zufälliger Weise je ein Allel herausgegriffen, so bezeichnen
wir mit
- Q(x, y)
die Wahrscheinlichkeit, dass beide Male das seltene Allel gezogen
wurde.
Bekommen x
und y
Kinder, so macht der sexuelle Vererbungsmechnismus genau das: Aus jedem
der elterlichen Genome wird ein Allel herausgegriffen. Wenn wir
- P2(z)
als die Wahrscheinlichkeit definieren, dass z
an dem betreffenden Genort das seltene Allel zweifach besitzt
(d.h. mit diesem
Allel homozygot ist), so gilt: Ist
z
ein Kind von x
und y,
so ist P2(z) = Q(x, y).
P2(z)
ist ein Maß dafür, wie sehr z
dazu neigt, aus Gründen der Inzucht homozygot zu sein. Ist z
ein Gründer, so ist P2(z) = 0,
da es per Definition unter den Gründern nur eine Kopie des
seltenen Allels gibt. Die Größe Q
macht auch für ein einziges Individuum Sinn: Q(x, x)
ist die Wahrscheinlichkeit, dass aus x
bei zweimaligem Ziehen (mit Zurücklegen) beide Male das seltene
Allel herausgegriffen wird. Ist
- P1(x)
die Wahrscheinlichkeit, dass x
an dem betreffenden Genort das seltene Allel einfach besitzt,
so ist Q(x, x) = (1/4) ×P1(x) + P2(x).
Wird von den beiden Allelen, die x
trägt, nur ein einziges zufällig gezogen, so ist die Wahrscheinlichkeit,
dass es das seltene ist, durch (1/2) ×P1(x) + P2(x)
gegeben. (Übungsaufgabe:
Verifizieren Sie die letzten beiden Formeln! Lassen Sie sich nicht zu
dem Fehlschluss verleiten, dass es sich hierbei um Urnenbeispiele handelt:
Die Wahrscheinlichkeit, das seltene Allel zweimal zu ziehen, ist hier
nicht gleich dem Quadrat der Wahrscheinlichkeit, es einmal zu
ziehen - warum nicht?)
Q(x, y)
und P2(z)
wären
an und für sich schon recht brauchbare Maße für Verwandtschaft
und Inzucht. Allerdings hängen sie in künstlicher Weise
von der Zahl g
der Gründer ab, also auch von jenen Teile eines Graphen, die
mit den betroffenen Individuen nichts zu tun haben. Das rührt
daher, dass sie keinen Bezug zur Gesamtzahl der beteiligten Allele
haben. Hier kann jedoch eine kleine Normierung abhelfen: Nehmen wir
kurz an, jeder Gründer besitze zwei verschiedene Allele, die
sich zudem von den Allelen aller anderen Gründer unterscheiden.
Kommt eines solches Allel in einem Verwandtschaftsgraphen an zwei
Stellen vor, so sind die beiden Kopien "identisch aufgrund der
Abstammung" (identical by descent, wofür die Abkürzung
ibd gebräuchlich ist). Insgesamt gibt es in einem solchen
Szenario 2g
verschiedene Alleltypen. Wird aus dem Genom von x
und y
je ein Allel zufällig herausgegriffen, so ist die Wahrscheinlichkeit,
dass sie gleich sind, gerade 2g Q(x, y).
Anstelle dieses Gedankenexperiments kann man den Ausdruck "identisch
aufgrund der Abstammung" verwenden, wenn sich zwei identische
Allele letztlich von einem Gründerallel herleiten. Unter
dem Strich bedeutet das, Q(x, y)
und P2(z)
mit 2g
zu multiplizieren, um zwei populationsgenetische Kenngrößen
z erhalten, in denen die künstliche g-Abhängigkeit
verschwunden ist.
In der Populationsgenetik wird
mit folgenden Größen gearbeitet (wobei g
die Anzahl der Gründer ist):
Definitionen:
- Der Verwandtschaftskoeffizient
(kinship coefficient, F-coefficient oder coancestry)
ist definiert als f(x, y) = 2g Q(x, y),
d.h. als Wahrscheinlichkeit, dass zwei Allele eines Genorts, die zufällig
aus dem Genom der Individuen x
und y
herausgegriffen werden, "aufgrund der Abstammung" identisch
sind.
- Der Inzuchtkoeffizient
(inbreeding coefficient) des Individuums z
ist definiert als F(z) = f(x, y) = 2g Q(x, y) = 2g P2(z),
wobei x
und y
die Eltern von z
sind. F(z)
ist die Wahrscheinlichkeit dafür, dass die beiden Allele, die
z
trägt, "aufgrund der Abstammung" identisch sind.
Ist z
Kind von x
und y,
so gilt also
Sind x
und y
nicht miteinander verwandt, so ist f(x, y) = 0
(denn das seltene Allel kann dann höchstens von einem dieser
beiden getragen werden). Ist z
ein Gründer, so gilt F(z) = 0,
da z
das seltene Allel höchstens in einfacher Ausführung tragen
kann.
Um diese Größen ohne
großen Aufwand berechnen zu können, benötigen wir einige
nützliche Beziehungen:
Satz: In beliebigen
Verwandtschaftsgraphen gilt
-
Wird aus einem
Individuum x
zufällig eines der beiden Allele ausgewählt, so ist die
Wahrscheinlichkeit, dass es sich um das seltene Allel handelt, gleich
1/(2g),
d.h. sie ist für alle Individuen gleich. Mit den obigen
Bezeichnungen kann das in Form einer Gleichung so ausgedrückt
werden: (1/2) ×P1(x) + P2(x) = 1/(2g)
für alle Individuen x.
Das verallgemeinert die Aussage P(x) = 1/g,
die nur in inzuchtfreien Graphen gilt (siehe Punkt 1 von Satz
1 des vorigen Abschnitts) und kann auch so formuliert werden:
Der Erwartungswert der
Zahl der Kopien des seltenen Allels, die x
trägt (er ist allgemein durch P1(x) + 2P2(x)
gegeben), hat für jedes Individuum x
den Wert 1/g.
- Seien x
und y
zwei Individuuen,
x kein Vorfahr von y,
x ¹ y,
und seien a
und b
die Eltern von x.
Alle sonstigen
Verwandtschaftsverhältnisse können beliebig sein. Dann
gilt
f(x, y) = |
1
|
( f(a, y) + f(b, y) ) . |
2 |
|
(4) |
Diese Formel
ist auch anwendbar, wenn y
mit a
oder b
übereinstimmt.
- Seien x
und y
zwei Individuuen, x
kein Vorfahr von y
und y
kein Vorfahr von x,
x ¹ y,
und a,
b,
c und d
deren Eltern gemäß folgendem Schema
wobei alle sonstigen Verwandtschaftsbeziehungen beliebig sein können.
Dann gilt
f(x, y) = |
1
|
( f(a, c) + f(a, d) + f(b, c) + f(b, d) ) . |
4 |
|
(5) |
Diese Formel
ist auch anwendbar, wenn die vier Eltern nicht alle voneinander
verschieden sind. Haben etwa x
und y
dieselbe Mutter, so wird einfach a = c
gesetzt.
-
Für jedes Individuum
x
gilt
f(x, x) = |
1
|
( 1 + F(x) ) . |
2 |
|
(6) |
Biologen benutzen
dieses Resultat bei der Erforschung der Rolle der Selbstbefruchtung
(auf die wir hier nicht eingehen).
Beweis:
- Diese Eigenschaft überträgt sich von den Eltern auf
jedes Kind. Sie kann ganz ähnlich wie Punkt 1 von Satz 1 des
vorigen Anschnitts bewiesen
werden (Übungsaufgabe).
- Wir greifen zufällig ein Allel aus dem Genom von x
und eines aus dem Genom von y
heraus. Da x ¹ y
ist, können wir x
durch ein beliebiges Kind von a
und b
ersetzen und die Rekombination nachspielen: Von Vater und Mutter
wird je ein Allel zufällig ausgewählt, und von diesen
beiden wird wiederum zufällig eines gezogen. Unabhängig
davon (was möglich ist, weil y
kein Nachkomme von x
ist) wird ein Allel zufällig aus y
gezogen. Die Wahrscheinlichkeit, dass beide mit dem seltenen Allel
übereinstimmen, ist daher genau durch (4)
gegeben.
- Formel (5) folgt aus (4)
durch zwei weitere Anwendungen von (4).
- Aus dem Geom von x
wird zweimal ein Allel zufällig ausgewählt (mit
Wahrscheinlichkeit
1/2 also beide Male dasselbe). Sind die Eltern von
x
nicht im Graphen enthalten (d.h. ist x
ein Gründer), so ist F(x) = 0,
und eine triviale Überlegung ergibt, dass f(x, x) = 1/2
ist, andernfalls gehen wir ähnlich wie im Beweis von Punkt
2 zu den Eltern a
und b
von x
zurück: Je ein väterliches und ein mütterliches Allel
wird zufällig gezogen. Mit einer Wahrscheinlichkeit von f(a, b)/(2g),
was gemäß (3) gleich f(x)/(2g)
ist, stimmen beide mit dem seltenen Allel überein. Für
jedes einzelne besteht gemäß Punkt 1 die Wahrscheinlichkeit
1/(2g),
das seltene Allel zu sein. Nun wird aus diesen beiden Allelen zweimal
ein Allel zufällig ausgewählt. 2g
mal der Wahrscheinlichkeit, dass man beide Male das seltene Allel
in Händen hält, kombiniert sich daher genau zu (6).
Punkt 1 hat eine
anschauliche Bedeutung: Die Größe P1(x) + 2 P2(x)
-
also das Doppelte von (1/2) ×P1(x) + P2(x)
- ist die mittlere Anzahl der Kopien
des seltenen Allels, die x
trägt (wobei sich der Ausdruck mittlere auf eine große
Zahl von Durchgängen des gesamten Prozesses bezieht). Sie ist für
alle Individuen gleich, nämlich 1/g.
Mit Hilfe von (3)
bis (6)
können Verwandtschafts- und Inzuchtkoeffizienten durch sukzessives
Zurückschreiten bis zu den Gründern -
oder bis zu nichtverwandten Vorfahren - berechnet
werden (was in der Praxis der Populationsgenetik meist von Computerprogrammen
übernommen wird).
Wie soll nun der
Verwandtschaftsgrad zwischen zwei Individuen x
und y
definiert werden? Zwei Schwierigkeiten müssen überwunden werden:
- Wie wir im vorigen
Abschnitt gesehen haben, trägt in einem inzuchtfreien Verwandtschaftsgraphen
jedes Individuum das seltene Allel entweder gar nicht oder einfach.
Ist Inzucht im Spiel, so kann ein Individuum das seltene Gen auch
zweifach tragen. Das sollte beim Vergleich zweier Induividuen
berücksichtigt werden: Tragen x
und y
beide das seltene Gen zweifach, so sind sie (in Bezug auf den betrachteten
Genort) genetisch identisch, nicht aber, wenn x
es einfach und y
es zweifach trägt. Die Wahrscheinlichkeiten, mit denen diese
beiden Fälle eintreten, sollten verschieden gewichtet werden.
- Die Größen P(y|x)
und P(x|y),
die für inzuchtfreie Verwandtschaftsgraphen den Verwandtschaftsgrad
definieren, stimmen nun nicht notwendigerweise miteinander überein.
Um daher ein symmetrisches Maß für die Nähe
der Verwandtschaft zu erhalten, benötigen wir eine neue Idee.
Die erste Schwierigkeit
lösen wir, indem wir die prognostizierte Allelverteilung in den
(hypotetischen) Nachkommen von x
und y
betrachten, d.h. indem wir den Mechanismus der Vererbung als Gewichtungskriterium
benutzen:
f(x, y)
ist (bis auf den Faktor 2g)
die Wahrscheinlichkeit, bei beliebigem Herausgreifen je eines Allels
aus x
und y
beide Male das seltene Allel
zu ziehen. Normieren wir dies, indem wir durch f(x, x)
dividieren, so haben wir bereits ein brauchbares Distanzmaß gefunden.
Für genetisch identische Individuen ist es 1,
und wir können es sogar als bedingte Wahrscheinlichkeit interpretieren:
f(x, y)/f(x, x)
ist die Wahrscheilichkeit, aus x
und y
beide Male das seltene Allel
zu ziehen, vorausgesetzt, es wurde bei zweimaligem unabhängigen
Herausgreifen eines Allels aus x
beide Male das seltene Allel gezogen. Die zweite Schwierigkeit wird
gelöst, indem aus f(x, y)/f(x, x)
und der entsprechenden Größe
f(x, y)/f(y, y),
in der x
und y
ihre Rollen vertauscht haben,
das geometrische Mittel gebildet wird. Wird nun noch (6)
für x
und y
angewandt, so gelangen wir
zur
Definition:
Als
Verwandtschaftsgrad (coefficient
of relationship) zweier
Individuen x
und y
in einem
beliebigen Verwandtschaftsgraphen wird die Größe
r(x, y) = |
2 f(x, y)
|
|
( (1 + F(x)) (1 + F(y)) )1/2 |
|
(7) |
bezeichnet.
In inzuchtfreien Verwandtschaftsgraphen
- stimmt r(x, y)
mit unserer früheren Definition (1)
des vorigen Abschnitts überein (Beweis: Übungsbeispiel),
- ist für beliebige Individuen
r(x, y) = 2 f(x, y),
d.h. Verwandtschaftsgrad und Verwandtschaftskoeffizient sind bis auf
einen Faktor
2 gleich (Beweis: Übungsaufgabe), und
- gilt
immer F(x) = 0,
d.h. der Inzuchtkoeffizient jedes Individuums ist null. Mit (6)
gilt in diesen Graphen für jedes Individuum f(x, x) = 1/2.
Diese Beziehungen gelten auch
in beliebigen Verwandtschaftsgraphen, wenn es unter den Vorfahren von
x
und y
keine Inzucht gegeben hat. Im allgemeinen Fall (also inklusive möglicher
Inzucht) stimmt r(x, y)
zwar nicht unbedingt mit P(y|x)
oder P(x|y)
überein, hat aber in vielen Fällen einen recht ähnlichen
Wert.
Sehen wir uns nun einige Beispiele
an.
- Kinder aus einer "Geschwisterehe"
(die der Überlieferung nach etwa von den altägyptischen
Pharaonen praktiziert wurde):
Um Verwandtschaftsgrad und
Inzuchtkoeffizienten von x
und y
zu berechnen, gehen wir Schritt für Schritt vor:
- Die Gründer c
und d
sind nicht miteinander verwandt, daher ist f(c, d) = 0,
F(c) = F(d) = 0
und, mit (6),
f(c, c) = f(d, d) = 1/2.
- Mit (3) wird F(a) = F(b) = f(c, d) = 0,
mit (6) folgt daraus f(a, a) = f(b, b) = 1/2.
- Mit (5) finden wir f(a,b) = (1/4) × (f(c, c) + f(c, d) + f(d, c) + f(d, d)) = 1/4
(der Verwandtschaftskoeffizient für Geschwister mit nichtverwandten
Eltern).
- Mit (3) wird F(x) = F(y) = f(a, b) = 1/4.
- Mit (5) wird f(x,y) = (1/4) × (f(a, a) + f(a, b) + f(b, a) + f(b, b)) = 3/8.
- Schließlich liefert (7) r(x, y) = 2 f(x, y) ( (1 + F(x)) (1 + F(y)) )-1/2 = 3/5.
Die Rechnung mag aufwendiger aussehen als sie ist: Genau genommen
sind nur die letzten beiden Schritte nichttrivial. Alles andere folgt
unmittelbar daraus, dass der reduzierte Graph, der durch das Weglassen
von x
und y
entsteht, baumartig ist. Für Schritt 4 kann verwendet werden,
dass in inzuchtfreien Graphen Verwandtschaftskoeffizient =
(1/2) × Verwandtschaftsgrad gilt, wodurch sich
die Berechnung auf das Abzählen von -Ecken
reduziert.
Der Verwandtschaftsgrad der Kinder aus einer Geschwisterehe beträgt
also 3/5
(im Vergleich zu 1/2
für Geschwister mit nichtverwandten Eltern). Die Inzuchtkoeffizienten
von x
und y
sind beide gleich 1/4.
Übungsaufgabe: a
trage das seltene Allel in einfacher Ausführung. Berechnen Sie
die Wahrscheinlichkeit dafür, dass x
es zweifach besitzt! (Falls a
weiß, dass sie ein Allel trägt, das in Homozygoten eine
Erbkrankheit hervorruft, so ist das die von ihr angestellte Risikorechnung).
- Kinder aus einer "Vetternehe":
Hier geht man analog zum vorigen
Beispiel vor. Da der reduzierte
Graph, der durch das Weglassen von x
und y
entsteht, baumartig ist, bleiben zwei nichttriviale Rechnungen
übrig. Die Resultate sind: r(x, y) = 9/17
(was nur wenig größer als der Wert 1/2
für Geschwister mit nichtverwandten
Eltern ist) und F(x) = F(y) = 1/16
(was nur ein Viertel des Werts 1/4
für Kinder aus Geschwisterehen ist). Die Vetternehe bringt also
wesentlich weniger genetische Gefahren mit sich als die Geschwisterehe.
Übungsaufgabe: Führen Sie die Rechungen aus!
Diese Beispiele
illustrieren, wie Inzucht die Verwandtschaftsgrade reduziert. Das ist
vor allem dann bedeutsam, wenn es ganze (z.B. kleine) Populationen betrifft.
Während der Inzuchtkoeffizient die Gefahren misst, die Inzucht
für einzelne Individuen mit sich bringt, drückt der
Anstieg von Verwandtschaftsgraden den Verlust an genetischer Variabilität
(Verschiedenheit) aus: Ein hoher Verwandtschaftsgrad zwischen vielen
Individuen in einer Population impliziert, dass sie einander wahrscheinlich
genetisch recht ähnlich sind. Ein hoher Inzuchtkoeffizient der
einzelnen Individuen deutet hingegen an, dass sie wahrscheinlich an
vielen Genorten homozygot sind, er sagt aber nichts über die Reichhaltigkeit
des Genpools aus. Das ist nicht ganz dasselbe, obwohl beides durch Inzucht
verursacht werden kann. Der Zusammenhang zwischen den beiden Größen
ergibt sich aus (3):
Ein hoher Verwandtschaftsgrad zwischen Eltern führt zu genetischen
Gefahren für deren Nachkommen.
Wie
nachhaltig ist Inzucht? |
Fortgesetzte Inzucht
(wie sie aus familienpolitischen Gründen in manchen Herrscherhäusern
vorkam) akkumuliert die genetischen Gefahren. Allerdings ist es möglich,
dies mit einem Schlag wieder gut zu machen. Sehen wir uns den folgenden
Graphen an:
x
stammt aus einer inzestuösen Verbindung, heiratet y
aus einer nicht verwandten Familie und zeugt mit ihr die Kinder u
und w.
Wie sehen die Verwandtschaftsgrade innerhalb der Familie {x, y, u, w}
aus und wie die Inzuchtkoeffizienten der Kinder u
und w?
Klarerweise ist F(y) = 0,
und aus dem oben durchgerechneten
Beispiel der Geschwisterehe ergibt sich F(x) = 1/4.
Da x
und y
nicht miteinander verwandt sind, ist f(x, y) = r(x, y) = 0,
woraus unmittelbar F(u) = F(w) =
0 folgt. Da der Vater x
eine verstärkte Neigung hat, das seltene Allel zweifach zu tragen,
sind die Geschwister u
und w
untereinander und mit ihm näher verwandt, als bei inzuchtfreien
Vorfahren zu erwarten wäre: Die Berechnung ergibt r(u, w) = 9/16 » 0.563
und r(u, x) = r(w, x) = 51/2/4 » 0.559.
Zur Mutter haben u
und w
den üblichen Verwandtschaftsgrad 1/2.
Wichtig ist, dass die Inzuchtkoeffizienten der Kinder u
und w
gleich 0
sind. Das bedeutet, dass diese nicht mehr den genetischen Gefahren,
die Inzucht mit sich bringen kann, ausgesetzt sind. Wenn nun also z
seiner Schwester
y den Vorwurf macht, sie schädige durch eine solche
Verbindung ihren eigenen Nachwuchs, so hat er definitiv nicht
recht.
|