Zu den anderen Abschnitten:
 


Von Graphen, Genen und dem WWW


Online-Skriptum


Verwandtschaft 2
 

Inzucht

Inzucht, d.h. die Fortpflanzung verwandter Individuen, ist in der Biologie ein bedeutendes Phänomen. Dabei geht es nicht allein um uns Menschen. Von Grundsatzfragen der Evolution über die traditionelle Tier- und Pflanzenzüchtung und Maßnahmen zu Rettung bedrohter Arten bis zur Kontrolle über genetisch wohldefinierte Linien von Versuchstieren ("Labormäusen") reichen die Gebiete, in denen dieses Thema von Interesse ist. Einigen dieser Fragen werden wir in diesem und im nächsten Abschnitt begegnen.

Verwandtschaftsgrade in Graphen mit Inzucht sind mathematisch ein bisschen schwieriger in den Griff zu bekommen als die oben besprochenen inzuchtfreien Familienverhältnisse. Der Grund liegt darin, dass jedes Individuum an jedem Genort zwei Allele besitzt. Unser seltenes Allel wird von einem der Gründer in einfacher Ausführung in den Graphen eingebracht. Kommt es zu Inzucht, so können beide Partner das Allel besitzen, und daher können es alle Nachkommen dieser Verbindung in zweifacher Ausführung besitzen, d.h. an dem betreffenden Genort homozygot sein.

Hierin liegt der Grund, warum Inzucht genetisch nachteilig sein kann. Es gibt zahlreiche Allele, die sich friedlich verhalten (oder sogar von Vorteil sind), wenn sie gemeinsam mit einem anderen Allel vorliegen, aber zu Erbkrankheiten des Trägers führen, wenn sie doppelt vorkommen, d.h. wenn der Träger an dem betreffenden Genort homozygot ist. Interessanterweise können sich derartige Allele trotz ihrer (statistisch gesehen seltenen) nachteiligen Wirkungen in einer Population halten. Inzucht erhöht die Wahrscheinlichkeit, dass es zu diesen nachteiligen Wirkungen kommt. In kleinen Populationen kann Inzucht auch bei zufälliger Paarung häufig vorkommen. Sie wirkt dann bremsend auf das Wachstum der Population, verringert deren genetische Variabilität und verschafft Krankheitserregern, die das Immunsystem knacken, einen Vorteil.

Das gilt aber nur für Arten, bei denen Inzucht zwischen nahen Verwandten selten ist. Für Termiten, über die wir im nächsten Abschnitt sprechen werden, ist sie der Normalfall (während die Paarung mit Nichtverwandten nur anlässlich der Gründung einer neuen Kolonie stattfindet). Das führt dazu, dass jene Allele, die sich in doppelter Ausführung schädlich auswirken, aus dem Genom verschwinden. In der Tier- und Pflanzenzucht werden solche genetischen Rosskuren absichtlich herbeigeführt. Werden verschiedene derartige Inzuchtlinien miteinander gekreuzt, so sind deren Nachkommen oft einige Generationen lang besonders gesund und ertragreich (Heterosis-Effekt).
 

Allgemeine Verwandtschaftsgraphen

Kehren wir zur Formalisierung der Verwandtschaft zurück. Graphen mit Inzucht erfordern ausgeklügeltere Methoden als die im vorigen Abschnitt entwickelten. Weiters interessiert in ihnen nicht nur der Verwandtschaftsgrad zwischen zwei Individuen, sondern auch die Neigung eines Individuums, an einem Genort mit größerer Wahrscheinlichkeit homozygot zu sein, als dies ohne Inzucht der Fall wäre. Wir beschränken wir uns wieder auf einen einzigen Genort, lassen einen zufällig ausgewählten Gründer eines Verwandtschaftsgraphen ein "seltenes Allel" tragen und betrachten zwei Individuen x und y. Beide sind in Besitz eines Allelpaar. Wird von jedem von ihnen in zufälliger Weise je ein Allel herausgegriffen, so bezeichnen wir mit

  • Q(x, y) die Wahrscheinlichkeit, dass beide Male das seltene Allel gezogen wurde.

Bekommen x und y Kinder, so macht der sexuelle Vererbungsmechnismus genau das: Aus jedem der elterlichen Genome wird ein Allel herausgegriffen. Wenn wir

  • P2(z) als die Wahrscheinlichkeit definieren, dass z an dem betreffenden Genort das seltene Allel zweifach besitzt

(d.h. mit diesem Allel homozygot ist), so gilt: Ist z ein Kind von x und y, so ist P2(z) = Q(x, y). P2(z) ist ein Maß dafür, wie sehr z dazu neigt, aus Gründen der Inzucht homozygot zu sein. Ist  z ein Gründer, so ist P2(z) = 0, da es per Definition unter den Gründern nur eine Kopie des seltenen Allels gibt. Die Größe Q macht auch für ein einziges Individuum Sinn: Q(x, x) ist die Wahrscheinlichkeit, dass aus x bei zweimaligem Ziehen (mit Zurücklegen) beide Male das seltene Allel herausgegriffen wird. Ist

  • P1(x) die Wahrscheinlichkeit, dass x an dem betreffenden Genort das seltene Allel einfach besitzt,

so ist Q(x, x) = (1/4) ×P1(x) + P2(x). Wird von den beiden Allelen, die x trägt, nur ein einziges zufällig gezogen, so ist die Wahrscheinlichkeit, dass es das seltene ist, durch (1/2) ×P1(x) + P2(x) gegeben. (Übungsaufgabe: Verifizieren Sie die letzten beiden Formeln! Lassen Sie sich nicht zu dem Fehlschluss verleiten, dass es sich hierbei um Urnenbeispiele handelt: Die Wahrscheinlichkeit, das seltene Allel zweimal zu ziehen, ist hier nicht gleich dem Quadrat der Wahrscheinlichkeit, es einmal zu ziehen - warum nicht?)

Q(x, y) und P2(z) wären an und für sich schon recht brauchbare Maße für Verwandtschaft und Inzucht. Allerdings hängen sie in künstlicher Weise von der Zahl g der Gründer ab, also auch von jenen Teile eines Graphen, die mit den betroffenen Individuen nichts zu tun haben. Das rührt daher, dass sie keinen Bezug zur Gesamtzahl der beteiligten Allele haben. Hier kann jedoch eine kleine Normierung abhelfen: Nehmen wir kurz an, jeder Gründer besitze zwei verschiedene Allele, die sich zudem von den Allelen aller anderen Gründer unterscheiden. Kommt eines solches Allel in einem Verwandtschaftsgraphen an zwei Stellen vor, so sind die beiden Kopien "identisch aufgrund der Abstammung" (identical by descent, wofür die Abkürzung ibd gebräuchlich ist). Insgesamt gibt es in einem solchen Szenario 2g verschiedene Alleltypen. Wird aus dem Genom von x und y je ein Allel zufällig herausgegriffen, so ist die Wahrscheinlichkeit, dass sie gleich sind, gerade 2g Q(x, y). Anstelle dieses Gedankenexperiments kann man den Ausdruck "identisch aufgrund der Abstammung" verwenden, wenn sich zwei identische Allele letztlich von einem Gründerallel herleiten. Unter dem Strich bedeutet das, Q(x, y) und P2(z) mit 2g zu multiplizieren, um zwei populationsgenetische Kenngrößen z erhalten, in denen die künstliche g-Abhängigkeit verschwunden ist.

In der Populationsgenetik wird mit folgenden Größen gearbeitet (wobei g die Anzahl der Gründer ist):

Definitionen:

  • Der Verwandtschaftskoeffizient (kinship coefficient, F-coefficient oder coancestry) ist definiert als f(x, y) = 2g Q(x, y), d.h. als Wahrscheinlichkeit, dass zwei Allele eines Genorts, die zufällig aus dem Genom der Individuen x und y herausgegriffen werden, "aufgrund der Abstammung" identisch sind.
  • Der Inzuchtkoeffizient (inbreeding coefficient) des Individuums z ist definiert als F(z) = f(x, y) = 2g Q(x, y) = 2g P2(z), wobei x und y die Eltern von z sind. F(z) ist die Wahrscheinlichkeit dafür, dass die beiden Allele, die z trägt, "aufgrund der Abstammung" identisch sind.

Ist z Kind von x und y, so gilt also

F(z) = f(x, y).   (3)

Sind x und y nicht miteinander verwandt, so ist f(x, y) = 0 (denn das seltene Allel kann dann höchstens von einem dieser beiden getragen werden). Ist z ein Gründer, so gilt F(z) = 0, da z das seltene Allel höchstens in einfacher Ausführung tragen kann.

Um diese Größen ohne großen Aufwand berechnen zu können, benötigen wir einige nützliche Beziehungen:

Satz: In beliebigen Verwandtschaftsgraphen gilt

  1. Wird aus einem Individuum x zufällig eines der beiden Allele ausgewählt, so ist die Wahrscheinlichkeit, dass es sich um das seltene Allel handelt, gleich 1/(2g), d.h. sie ist für alle Individuen gleich. Mit den obigen Bezeichnungen kann das in Form einer Gleichung so ausgedrückt werden: (1/2) ×P1(x) + P2(x) = 1/(2g) für alle Individuen x. Das verallgemeinert die Aussage P(x) = 1/g, die nur in inzuchtfreien Graphen gilt (siehe Punkt 1 von Satz 1 des vorigen Abschnitts) und kann auch so formuliert werden: Der Erwartungswert der Zahl der Kopien des seltenen Allels, die x trägt (er ist allgemein durch P1(x) + 2P2(x) gegeben), hat für jedes Individuum x den Wert 1/g.

  2. Seien x und y zwei Individuuen, x kein Vorfahr von y, x ¹ y, und seien a und b die Eltern von x.


    Alle sonstigen Verwandtschaftsverhältnisse können beliebig sein. Dann gilt
    f(x, y)   =     1 

      ( f(a, y) + f(b, y) ) .
    2
      (4)

    Diese Formel ist auch anwendbar, wenn y mit a oder b übereinstimmt.

  3. Seien x und y zwei Individuuen, x kein Vorfahr von y und y kein Vorfahr von x, x ¹ y, und a, b, c und d deren Eltern gemäß folgendem Schema


    wobei alle sonstigen Verwandtschaftsbeziehungen beliebig sein können. Dann gilt
    f(x, y)   =     1 

      ( f(a, c) + f(a, d) + f(b, c) + f(b, d) ) .
    4
      (5)

    Diese Formel ist auch anwendbar, wenn die vier Eltern nicht alle voneinander verschieden sind. Haben etwa x und y dieselbe Mutter, so wird einfach a = c gesetzt.

  4. Für jedes Individuum  x gilt

    f(x, x)   =     1 

      ( 1 + F(x) ) .
    2
      (6)

    Biologen benutzen dieses Resultat bei der Erforschung der Rolle der Selbstbefruchtung (auf die wir hier nicht eingehen).

Beweis:

  1. Diese Eigenschaft überträgt sich von den Eltern auf jedes Kind. Sie kann ganz ähnlich wie Punkt 1 von Satz 1 des vorigen Anschnitts bewiesen werden (Übungsaufgabe).
  2. Wir greifen zufällig ein Allel aus dem Genom von x und eines aus dem Genom von y heraus. Da x ¹ y ist, können wir x durch ein beliebiges Kind von a und b ersetzen und die Rekombination nachspielen: Von Vater und Mutter wird je ein Allel zufällig ausgewählt, und von diesen beiden wird wiederum zufällig eines gezogen. Unabhängig davon (was möglich ist, weil y kein Nachkomme von x ist) wird ein Allel zufällig aus y gezogen. Die Wahrscheinlichkeit, dass beide mit dem seltenen Allel übereinstimmen, ist daher genau durch (4) gegeben.
  3. Formel (5) folgt aus (4) durch zwei weitere Anwendungen von (4).
  4. Aus dem Geom von x wird zweimal ein Allel zufällig ausgewählt (mit Wahrscheinlichkeit 1/2 also beide Male dasselbe). Sind die Eltern von x nicht im Graphen enthalten (d.h. ist x ein Gründer), so ist F(x) = 0, und eine triviale Überlegung ergibt, dass f(x, x) = 1/2 ist, andernfalls gehen wir ähnlich wie im Beweis von Punkt 2 zu den Eltern a und b von x zurück: Je ein väterliches und ein mütterliches Allel wird zufällig gezogen. Mit einer Wahrscheinlichkeit von f(a, b)/(2g), was gemäß (3) gleich f(x)/(2g) ist, stimmen beide mit dem seltenen Allel überein. Für jedes einzelne besteht gemäß Punkt 1 die Wahrscheinlichkeit 1/(2g), das seltene Allel zu sein. Nun wird aus diesen beiden Allelen zweimal ein Allel zufällig ausgewählt. 2g mal der Wahrscheinlichkeit, dass man beide Male das seltene Allel in Händen hält, kombiniert sich daher genau zu (6).

Punkt 1 hat eine anschauliche Bedeutung: Die Größe P1(x) + 2 P2(x) - also das Doppelte von (1/2) ×P1(x) + P2(x) - ist die mittlere Anzahl der Kopien des seltenen Allels, die x trägt (wobei sich der Ausdruck mittlere auf eine große Zahl von Durchgängen des gesamten Prozesses bezieht). Sie ist für alle Individuen gleich, nämlich 1/g.

Mit Hilfe von (3) bis (6) können Verwandtschafts- und Inzuchtkoeffizienten durch sukzessives Zurückschreiten bis zu den Gründern - oder bis zu nichtverwandten Vorfahren - berechnet werden (was in der Praxis der Populationsgenetik meist von Computerprogrammen übernommen wird).

Wie soll nun der Verwandtschaftsgrad zwischen zwei Individuen x und y definiert werden? Zwei Schwierigkeiten müssen überwunden werden:

  • Wie wir im vorigen Abschnitt gesehen haben, trägt in einem inzuchtfreien Verwandtschaftsgraphen jedes Individuum das seltene Allel entweder gar nicht oder einfach. Ist Inzucht im Spiel, so kann ein Individuum das seltene Gen auch zweifach tragen. Das sollte beim Vergleich zweier Induividuen berücksichtigt werden: Tragen x und y beide das seltene Gen zweifach, so sind sie (in Bezug auf den betrachteten Genort) genetisch identisch, nicht aber, wenn x es einfach und y es zweifach trägt. Die Wahrscheinlichkeiten, mit denen diese beiden Fälle eintreten, sollten verschieden gewichtet werden.
  • Die Größen P(y|x) und P(x|y), die für inzuchtfreie Verwandtschaftsgraphen den Verwandtschaftsgrad definieren, stimmen nun nicht notwendigerweise miteinander überein. Um daher ein symmetrisches Maß für die Nähe der Verwandtschaft zu erhalten, benötigen wir eine neue Idee.

Die erste Schwierigkeit lösen wir, indem wir die prognostizierte Allelverteilung in den (hypotetischen) Nachkommen von x und y betrachten, d.h. indem wir den Mechanismus der Vererbung als Gewichtungskriterium benutzen: f(x, y) ist (bis auf den Faktor 2g) die Wahrscheinlichkeit, bei beliebigem Herausgreifen je eines Allels aus x und y beide Male das seltene Allel zu ziehen. Normieren wir dies, indem wir durch f(x, x) dividieren, so haben wir bereits ein brauchbares Distanzmaß gefunden. Für genetisch identische Individuen ist es 1, und wir können es sogar als bedingte Wahrscheinlichkeit interpretieren: f(x, y)/f(x, x) ist die Wahrscheilichkeit, aus x und y beide Male das seltene Allel zu ziehen, vorausgesetzt, es wurde bei zweimaligem unabhängigen Herausgreifen eines Allels aus x beide Male das seltene Allel gezogen. Die zweite Schwierigkeit wird gelöst, indem aus f(x, y)/f(x, x) und der entsprechenden Größe f(x, y)/f(y, y), in der x und y ihre Rollen vertauscht haben, das geometrische Mittel gebildet wird. Wird nun noch (6) für x und y angewandt, so gelangen wir zur

Definition:

Als Verwandtschaftsgrad (coefficient of relationship) zweier Individuen x und y in einem beliebigen Verwandtschaftsgraphen wird die Größe

r(x, y)   =     2 f(x, y) 

  
( (1 + F(x)) (1 + F(y)) )1/2
  (7)

bezeichnet.

In inzuchtfreien Verwandtschaftsgraphen

  • stimmt r(x, y) mit unserer früheren Definition (1) des vorigen Abschnitts überein (Beweis: Übungsbeispiel),
  • ist für beliebige Individuen r(x, y) = 2 f(x, y), d.h. Verwandtschaftsgrad und Verwandtschaftskoeffizient sind bis auf einen Faktor 2 gleich (Beweis: Übungsaufgabe), und
  • gilt immer F(x) = 0, d.h. der Inzuchtkoeffizient jedes Individuums ist null. Mit (6) gilt in diesen Graphen für jedes Individuum f(x, x) = 1/2.

Diese Beziehungen gelten auch in beliebigen Verwandtschaftsgraphen, wenn es unter den Vorfahren von x und y keine Inzucht gegeben hat. Im allgemeinen Fall (also inklusive möglicher Inzucht) stimmt r(x, y) zwar nicht unbedingt mit P(y|x) oder P(x|y) überein, hat aber in vielen Fällen einen recht ähnlichen Wert.

Sehen wir uns nun einige Beispiele an.

  • Kinder aus einer "Geschwisterehe" (die der Überlieferung nach etwa von den altägyptischen Pharaonen praktiziert wurde):


    Um Verwandtschaftsgrad und Inzuchtkoeffizienten von x und y zu berechnen, gehen wir Schritt für Schritt vor:
     
    1. Die Gründer c und d sind nicht miteinander verwandt, daher ist f(c, d) = 0, F(c) = F(d) = 0 und, mit (6)f(c, c) = f(d, d) = 1/2.
    2. Mit (3) wird F(a) = F(b) = f(c, d) = 0, mit (6) folgt daraus f(a, a) = f(b, b) = 1/2.
    3. Mit (5) finden wir f(a,b) = (1/4) × (f(c, c) + f(c, d) + f(d, c) + f(d, d)) = 1/4 (der Verwandtschaftskoeffizient für Geschwister mit nichtverwandten Eltern).
    4. Mit (3) wird F(x) = F(y) = f(a, b) = 1/4.
    5. Mit (5) wird f(x,y) = (1/4) × (f(a, a) + f(a, b) + f(b, a) + f(b, b)) = 3/8.
    6. Schließlich liefert (7) r(x, y) = 2 f(x, y) ( (1 + F(x)) (1 + F(y)) )-1/2  = 3/5.

    Die Rechnung mag aufwendiger aussehen als sie ist: Genau genommen sind nur die letzten beiden Schritte nichttrivial. Alles andere folgt unmittelbar daraus, dass der reduzierte Graph, der durch das Weglassen von x und y entsteht, baumartig ist. Für Schritt 4 kann verwendet werden, dass in inzuchtfreien Graphen Verwandtschaftskoeffizient = (1/2) × Verwandtschaftsgrad gilt, wodurch sich die Berechnung auf das Abzählen von -Ecken reduziert.
    Der Verwandtschaftsgrad der Kinder aus einer Geschwisterehe beträgt also 3/5 (im Vergleich zu 1/2 für Geschwister mit nichtverwandten Eltern). Die Inzuchtkoeffizienten von x und y sind beide gleich 1/4.
    Übungsaufgabe: a trage das seltene Allel in einfacher Ausführung. Berechnen Sie die Wahrscheinlichkeit dafür, dass x es zweifach besitzt! (Falls a weiß, dass sie ein Allel trägt, das in Homozygoten eine Erbkrankheit hervorruft, so ist das die von ihr angestellte Risikorechnung).
  • Kinder aus einer "Vetternehe":


    Hier geht man analog zum vorigen Beispiel vor. Da der reduzierte Graph, der durch das Weglassen von x und y entsteht, baumartig ist, bleiben zwei nichttriviale Rechnungen übrig. Die Resultate sind: r(x, y) = 9/17 (was nur wenig größer als der Wert 1/2 für Geschwister mit nichtverwandten Eltern ist) und F(x) = F(y) = 1/16 (was nur ein Viertel des Werts 1/4 für Kinder aus Geschwisterehen ist). Die Vetternehe bringt also wesentlich weniger genetische Gefahren mit sich als die Geschwisterehe.
    Übungsaufgabe: Führen Sie die Rechungen aus!

Diese Beispiele illustrieren, wie Inzucht die Verwandtschaftsgrade reduziert. Das ist vor allem dann bedeutsam, wenn es ganze (z.B. kleine) Populationen betrifft. Während der Inzuchtkoeffizient die Gefahren misst, die Inzucht für einzelne Individuen mit sich bringt, drückt der Anstieg von Verwandtschaftsgraden den Verlust an genetischer Variabilität (Verschiedenheit) aus: Ein hoher Verwandtschaftsgrad zwischen vielen Individuen in einer Population impliziert, dass sie einander wahrscheinlich genetisch recht ähnlich sind. Ein hoher Inzuchtkoeffizient der einzelnen Individuen deutet hingegen an, dass sie wahrscheinlich an vielen Genorten homozygot sind, er sagt aber nichts über die Reichhaltigkeit des Genpools aus. Das ist nicht ganz dasselbe, obwohl beides durch Inzucht verursacht werden kann. Der Zusammenhang zwischen den beiden Größen ergibt sich aus (3): Ein hoher Verwandtschaftsgrad zwischen Eltern führt zu genetischen Gefahren für deren Nachkommen.
 

Wie nachhaltig ist Inzucht?

Fortgesetzte Inzucht (wie sie aus familienpolitischen Gründen in manchen Herrscherhäusern vorkam) akkumuliert die genetischen Gefahren. Allerdings ist es möglich, dies mit einem Schlag wieder gut zu machen. Sehen wir uns den folgenden Graphen an:

x stammt aus einer inzestuösen Verbindung, heiratet y aus einer nicht verwandten Familie und zeugt mit ihr die Kinder u und w. Wie sehen die Verwandtschaftsgrade innerhalb der Familie {x, y, u, w} aus und wie die Inzuchtkoeffizienten der Kinder u und w? Klarerweise ist F(y) = 0, und aus dem oben durchgerechneten Beispiel der Geschwisterehe ergibt sich F(x) = 1/4. Da x und y nicht miteinander verwandt sind, ist f(x, y) = r(x, y) = 0, woraus unmittelbar F(u) = F(w) = 0 folgt. Da der Vater x eine verstärkte Neigung hat, das seltene Allel zweifach zu tragen, sind die Geschwister u und w untereinander und mit ihm näher verwandt, als bei inzuchtfreien Vorfahren zu erwarten wäre: Die Berechnung ergibt r(u, w) = 9/16 » 0.563 und r(u, x) = r(w, x) = 51/2/4 » 0.559. Zur Mutter haben u und w den üblichen Verwandtschaftsgrad 1/2. Wichtig ist, dass die Inzuchtkoeffizienten der Kinder u und w gleich 0 sind. Das bedeutet, dass diese nicht mehr den genetischen Gefahren, die Inzucht mit sich bringen kann, ausgesetzt sind. Wenn nun also z seiner Schwester y den Vorwurf macht, sie schädige durch eine solche Verbindung ihren eigenen Nachwuchs, so hat er definitiv nicht recht.


¬   Verwandtschaft 1 Übersicht Bedrohte Arten, das Schicksal von        
Genen und der Zufall in der Evolution   ®