Klassische Elektrodynamik als relativistische Theorie


Franz Embacher

Fakultät für Physik der Universität Wien

 
Die klassische Elektrodynamik, definiert durch die Maxwell-Gleichungen (wobei hier vorausgesetzt wird, dass – abgesehen von den Ladungen und Strömen, die als Quellen des elektromagnetischen Feldes auftreten – Vakuum herrscht, also keine Materie vorhanden ist), ist eine relativistische Theorie, die bereits vor der Entwicklung der Speziellen Relativitätstheorie existierte! Die Viererschreibweise bringt den relativistischen Charakter der Theorie explizit zum Ausdruck.


Warum die klassische Elektrodynamik der galileischen Physik widerspricht

Es gibt eine Reihe von Argumenten, die zeigen, dass die klassische Elektrodynamik nicht mit der nichtrelativistischen (galileischen) Physik verträglich ist. Das schlagkräftigste ist dieses: In den Maxwell-Gleichungen treten zwei Konstanten auf, $\varepsilon_{\!0}$ und $\mu_0$ (die elektrische und die magnetische Feldkonstante). Obwohl man ihre Werte durch die Wahl des Einheitensystems ein bisschen ändern kann, bleibt eine Tatsache davon unberührt: Die Kombination

$$c={1\over\sqrt{\varepsilon_{\!0}\mu_0}}$$  
$(1)$

hat die Dimension einer Geschwindigkeit. Die Analyse der Maxwell-Gleichungen im quellfreien Raum ergibt, dass $c$ die Ausbreitungsgeschwindigkeit (genauer: die Phasengeschwindigkeit) elektromagnetischer Wellen ist.

Ist Ihnen etwas aufgefallen? Wenn die Maxwell-Gleichungen den Anspruch erheben, die elektromagnetischen Phänomene so zu beschreiben, wie sie in Bezug auf ein beliebiges Intertialsystem beobachtet werden, dann sagen sie etwas voraus, das für die galileische Physik absurd ist und dem Konzept der Galileitransformationen widerspricht: eine universelle Ausbreitungsgeschwindigkeit von Wellen! Ein und dieselbe Welle breitet sich, von allen Inertialsystemen aus betrachtet, mit der gleichen Geschwindigkeit $c$ aus, unabhängig davon, wie sich die Inertialsysteme relativ zueinander bewegen.

Um dieses Problem im Rahmen der galileischen Physik zu reparieren, müssten die Maxwell-Gleichungen in ihrer herkömmlichen Form auf einen bestimmten Bewegungszustand von Beobachtern bezogen sein. In relativ dazu bewegten Systemen müssten die elektromagnetischen Erscheinungen dann durch andere Gleichungen beschrieben werden. Wir verfolgen diese Möglichkeit (die auch von der experimentellen Beobachtung widerlegt wird) nicht weiter, sondern werden nun die Maxwell-Gleichungen in einer Weise umformulieren, die ihren relativistischen Charakter klar macht.


Relativistische Kovarianz

Entsprechend dem Formalismus der relativistischen Mechanik bezeichnen wir die Raumzeit-Koordinaten, auf die sich ein Intertialsystem bezieht, mit $x^0=ct$, $x^1=x$, $x^2=y$ und $x^3=z$. Ab jetzt wird es entscheidend sein, ob Indizes hoch- oder tiefgestellt sind. Griechische Indizes laufen von $0$ bis $3$, so dass $x^\mu$ alle vier Raumzeit-Koordinaten bezeichnet.

Eine Koordinatentransformation von einem Inertialsystem, das Raumzeit-Koordinaten $x^\mu$ verwendet, auf ein Inertialsystem, das Raumzeit-Koordinaten $\widetilde{x}^\mu$ verwendet, kann gemäß der speziellen Relativitätstheorie stets in der Form

$$\widetilde{x}^\mu=\Lambda^\mu{}_\nu x^\nu +a^\mu$$  
$(2)$

geschrieben werden, wobei $\Lambda$ eine $4\times 4$-Lorentzmatrix ist (also eine Lorentztransformation beschreibt). Die Zahlen $a^\mu$ entsprechen lediglich räumlichen Verschiebungen und Verschiebungen des Zeitnullpunkts, und wir werden sie im Folgenden gleich $0$ setzen, d.h. uns auf Lorentztransformationen beschränken. Lorentztransformationen umfassen alle räumlichen Drehungen und Drehspiegelungen, aber auch – und das interessiert uns hier besonders – Transformationen zwischen zueinander bewegten Systemen. Die bekannten Geschwindigkeitstransformationen (Boosts) in $x$-Richtung werden durch Lorentz-Matrizen der Form

$\Lambda\equiv(\Lambda^\mu{}_\nu)=\left(\begin{array}{cccc} \large\gamma & \large-{v\over c}\gamma & 0 & 0\\ \large-{v\over c}\gamma & \large\gamma & 0 & 0\\ 0 & 0 & 1 & 0\\ 0 & 0 & 0 & 1 \end{array}\right)$     mit     $\large\gamma={\Large 1\over\large\sqrt{\Large 1-{\Large v^2\over \Large c^2}}}$  
$(3)$

beschrieben, wovei $|v| < c$ ist. $v$ ist die Relativgeschwindigkeit der beiden Systeme.

Wichtig für uns ist nun, dass jede Lorentztransformation umkehrbar ist. Dementsprechend sind die Lorentz-Matrizen invertierbar. Zu jeder Lorentz-Matrix $\Lambda$ gibt es eine inverse Lorentz-Matrix $\Lambda^{-1}$, die die durch $\Lambda$ beschriebene Transformation wieder rückgängig macht.

Wir bezeichnen nun eine physikalische Größe, die in jedem Inertialsystem vier Komponenten (also etwa $u^\mu$ und $\widetilde{u}^\mu$ in zwei verschiedenen Inertialsystemen) besitzt, als Vierervektor, wenn sie "genauso transformiert wie die Raumzeit-Koordinaten", d.h. wenn

$$\widetilde{u}^\mu=\Lambda^\mu{}_\nu u^\nu$$  
$(4)$

gilt. Hoch- und tiefgestellte Indizes können mit Hilfe der Minkowski-Metrik $\eta_{\mu\nu}$ oder ihrer Inversen $\eta^{\mu\nu}$ (deren Komponenten durch die gleiche Diagonalmatrix mit $1$, $-1$, $-1$ und $-1$ auf der Diagonale gegeben sind) ineinander umgewandelt werden. So können wir etwa $u_\mu=\eta_{\mu\nu}u^\nu$ und $u^\mu=\eta^{\mu\nu}u_\nu$ schreiben. Die "kontravarianten" Komponenten $u^\mu$ und die "konarianten" Komponenten $u_\mu$ stellen den gleichen Vierervektor (also das gleiche Objekt in der Geometrie der Raumzeit) dar. Beim "Indexziehen" werden lediglich ein paar Vorzeichen umgedreht – es ist also rechnerisch keine große Sache. Grössen mit mehr als einem Index, die beispielsweise Komponenten vom Typ $w^{\mu\nu}$ besitzen, werden als Vierertensoren bezeichnet, wenn ihr Transformationsverhalten für jeden Index einen $\Lambda$-Faktor wie in $(4)$ enthält. Für einen Tensor vom Typ $w^{\mu\nu}$ heißt das

$$\widetilde{w}^{\mu\nu}=\Lambda^\mu{}_\rho \Lambda^\nu{}_\sigma w^{\rho\sigma}$$  .
$(5)$

Die Metrik selbst ändert ihre Komponenten unter einer Lorentztransformation nicht, da für jede Lorentz-Matrix $\widetilde{\eta}^{\mu\nu}=\Lambda^\mu{}_\rho \Lambda^\nu{}_\sigma \eta^{\rho\sigma}=\eta^{\mu\nu}$ gilt. (Sie wird daher auch numerisch invarianter Tensor genannt). Der springende Punkt ist nun, dass das Verschwinden eines Vierertensors in einem Inertialsystem das Verschwinden dieses Vierertensors in jedem anderen Inertialsystem zur Folge hat. Ist beispielsweise $w^{\mu\nu}=0$, so folgt aus $(5)$ sofort, dass auch $\widetilde{w}^{\mu\nu}=0$ gilt. Ist umgekehrt $\widetilde{w}^{\mu\nu}=0$, so betrachten wir statt $(5)$ die inverse Lorentz-Transformation $w^{\mu\nu}=(\Lambda^{-1})^\mu{}_\rho (\Lambda^{-1})^\nu{}_\sigma \widetilde{w}^{\rho\sigma}$ und erhalten $w^{\mu\nu}=0$. Jedes Naturgesetz, das darin besteht, dass ein Vierertensor verschwindet (oder dass zwei Vierertensoren gleich sind) kann also unabhängig vom verwendeten Inertialsystem formuliert werden. Eine Theorie, deren Grundgleichungen diese Form haben, ist "relativistisch kovariant", d.h. sie nimmt in expliziter Weise in jedem Inertialsystem die gleiche Form an.

Das Konzept des Vierertensors ist auch dann anwendbar, wenn es sich um Größen handelt, die von den Raumzeit-Koordinaten abhängen (Tensorfelder). Wir vertiefen uns nicht in die Details dieser Verallgemeinerung, sondern erwähnen nur, dass die partielle Ableitung eines Tensorfeldes wieder ein Tensorfeld ist: Ist beispielsweise $w^{\mu\nu}$ ein Tensorfeld, so ist auch $a_\rho{}^{\mu\nu}=\partial_\rho w^{\mu\nu}$ ein Tensorfeld, wobei wir $\partial_\rho\equiv\partial/\partial x^\rho$ abkürzen.

Eine weitere wichtige Regel besagt, dass so genannte Kontraktionen, die eine Summe über einen hoch- und tiefgestellten Index beinhalten, wieder auf Tensorfelder führen. Beispiele: Ist $w^{\mu\nu}$ ein Tensorfeld, so ist auch $v^\mu=\partial_\rho w^{\rho\mu}$ eines (und zwar ein Vierervektorfeld). Sind $r^\mu$ und $s^{\mu}$ Tensorfelder, so ist auch $r_\mu s^\mu$ ein Tensorfeld (und zwar ein Viererskalar, also eine Invariante, die in jedem Inertialsystem den gleichen Wert annimmt). Und schließlich sind Vielfache und Summen von Tensorfeldern wieder Tensorfelder.

Dieser Formalismus erlaubt es, tensorielle Größen auf einen Blick zu erkennen und "bausteinartig" miteinander zu kombinieren.


Elektrodynamik in Viererschreibweise

Um die Maxwell-Gleichungen in eine relativistisch kovariante Form zu bringen (ohne ihren Inhalt zu verändern), fassen wir die insgesamt 6 Komponenten des elektrischen und des magnetischen Feldes zur Matrix

$$(F_{\mu\nu})\equiv\left(\begin{array}{cccc} F_{00} & F_{01} & F_{02} & F_{03}\\ F_{10} & F_{11} & F_{12} & F_{13}\\ F_{20} & F_{21} & F_{22} & F_{23}\\ F_{30} & F_{31} & F_{32} & F_{33} \end{array}\right) = \left(\begin{array}{cccc} 0 & E_x/c & E_y/c & E_z/c\\ -E_x/c & 0 & -B_z & B_y\\ -E_y/c & B_z & 0 & -B_x\\ -E_z/c & -B_y & B_x & 0 \end{array}\right)$$  
$(6)$

zusammen. Sie ist antisymmetrisch ($F_{\mu\nu}=-F_{\nu\mu}$), und jede antisymmetrische $4\times 4$-Matrix kann in dieser Form geschrieben werden. Die Gesamtheit ihrer Komponenten heißt elektromagnetischer Feldtensor (oder Feldstärketensor). Die Größen, die die Quellen beschreiben, werden zu

$$(j^\mu)\equiv\left(\begin{array}{c} j^0\\ j^1\\ j^2\\ j^3\\ \end{array}\right) = \left(\begin{array}{c} c\,\rho\\ j_x\\ j_y\\ j_z\\ \end{array}\right)$$  
$(7)$

zusammengefasst. Ihre Gesamtheit und heißt Viererstromdichte. Wir ignorieren diese Namen vorerst und sehen uns an, was wir damit machen können: Die Gruppe der inhomogenen Maxwellgleichungen (die mit $\rho$ und $\vec{j}$) kann kurz und bündig in der Form

$$\partial_\lambda F^{\,\lambda\sigma}=\mu_0\,j^\sigma$$  
$(8)$

geschrieben werden. (Bitte die magnetische Feldkonstante $\mu_0$ nicht mit einem griechischen Index verwechseln!). Die Gruppe der homogenen Maxwellgleichungen (die ohne $\rho$ und $\vec{j}$) kann kurz und bündig in der Form

$$\partial_\lambda F_{\rho\sigma}+\partial_\rho F_{\sigma\lambda}+\partial_\sigma F_{\lambda\rho} =0$$  
$(9)$

geschrieben werden. Und damit sind wir fast fertig!

Wird vorausgesetzt, dass $F_{\rho\sigma}$ und $j^\lambda$ Vierertensoren sind, so sind $(8)$ und $(9)$ kovariante Aussagen, die entweder in einem oder in keinem Inertialsystem gelten. Die Berechtigung dieser Voraussetzung kann nur im Experiment entschieden werden – und tatsächlich gibt es bisher keine Beobachtung, die dem widerspricht. Der Tensorcharakter der Viererstromdichte kann zusätzlich durch das Argument erhärtet werden, dass im Fall einer bewegten Punktladung $j^\lambda$ proportional zur Vierergeschwindigkeit ist.

Mit $(8)$ und $(9)$ haben wir die relativistische Formulierung der Maxwell-Gleichungen erzielt. Mit ihr ist auch das Transformationsverhalten der beiden Felder $\vec{E}$ und $\vec{B}$ aufgeklärt. Gemeinsam bilden sie einen Vierertensor. Beim Übergang auf ein anderes Inertialsystem "transformieren sie ineinander" (ähnlich wie die Komponenten $v_x$ und $v_y$ eines Vektors in der Zeichenebene unter einer Drehung "ineinander transformieren").

Um die Bedeutung des Erreichten noch einmal zu illustrieren, betrachten wir folgende Situation: Wenn man sich für das von einer gleichförmig bewegten Punktladung erzeugte Feld interessiert, so gibt es zwei Wege, dieses zu ermitteln:
  1. Die Maxwell-Gleichungen für eine gleichförmig bewegten Punktladung lösen.
  2. Die Maxwell-Gleichungen für eine ruhende Punktladung lösen und das Ergebnis ($\vec{E}=$ Coulombfeld, $\vec{B}=0$) auf ein bewegtes Inertialsystem umrechnen (und zwar mit $(4)$ und $(5)$, wobei die $u$'s durch die $j$'s und die $w$'s durch die $F$'s zu ersetzen sind).
Mit der relativistischen Formulierung der Maxwell-Gleichungen ist sichergestellt, dass beide Wege zum gleichen Ziel führen! (Es tritt nun auch ein nichtverschwindendes Magnetfeld auf). Und ebenso ist sichergestellt, dass eine umgerechnete Wellenlösung (mit Phasengeschwindigkeit $=c$) auch im neuen Ineratialsystem eine Wellenlösung (mit Phasengeschwindigkeit $=c$) ist.

Ganz allgemein gilt: Ist $(F^{\mu\nu},j^\mu)$ eine Lösung der Maxwell-Gleichungen, und werden Feld und Quellen gemäß $\widetilde{F}^{\mu\nu}=\Lambda^\mu{}_\rho \Lambda^\nu{}_\sigma F^{\rho\sigma}$ und $\widetilde{j}^\mu=\Lambda^\mu{}_\nu j^\nu$ auf ein anderes Inertialsystem umgerechnet, so ist auch $(\widetilde{F}^{\mu\nu},\widetilde{j}^\mu)$ eine Lösung der Maxwell-Gleichungen.

Ausgehend von $(8)$ und $(9)$ treten nun auch andere Bekannte in kovarianter Formulierung auf: Die Kontiniutätsgleichung (Ladungserhaltung) lautet in Viererschreibweise schlicht und einfach

$$\partial_\lambda j^\lambda=0$$  .
$(10)$

Werden die Potentiale in der Form

$$(A^\mu)\equiv\left(\begin{array}{c} A^0\\ A^1\\ A^2\\ A^3\\ \end{array}\right) = \left(\begin{array}{c} \phi/c\\ A_x\\ A_y\\ A_z\\ \end{array}\right)$$  
$(11)$

zum elektromagnetischen Viererpotential zusammengefasst, so wird das elektromagnetische Feld durch sie in der Form

$$F_{\rho\sigma}=\partial_\rho A_\sigma-\partial_\sigma A_\rho$$  
$(12)$

ausgedrückt. Damit ist $(9)$ automatisch erfüllt. In der Lorenz-Eichung, die nun einfach

$$\partial_\rho A^\rho=0$$  
$(13)$

lautet, nimmt $(8)$ die Form

$$\Box A^\nu=\mu_0\,j^\nu$$  
$(14)$

an, wobei der d'Alembert-Operator nun einfach durch $\Box=\partial_\lambda\partial^\lambda$ gegeben ist.

Das Wirkungsprinzip, aus dem die Maxwell-Gleichungen gewonnen werden können, lautet

$$\delta S\equiv \delta\int d^4x\,\left(-{1\over 4\mu_0}F^{\,\rho\sigma}F_{\rho\sigma} -j^\lambda A_\lambda\right)=0$$  .
$(15)$

Energiedichte, Impulsdichte und ihre Stromdichten werden im elektromagnetischen Energie-Impuls-Tensor

$$T^{\,\rho\sigma}={1\over\mu_0}\left(F^{\,\rho\lambda}F_\lambda{}^\sigma+{1\over 4}\eta^{\rho\sigma}F^{\,\lambda\nu}F_{\lambda\nu}\right)$$  
$(16)$

zusammengefasst. Er ist symmetrisch ($T_{\,\rho\sigma}=T_{\sigma\rho}$) und spurfrei ($T^{\,\rho}{}_\rho=0$). Die vier mit ihm verbundenen Gleichungen

$$\partial_\rho T^{\,\rho\sigma}=j_\lambda F^{\,\lambda\sigma}$$  
$(17)$

beschreiben den Austausch von Energie und Impuls zwischen Feld und Quelle. Im quellfreien Fall ($j^\lambda=0$) besagen sie, dass Energie und Impuls des elektromagnetischen Feldes erhalten sind.

Es ist eine gute Übung im Umgang mit der Viererschreibweise, die Gleichungen $(8)$ – $(10)$ und $(12)$ – $(17)$ mit Hilfe von $(6)$, $(7)$ und $(11)$ in die traditionalle Schreibweise zu übersetzen, d.h. durch $\vec{E}$, $\vec{B}$, $\rho$, $\vec{j}$, $\phi$ und $\vec{A}$ auszudrücken!


Physikalische Splitter | Lehrtätigkeit | Quantentheorie | Relativitätstheorie und Kosmologie | Didaktik der Physik
Didaktik der Mathematik | Kostproben aus der Multimedia-Didaktik | Homepage