Abstract
Sprache – Ton – Bild Codierung gesprochener Sprache: ÖAW – Zentrum Sprachwissenschaften,
Bild- und Tondokumentation, Wien 29.-30.1.2009
SOUNDEX – Ein System für die Namentranskription
Auf SOUNDEX wurde ich vor nahezu 20 Jahren in den American Jewish
Archives beim Hebrew Union College in Cincinnati/Ohio aufmerksam gemacht, wo die
Herausgabe der American Jewish Biography vorbereitet wurde, während ich mit dem
Aufbau der Datenbank zur Biographischen Sammlung der ATJB (Austrian Jewish
Biography - ÖBL) befaßt war.
Hinter all meinen Publikationen (über 4000 Seiten) der letzten 15
Jahre steht nun dieses Codierungssystem: Für EDV-unterstützte Arbeiten, für
Arbeiten mit Datenbanken, hätte es erfunden werden können, ist jedoch viel
älter, wurde intensiv von den US-Einwanderungsbehörden auf Ellis Island
genützt, um die Namen der Neueinwanderer aus allen Teilen der Welt administrativ
zu erfassen, lange bevor es Computer gab. In den USA wurde es bei
Volkszählungen, zunächst in jenen von 1880 eingesetzt, von Robert C. Russel ausgearbeitet
(Patent 1918), im Laufe der Jahrzehnte weiter und weiter entwickelt, von
Daitch-Mokotoff (Randy Daitch and Gary
Mokotoff) bis hin zu Alexander Beider, in ORACLE wurde es implementiert.
Ich verwende für all meine Arbeiten auch weiterhin das alte, vierstellige
US-System, in 6 Kategorien – einfach und nach meinen Bedürfnissen
modifizierbar: Gerade diese Einfachheit war für mich entscheidend. Im
Wesentlichen sprechen jedoch zwei Kritikpunkte gegen die linguistische
Anwendung dieses Systems für den deutschen Sprachraum: Die deutsche Phonetik
findet zu wenig Berücksichtigung, und im Allgemeinen ist es zu wenig ausdifferenziert.
Und genau diese Defizite machen Soundex für mich attraktiv, zum effizientesten
Lasso, zu einer perfekten Such- und Sortiermaschine, in komplexen
Clusterdatenbanken, bei Namen unterschiedlichster Herkunft.
Ein Lasso? Wozu? In der Donaumonarchie konsolidierte sich die
Verschriftlichung von Zunamen erst in den Jahren vor dem Ersten Weltkrieg – in
einer Unzahl von amtlichen Namensberichtigungen. Zuvor unterschrieb man sich
so, wie man es für gut fand, in Protokollen wieder wurden Namen so festgehalten,
wie der Protokollführer sie verstanden hat bzw. was er aus den vorgelegten
Dokumenten entziffern konnte – nicht gar so selten kam es dabei zu einem Kompromiss
zwischen einer Assimilation in der Verschriftlichung an die jeweilige
Landessprache, einer Aufwärtsassimilation - ein „noblerer“ Name, im jüdischen
Kontext gab es auch zuweilen das Bestreben, einen Namen so zu modifizieren,
dass seine jüdische Herkunft kaum mehr zu erkennen war. Beispiele: Löbl – Lebl
– Lebell, Levy – Loewe, Bunzl – Penzl – im letzteren machte man sich auch die
Möglichkeiten zunutze, welche die Kurrentschrift zu einer Modifizierung bot
(u-e). Und in all diesen Fällen – und vielen anderen mehr greift SOUNDEX, als
Lasso.
Für Sie, als Linguisten, haben Codierungssysteme das Ziel, eine
möglichst exakte Aussprache zu fixieren, zur wissenschaftlichen Dokumentation.
Für mich jedoch, ist eines dieser Codierungssysteme – der US-SOUNDEX - ein
Suchinstrument zur Analyse sozialgeschichtlicher und genealogischer
Zusammenhänge.Zwei Beispiele:
Beispiel 1: Meine Habilitationsschrift zu den Zwangstaufen
jüdischer Findelkinder in Wien. Es waren keine Findelkinder, sondern Kinder
jüdischer Dienstmägde, welche im Wiener Gebärhaus geboren und sogleich getauft
wuden, bei der Taufe erhielten sie einen anderen Zunamen, wurden von ihren
Müttern getrennt und zu christlichen Pflegeeltern gebracht. Die Protokolle sind
erhalten. Meine Frage: Wie oft, wie oft geschah das im Leben eines solchen wohl
bedauernswerten Wesens? Nun, die Identität dieser jungen Frauen war nicht
anonym, da ihre Bedürftigkeit vorerst einmal festgestellt werden mußte, um ihre
kostenlose Aufnahme ins Gebärhaus zu ermöglichen. Ob und wieviele Kinder
bereits in jener Institution geboren wurden, wurde niemals vermerkt. Je nach
„produzierten“ Dokumenten und dem Verständnis (und der Muttersprache) des
Schreibers wurden nun die Daten der Neuaufgenommenen festgehalten – zumeist
jedes Mal in einer anderen Variante. Die Vornamen halfen nicht, waren amorph:
Karoline, Caroline, Lina, Charlotte, ... Judith, Julie, Jula, Giulietta ...
SOUNDEX half – erstmals konnte diese Frage geklärt werden.
Beispiel 2: Jüdische Konvertiten und der Austritt aus dem Judentum
in Wien – mein derzeitiger Forschungsschwerpunkt. Erstmals konnten Familienzusammenhänge
in diesem Kontext dargestellt werden: Bei Familientaufen ist die Sache ja recht
einfach, in der zweiten Hälfte des 19. Jhdts waren sie bereits selten. Und
doch: In kurzen Zeitabständen, innerhalb von wenigen Tagen, Wochen und Monaten
nahmen Ehepartner, Geschwister, Eltern und ihre schon erwachsenen Kinder die
Taufe an. In den Taufprotokollen erscheinen ihre Namen allzuoft in
verschiedensten Schreibweisen – mit Soundex war hier eine
Familienzusammenstellung möglich.
Ich bin mir bewußt, dass diese Beispiele für Sie, als Linguisten,
irrelevant sind – möchte jedoch zeigen, dass interdisziplinär Arbeitsmethoden,
welche den Einen von wenigem Nutzen erscheinen, von Anderen optimal genützt
werden können.
Wien, am
4. Februar 2009
Anna L. Staudacher