Abstract
Sprache – Ton – Bild Codierung gesprochener Sprache: ÖAW – Zentrum Sprachwissenschaften, Bild- und Tondokumentation, Wien 29.-30.1.2009


SOUNDEX – Ein System für die Namentranskription

Auf SOUNDEX wurde ich vor nahezu 20 Jahren in den American Jewish Archives beim Hebrew Union College in Cincinnati/Ohio aufmerksam gemacht, wo die Herausgabe der American Jewish Biography vorbereitet wurde, während ich mit dem Aufbau der Datenbank zur Biographischen Sammlung der ATJB (Austrian Jewish Biography - ÖBL) befaßt war.

Hinter all meinen Publikationen (über 4000 Seiten) der letzten 15 Jahre steht nun dieses Codierungssystem: Für EDV-unterstützte Arbeiten, für Arbeiten mit Datenbanken, hätte es erfunden werden können, ist jedoch viel älter, wurde intensiv von den US-Einwanderungsbehörden auf Ellis Island genützt, um die Namen der Neueinwanderer aus allen Teilen der Welt administrativ zu erfassen, lange bevor es Computer gab. In den USA wurde es bei Volkszählungen, zunächst in jenen von 1880 eingesetzt, von Robert C. Russel ausgearbeitet (Patent 1918), im Laufe der Jahrzehnte weiter und weiter entwickelt, von Daitch-Mokotoff  (Randy Daitch and Gary Mokotoff) bis hin zu Alexander Beider, in ORACLE wurde es implementiert.

Ich verwende für all meine Arbeiten auch weiterhin das alte, vierstellige US-System, in 6 Kategorien – einfach und nach meinen Bedürfnissen modifizierbar: Gerade diese Einfachheit war für mich entscheidend. Im Wesentlichen sprechen jedoch zwei Kritikpunkte gegen die linguistische Anwendung dieses Systems für den deutschen Sprachraum: Die deutsche Phonetik findet zu wenig Berücksichtigung, und im Allgemeinen ist es zu wenig ausdifferenziert. Und genau diese Defizite machen Soundex für mich attraktiv, zum effizientesten Lasso, zu einer perfekten Such- und Sortiermaschine, in komplexen Clusterdatenbanken, bei Namen unterschiedlichster Herkunft.

Ein Lasso? Wozu? In der Donaumonarchie konsolidierte sich die Verschriftlichung von Zunamen erst in den Jahren vor dem Ersten Weltkrieg – in einer Unzahl von amtlichen Namensberichtigungen. Zuvor unterschrieb man sich so, wie man es für gut fand, in Protokollen wieder wurden Namen so festgehalten, wie der Protokollführer sie verstanden hat bzw. was er aus den vorgelegten Dokumenten entziffern konnte – nicht gar so selten kam es dabei zu einem Kompromiss zwischen einer Assimilation in der Verschriftlichung an die jeweilige Landessprache, einer Aufwärtsassimilation - ein „noblerer“ Name, im jüdischen Kontext gab es auch zuweilen das Bestreben, einen Namen so zu modifizieren, dass seine jüdische Herkunft kaum mehr zu erkennen war. Beispiele: Löbl – Lebl – Lebell, Levy – Loewe, Bunzl – Penzl – im letzteren machte man sich auch die Möglichkeiten zunutze, welche die Kurrentschrift zu einer Modifizierung bot (u-e). Und in all diesen Fällen – und vielen anderen mehr greift SOUNDEX, als Lasso.

Für Sie, als Linguisten, haben Codierungssysteme das Ziel, eine möglichst exakte Aussprache zu fixieren, zur wissenschaftlichen Dokumentation. Für mich jedoch, ist eines dieser Codierungssysteme – der US-SOUNDEX - ein Suchinstrument zur Analyse sozialgeschichtlicher und genealogischer Zusammenhänge.Zwei Beispiele:

Beispiel 1: Meine Habilitationsschrift zu den Zwangstaufen jüdischer Findelkinder in Wien. Es waren keine Findelkinder, sondern Kinder jüdischer Dienstmägde, welche im Wiener Gebärhaus geboren und sogleich getauft wuden, bei der Taufe erhielten sie einen anderen Zunamen, wurden von ihren Müttern getrennt und zu christlichen Pflegeeltern gebracht. Die Protokolle sind erhalten. Meine Frage: Wie oft, wie oft geschah das im Leben eines solchen wohl bedauernswerten Wesens? Nun, die Identität dieser jungen Frauen war nicht anonym, da ihre Bedürftigkeit vorerst einmal festgestellt werden mußte, um ihre kostenlose Aufnahme ins Gebärhaus zu ermöglichen. Ob und wieviele Kinder bereits in jener Institution geboren wurden, wurde niemals vermerkt. Je nach „produzierten“ Dokumenten und dem Verständnis (und der Muttersprache) des Schreibers wurden nun die Daten der Neuaufgenommenen festgehalten – zumeist jedes Mal in einer anderen Variante. Die Vornamen halfen nicht, waren amorph: Karoline, Caroline, Lina, Charlotte, ... Judith, Julie, Jula, Giulietta ... SOUNDEX half – erstmals konnte diese Frage geklärt werden.

Beispiel 2: Jüdische Konvertiten und der Austritt aus dem Judentum in Wien – mein derzeitiger Forschungsschwerpunkt. Erstmals konnten Familienzusammenhänge in diesem Kontext dargestellt werden: Bei Familientaufen ist die Sache ja recht einfach, in der zweiten Hälfte des 19. Jhdts waren sie bereits selten. Und doch: In kurzen Zeitabständen, innerhalb von wenigen Tagen, Wochen und Monaten nahmen Ehepartner, Geschwister, Eltern und ihre schon erwachsenen Kinder die Taufe an. In den Taufprotokollen erscheinen ihre Namen allzuoft in verschiedensten Schreibweisen – mit Soundex war hier eine Familienzusammenstellung möglich.

Ich bin mir bewußt, dass diese Beispiele für Sie, als Linguisten, irrelevant sind – möchte jedoch zeigen, dass interdisziplinär Arbeitsmethoden, welche den Einen von wenigem Nutzen erscheinen, von Anderen optimal genützt werden können.

Wien, am 4. Februar 2009

Anna L. Staudacher