Projekte

Lehnwörter im Basiswortschatz südslawischer Standardsprachen: LISSL

Das Projekt setzt sich mit Lehnwörtern im Basiswortschatz der südslawischen Standardsprachen Bosnisch, Bulgarisch, Kroatisch, Mazedonisch, Serbisch und Slowenisch auseinander. Der Fokus liegt auf der Überprüfung der gängigen Annahme, wonach der Basiswortschatz einer Sprache gegenüber Entlehnungen resistent sei und in der Regel keine bzw. nur wenige Lehnwörter in sich aufnehme. Ausgangspunkt des Projektes ist ein 1500 Bedeutungen umfassender Basiswortschatz, der in 24 semantisch-lexikalische Gruppen wie z.B. Körperteile, Verwandtschaftsbezeichnungen, Kleidung, menschliche Kognition u. ä. gegliedert ist. Ein zentrales Projektziel ist das Erschließen folgender Informationen der zu eruierenden Äquivalente: (1) ev. vorhandene Synonyme, (2) die Identifikation der Lehnwörter auf der Basis von drei Kategorien (eindeutiges, vermutliches oder kein Lehnwort), (3) die Bestimmung der wahrscheinlichen Gebersprache(n) sowie des entlehnten Materials, (4) der vermutliche Entlehnungszeitpunkt, (5) ev. vorhandene Polysemie, (6) die morphologische Produktivität (Partizipation an Wortbildungsprozessen), (7) die Zugehörigkeit zu einem bestimmten Register/Stil, (8) das Vorkommen in festen Wortverbindungen und Phrasemen und (9) die Vorkommenshäufigkeit der in entsprechenden Nationalkorpora; damit erhält man, eingebettet in einen usage-based approach, eine empirische Einschätzung über den aktuellen Gebrauch der jeweiligen Lehnwörter. Das zweite zentrale Projektziel ist die Implementierung von statistischen Verfahren in der Lehnwortforschung und die empirische Überprüfung von Hypothesen aus dem Bereich der synergetischen Linguistik. So wird auf der Basis der eruierten Daten eine quantitative Interpretation von Entlehnungshierarchien durchgeführt, inklusive eines durch quantitative Daten gestützten Vergleichs des „Lehnwortprofiles“ (Präferenzzonen der Entlehnung) der untersuchten slawischen Sprachen.  Darüber hinaus geht es um die Erstellung einer Ähnlichkeitsmatrix, die eine Messung der Intensität, der Tiefe und des Ausmaßes des Sprachkontaktes und der „Erfolgsrate“ puristischer und sprachplanerischer Tendenzen ermöglichen. Weiters geht es auch um die empirische Überprüfung von Hypothesen zu Wechselbeziehungen von Eigenschaften von Lehnwörtern, wie z.B. Zusammenhänge zwischen der morphologischen und semantischen Diversifikation, dem Alter eines Lehnwortes und dem Vorkommen in idiomatischen Ausdrücken, aber auch um die statistische  Modellierung der Anzahl von Gebersprachen. Die zentrale Innovation des Projektes besteht darin, dass erstmals für einen nach einheitlichen Selektionskriterien erstellten Basiswortschatz der südslawischen Standardsprachen Bosnisch, Bulgarisch, Kroatisch, Mazedonisch, Serbisch und Slowenisch in Form einer öffentlich zugänglichen Online-Datenbank inkl. einer umfassenden Sammlung von Meta-Daten zu den Lehnwörtern zur Verfügung stehen wird. Die Untersuchung der Gebrauchshäufigkeit von Lehnwörtern und die empirische Überprüfung von Hypothesen aus dem Bereich der synergetischen Linguistik versprechen ein umfassendes und systematisches Bild hinsichtlich des Ausmaßes und der Rolle von Lehnwörtern in den südslawischen Sprachen und generelle Evidenz für das Ausmaß von Entlehnungen im Basiswortschatz.

Minimal- und Aufbauwortschatz Slowenisch-Deutsch

Im Mittelpunkt des Projektes steht die Erstellung eines Minimal- und Aufbauwortschatzes Slowenisch – Deutsch. Der Minimalwortschatz umfasst ca. 2000 Lemmata und der Aufbauwortschatz umfasst weitere 2500 Einträge. Insgesamt werden somit ca. 4500 Lemmata in den Minimal- und Aufbauwortschatz „Slowenisch – Deutsch“ aufzunehmen sein. Alle Lemmata werden phonologisch (Akzent) und morphologisch (Wortart u.a.) annotiert und mit jeweiligen Beispielsätzen versehen. Thematisch und methodologisch orientiert sich der Minimal- und Aufbauwortschatz Slowenisch-Deutsch am GERS (Gemeinsamer europäischer Referenzrahmen). Neben inhaltlich-thematischen Kriterien für die Aufnahme in den Minimal- und Aufbauwortschatz wird darüber hinaus der Häufigkeit der aufzunehmenden Lemmata besondere Aufmerksamkeit gewidmet. Als Projektpartner konnte Dr. Tatjana Vučajnk (Universität Klagenfurt) gewonnen werden. Das Projekt wird finanziell durch das Land Kärnten und das Land Steiermark  und andere Institutionen unterstützt. Das Wörterbuch ist 2018 bei Hermagoras/Mohorjeva erschienen.

Paralleltextkorpus slawischer Standardsprachen

Bei diesem Projekt geht es um den Aufbau eines sogenannten Paralleltextkorpus slawischer Standardsprachen. Als Basis wird dabei der russische Roman  Kak zakaljalas‘ stal‘ / Wie der Stahl gehärtet wurde von  N. Ostrovskij herangezogen.  Des weiteren wurden die  Übersetzungen des russischen Originaltextes in das Ukrainische, Weißrussische, Slowakische, Polnische, Tschechische, Obersorbische, Slowenische, Kroatische, Serbische, Mazedonische und Bulgarische besorgt und für die weitere elektronische Verarbeitung zugänglich gemacht. Dieses Parallelkorpus dient in erster Linie als empirische Datenbasis für die Untersuchung unterschiedlicher linguistischer Hypothesen aus dem Bereich der sprachlichen Synergetik, insbesondere aber zu Phonemhäufigkeiten, zur Phonemdistribution und Silben- und Morphemstruktur slawischer Sprachen. Hintergrund für die Verwendung eines Parallelkorpus ist, dass bei einem interlingualen Vergleich ein hoher Grad an Homogenität des Vergleichsmaterials gewährleistet ist. In der deutschen Projektbeschreibung finden sich die wichtigsten Eckdaten zu den verwendeten Texten und erste Analysen zum unterschiedlichen Textumfang und zur Wortlänge. In der englischen Projektbeschreibung wird eine etwas detaillierte Analyse der unterschiedlichen Textlänge in Bezug auf vorkommende Types und Tokens und die Type-Token-Ratio geboten. In beiden Fällen zeigt sich, dass diese quantitativen Eigenschaften der Parallel-Texte durchaus sprachtypologische Rückschlüsse zulassen. Ein erster Versuch der theoretischen Modellierung von im Parallel-Korpus vorkommenden Graphemen (Graphemhäufigkeiten) mit der Hilfe von stetigen Funktionen (eine Neuinterpretation des Zipf’schen Gesetzes) hat gezeigt, dass alle slawischen Sprachen – mit Ausnahme des Weißrussischen – ein und demselben Modell folgen. Das Abweichen des Weißrussischen kann aber mit Einschränkungen durch schriftlinguistische Faktoren begründet werden. In einer einer weiteren Studie wurde vor allem das Verhalten von russischen Graphemhäufigkeiten in unterschiedlichen Kapiteln untersucht, insbesondere aber wiederum die Frage der Gültigkeit von theoretischen Modellen, der Wiederholungsrate und des sogenannten h-Punktes, eines erst in letzter Zeit in die Linguistik eingeführten Lokalisierungspunktes von Graphemrangverteilungen. Für die nahe Zukunft ist eine phonetische/allophonische Kodierung der vorhandenen Texte geplant. Das Paralleltextkorpus ist auch u.a. eine der empirischen Grundlagen, für die Untersuchung von Zusammenhängen und Wechselbeziehungen zwischen dem Phoneminventar, der Phonotaktik und Silben- und Wortstruktur slawischer Sprachen.

Balancierte Datenbank ukrainischer Texte

Es handelt sich ein interdisziplinäres, interuniversitäres und internationales Projekts. Dieses baut auf der Kooperation zwischen dem Institut für Slawistik der Universität Graz (Emmerich Kelih, Peter Grzybek), dem Institut für allgemeine Sprachwissenschaft der Universität Lviv/Lemberg (Solomija Buk) und dem Institut für Theoretische Physik der Ivan Franko Universität Lemberg auf (Andrij Rovenchak). Inhaltlich geht es um  den Aufbau einer text-typologisch balancierten Datenbank zur Erforschung quantitativer Sprach- und Texteigenschaften des Ukrainischen. Gemeinsamer Forschungsschwerpunkt ist die sprachstatistische und quantitative Untersuchung des Ukrainischen (Phonem- Graphemhäufigkeiten, Analyse syntaktischer Eigenschaften, Frequenzwörterbücher bis hin zum Zipf’schen und Menzerath’schen Gesetz). Eine detaillierte Projektbeschreibung der einzelnen Arbeitsetappen ist bereits erschienen. Finanziert wird dieser Arbeitsgruppe durch den österreichischen akademischen Austauschdienst.

Projektmitarbeit

An folgenden Projekten wurde konzeptuell und inhaltlich mitgearbeitet: