Jahrestagungen
Prof. Dr. Dafydd Gibbon (Universität Bielefeld)
Generalisierbarkeit von korpuslinguistischen Methoden aus sprachtypologischer Sicht
Abstract
Dieser Beitrag hinterfragt die Anwendbarkeit von korpuslinguistischen Verfahren für die Analyse von sprachlichen Materialien, die im Rahmen der Untersuchung weniger erforschter Sprachen entstehen. Hier geht es vorwiegend um einige Sprachen Westafrikas (die Kwa-Sprachen Ega und Baule, sowie die Lower-Cross-Sprache Ibibio) und deren lexikalische und morphosyntaktische Prosodie.
Nach einer Charakterisierung heutiger korpuslingusitischer Methoden und Anwendungsbereiche wird anhand einiger Beispiele aus der feldforschungsnahen Praxis gezeigt, dass bisherige korpuslinguistische Methoden noch nicht soweit generalisierbar sind, dass sie sich sprachunabhängig einsetzen lassen.
Die Analyseverfahren für sprachliche Korpora zeigen entlang der drei klassischen Dimensionen linguistischer Analyse - Gegenstandsbereich, empirische Methoden und formale Methoden - eine bemerkenswerte Vielfalt.
Traditionell werden in der Korpuslinguistik Klassifikationsverfahren beispielsweise eingesetzt, um paradigmatische Eigenschaften und syntagmatische Gruppierungen von sprachlichen Einheiten empirisch zu erfassen. Die dadurch erfassten Einheiten reichen vom Phonem über Morpheme und Wörter bis hin zu Mehrworteinheiten.
Verwandte Methoden werden in der Sprachtechnologie verwandt, einerseits um statistische Modelle für die automatische Spracherkennung zu trainieren, andererseits um geeignete Einheiten für die hochqualitative Sprachsynthese mit komplexen Gewichtungsberechnungen in Korpora zu finden und in neuen Kombinationen zu verketten.
Für weniger erforschte Sprachen ergeben sich jedoch in der Regel sofort Hürden, die von der Nichtanwendbarkeit qualitativer Verfahren mangels adäquater praktischer Sprachkompetenz bis hin zu typologisch andersartigen Sprachen, etwa Tonsprachen, die z.T. grundsätzlich anders strukturierte Modelle für statistische Untersuchungen erfordern. Für die neue Disziplin der Dokumentarlinguistik - documentary linguistics - stellt dies eine große interdisziplinäre Herausforderung dar.
In diesem Beitrag wird die Problematik der Generalisierbarkeit anhand von prosodischen Untersuchungen zu einigen westafrikanischen Sprachen im Kontext von Anwendungen in der Sprachsynthese diskutiert.
