Wie aus Wörtern Bedeutung entsteht: Semantische Typen treffen auf syntaktische Dependenzen
Abstract
Sprachwissenschaftler, die sich mit Bedeutung in natürlichen Sprachen befassen, sind sich heutzutage generell einig, dass Bedeutung nicht kompositionell ist, sondern größtenteils vom Kontext abhängt. Diese Erkenntnis führt jedoch zu weiteren Fragen, z.B. den folgenden:
- Was ist als relevanter Kontext anzusehen?
- Kann man bedeutungsdeterminierende Kontexte vorhersagen?
- Können die Elemente bedeutungsdeterminierender Kontexte klassifiziert werden und, wenn ja, wie?
- Können auch "ungewöhnliche" Kontexte Bedeutung determinieren?
- Welche Rolle spielen Syntax und Valenz bei der Bestimmung von Bedeutung?
Auf diese Fragen möchte ich in meiner Präsentation eingehen. Als Grundannahme setze ich voraus, dass Sätze selbstverständlich eine Bedeutung haben, und dass das Verb das Gelenk des Satzes ist. Mithilfe großer Korpora können die Valenzen eines Verbs identifiziert und gemessen werden, ebenso wie die statistisch signifikanten Kollokate, die normalerweise an den entsprechenden Valenzstellen auftreten.
Die statistisch signifikanten Kollokate eines Verbs können ihrem semantischen Typ entsprechend in Gruppen zusammengefasst werden, die die Vorhersage von Bedeutung erlauben. Dies kann jedoch nur statistisch erfolgen, nicht deterministisch, da in natürlichen Sprachen viele Abweichungen, Ausnahmen, und Zwänge (coercions) auftreten. Sprecher machen sich diese üblichen Muster des Sprachgebrauchs zu Nutze, um Bedeutung zu schaffen.
Diese Exploitationen (exploitations) sind – genauso wie Muster – von Regeln geleitet. Daher kann man sagen, dass eine natürliche Sprache durch zwei interaktive Regelsysteme reguliert wird: Regeln zum Kreieren normaler Sätze, und Regeln zum kreativen Umgang mit den Normen.
All dies bedeutet, dass zwei Dinge notwendig sind: a) ein Inventar "normaler" Gebrauchs- und Bedeutungsmuster, die mit jedem Verb verbunden sind, und vor deren Hintergrund man jegliche Vorkommen eines Verbs im konkreten Sprachgebrauch abgleichen kann, und b) ein neuer, empirischer Ansatz für eine linguistische Theorie. Im Gegensatz zu den traditionellen Grundsätzen der Prädikatenlogik ist eine korpusbasierte linguistische Theorie auf der Messung der statistischen Signifikanz von Kollokationsgruppen verschiedener Valenzen und Dependenzen begründet.