Jahrestagungen
Jörg Asmussen
Korpuslinguistische Verfahren zur Optimierung lexikalisch-semantischer Beschreibungen
Abstract
Als Folge des Bestrebens, Sprachgebrauch lexikographisch immer adäquater ermitteln und beschreiben zu können, sind korpuslinguistische Verfahren insbesondere bei der Erarbeitung allgemeinsprachlicher Wörterbücher der Gegenwartssprachen nicht mehr weg zu denken. Ein umfangreiches und variiertes Korpus dient hierbei in der Regel als angenommene Stichprobe des tatsächlichen Sprachgebrauchs und liefert das Material für die eigentliche lexikographische Beschreibung der jeweiligen Sprache, z.B. bei der Erstellung von Stichwortlisten, der Ermittlung von Lesarten oder dem Auffinden von Kollokationen oder illustrativen Textbelegen.
Ein Beispiel für ein so entstandenes, korpusgestütztes Wörterbuch ist "Den Danske Ordbog" (DDO), ein von der Gesellschaft für dänische Sprache und Literatur (DSL) von Grund auf neu erarbeitetes Wörterbuch der dänischen Gegenwartssprache, dessen sechster und letzter Band Ende 2005 erschien. In meinem Vortrag werde ich dieses Wörterbuch kurz vorstellen und anhand eines Beispielartikels zeigen, welche Rolle Korpusauswertungen für dieses Wörter-buch gespielt haben.
Den eigentlichen Hintergrund meines Vortrags bildet allerdings die zurzeit im Rahmen des DSL-Projektes "ordnet.dk" stattfindende Umsetzung dieses ursprünglich für das Buchmedium konzipierten Wörterbuchs in eines, das den prinzipiellen Recherchemöglichkeiten des Computermediums gerechter werden soll. Insbesondere soll als ein Ergebnis der Umsetzung ein begriffsorientierter, onomasiologischer Zugriff auf Wörterbucheinträge ermöglicht werden.
Zunächst werde ich darlegen, welche Rolle eine Optimierung lexikalisch-semantischer Beschreibungen bei einer solchen Umsetzung spielt, wobei unter "Optimierung" hier die gezielte Anpassung der lexikalisch-semantischen Beschreibung an einen bestimmten Zweck zu verstehen ist. Im Rahmen eines herkömmlichen Wörterbuchs schließt dies u.a. die bewusste, gezielte Formulierung von Bedeutungsparaphrasen im Hinblick auf den anvisierten Benutzer ein. Im Rahmen einer sprachtechnologischen Ressource hingegen sollte die Anpassung mögliche sprachtechnologische Anwendungen im Blick haben. In einem solchen Kontext wäre eine logisch konsistente Formalisierung der lexikalisch-semantischen Beschreibung sinnvoll.
Bei der Umsetzung eines herkömmlichen Wörterbuchs in ein so genanntes elektronisches ergibt sich nun die scheinbare Diskrepanz, dass eine Optimierung sowohl den menschlichen Rezipienten im Blick haben muss als auch die sprachtechnologische Verwendung im Hinblick auf eine wirklich sinnvolle Erweiterung der Recherchemöglichkeiten.
Ausgehend von dieser scheinbaren Diskrepanz werde ich anhand der Anpassung des DDO an das Computermedium schließlich zeigen, welche Schwierigkeiten sich hinsichtlich der Bedeutungsbeschreibungen ergeben, wenn diese für einen begriffsorientierten Zugang nutzbar gemacht werden sollen, und ich werde korpuslinguistische Verfahren zur Optimierung lexikalisch-semantischer Bedeutungsbeschreibungen vorstellen, bei denen die Bedeutungsparaphrasen des Wörterbuchs selbst als ein Korpus betrachtet werden. Die vorgestellten Verfahren dienen der Ermittlung von Hyperonymie- bzw. Hyponymiebeziehungen, dem Auffinden signifikanter spezifischer Merkmale sowie der strukturellen Analyse von Bedeutungsparaphrasen im Hinblick auf eine mögliche Formaliserung.
