Jahrestagungen
Prof. Dr. Werner Kallmeyer (IDS)
Möglichkeiten der maschinellen Unterstützung bei der Arbeit mit Interaktionskorpora
Abstract
Interaktionskorpora enthalten Ton- bzw. Video-Dokumente von sprachlichen Interaktionen zusammen mit Verschriftlichungen der in diesen Interaktionen gesprochenen Sprache. Zum Standard gehört heute, dass der Text der Verschriftlichung und die Ton- bzw. Video-Aufnahme miteinander verknüpft sind durch ein wortweises oder auf größere Äußerungseinheiten bezogenes Alignment.
Die Transkriptionen verbaler Interaktion zeichnet aus, dass sie zum einen Eigenschaften des Formulierungsprozesses (also Pausen, Abbrüche, Reformulierungen und die dabei auftretenden prosodischen Markierungen) wiedergeben und zum anderen die Eigenschaften des Austausches von Redebeiträgen abbilden (also die Zuordnung des Gesprochenen zu Sprechern und die zeitliche Position der Äußerungen verschiedener Sprecher zueinander, die bei Überlappungen besonders augenfällig ist). In Abhängigkeit von den Untersuchungsinteressen können beide Eigenschaften mit unterschiedlicher Feinheit wiedergegeben werden. In jedem Fall weisen Interaktionstranskripte aber gegenüber der normalen Schriftform von Sprache eine erheblich höhere Komplexität auf. Ihre strukturellen Merkmale werden im Datenmodell zu-sammengefasst, das die Grundlage für die Rechercheoperationen bildet.
Entscheidend für die Recherchemöglichkeiten in Interaktionskorpora sind, über die Erfassung von Formulierungseigenschaften des spontanen Sprechens hinaus, Operatoren für das Auffinden von Interaktionseigenschaften wie Äußerungsanfang oder -ende bzw. Sprecherwechsel. Anhand eines im IDS entwickelten, auf COSMAS basierenden Recherchesystems sollen die Funktionsweise der Rechercheoperatoren und Strategien für die Beispielsuche in Interaktionskorpora demonstriert sowie Entwicklungsmöglichkeiten skizziert werden.
