Projekt "Tiefenerschließung mündlicher Korpora"

Projektlaufzeit: 01/2022 bis 02/2023

Projektleiter:  Dr. Josef Ruppenhofer

Projektmitarbeiter: Dr. Jan Gorisch, Dr. Josef Ruppenhofer

Projektkontext:

Der Programmbereich Mündliche Korpora verfügt als Ergebnis seiner zahlreichen Korpusübernahmen und intensiven Kurationsarbeiten über einen signifikant großen Bestand an mündlichen Korpora, die nun auch in ausreichend kuratierter Form vorliegen. Das mit dem Jahr 2022 neu begonnene Projekt Tiefenerschließung widmet sich den Bestandskorpora des AGD und ihrer tieferen Erschließung mit Methoden der Computerlinguistik/Natural Language Processing.

Im ersten Arbeitspaket sollen Transkripte für (korpus-)linguistische Studien zu Syntax und Semantik aufbereitet werden. Geplant sind Annotationen von Wortarten und syntaktischen Dependenzen nach dem Universal dependencies-Schema sowie von Named entities. Die resultierenden Annotationen sollen in die Datenbank für Gesprochenes Deutsch integriert werden. Weiterhin sollen die Daten und trainierten Modelle neue Anwendungsmöglichkeiten für Computerlinguistik, NLP und Oral-History-Forschung eröffnen.