Neue Version der DGD

Datenbank für Gesprochenes Deutsch 2.10
Seit dem 23.05.2018 steht die neue Version 2.10 der DGD unter http://dgd.ids-mannheim.de zur Verfügung. In dieser Version gibt es folgende wichtige Neuerungen:

(1) Das Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) wurde um 22 Ereignisse im Umfang von insgesamt 27 Stunden erweitert. Unter den neu hinzugekommenen Daten sind verschiedene Typen von Alltagsgesprächen (z.B. Kaffeekränzchen, Tupperparty), institutionelle Interaktionen (Teambesprechung, Physiotherapie) und zwei Wahldebatten aus dem Belgischen Fernsehen. Wir danken Kurt Feyaerts von der KU Leuven sowie Thomas Spranz-Fogasy und Gundula Fofana für erfolgreiche Kooperationen, aus denen ein Teil dieser neuen Daten hervorgegangen ist. FOLK beinhaltet nun insgesamt Daten zu 281 verschiedenen Gesprächen mit 229 Stunden Aufnahmen und 2.22 Millionen transkribierten Tokens.

(2) Mit dem Korpus "Russlanddeutsche Dialekte (RUDI)" ist ein neues Korpus hinzugekommen, das authentische Sprachaufnahmen aus den heute nicht mehr existierenden deutschen Sprachinseln im östlichen Teil der ehemaligen Sowjetunion erfasst. Die knapp 10 Stunden Audio-Aufnahmen aus RUDI sind vollständig literarisch transkribiert und mit einer manuell überprüften orthographischen Normalisierung annotiert. Aufnahmen und Transkripte aus RUDI bilden die Grundlage der Informationsplattform zum Russlanddeutschen: http://prowiki.ids-mannheim.de/bin/view/Russlanddeutsch/WebHome. Wir danken Nina Berend und Elena Frick für die erfolgreiche Zusammenarbeit zur Aufbereitung und Veröffentlichung dieses Korpus.

(3) Das Korpus "Belgische TV-Debatten (BETV)" umfasst zehn Videoaufzeichnungen von Sendungen mit Wahldebatten von je einer Stunde, die anlässlich der Kommunalwahlen in Belgien 2012 vom Fernsehen der Deutschsprachigen Gemeinschaft aufgenommen wurden. Alle deutschsprachigen Gemeinden Belgiens (Amel, Büllingen, Burg Reuland, Bütgenbach, Eupen, Kelmis, Lontzen, Raeren, Sankt Vith) sind in dieser Serie vertreten. Dazu kommt eine Debatte mit deutschsprachigen KandidatInnen für den Provinzialrat (Provinz Lüttich). Die Aufnahmen wurden dem Archiv für Gesprochenes Deutsch im November 2016 von Prof. Dr. Kurt Feyaerts (KU Leuven) überlassen.

(4) Für das Korpus "Emigrantendeutsch in Israel: Wiener in Jerusalem ISW" wurden alle Transkripte mit den Tonaufnahmen aligniert und eine Lemmatisierung und ein POS-Tagging durchgeführt. Das Korpus ist nun auch über "Recherche > Tokens" recherchierbar.
Die Zahl der DGD-Registrierungen ist zwischenzeitlich auf 8100 angewachsen. Wir hoffen, dass die neuen Daten in Version 2.10 für Ihre Arbeit nützlich sind. Wie immer sind wir für Rückmeldungen an die Adresse dgd(at)ids-mannheim.de dankbar.