Neue Version der DGD

Datenbank für Gesprochenes Deutsch 2.9
Seit dem 27.11.2017 steht die neue Version 2.9 der DGD unter https://dgd.ids-mannheim.de zur Verfügung. Wichtigste Neuerungen sind:
  • Die Integration des deutschsprachigen Teils des Korpus "Gesprochene Wissenschaftssprache kontrastiv" (GeWiss, Universität Leipzig), das wissenschaftliche Vorträge, studentische Referate und Prüfungsgespräche aus der Germanistik enthält und knapp 92 Stunden Audio-Aufnahmen und knapp 800.000 transkribierte Tokens umfasst.
  • Die Ergänzung des Korpus "Deutsche Mundarten" (ZW - Zwirner-Korpus) um 100 Transkripte. Das Korpus umfasst damit nun über 4 Millionen Tokens.

  • Die manuelle Korrektur der orthographischen Normalisierung des Korpus "Mehrsprachige Kinder im Vorschulalter". Das Korpus wurde auf dieser Grundlage neu lemmatisiert und POS-getagged.

  • Weitere Änderungen und Verbesserungen der Funktionalität und Hilfestellungen der DGD-Plattform, darunter u.a. die Möglichkeit, virtuelle Korpora und gespeicherte Suchergebnisse mit anderen Nutzern zu teilen.
Zu den einzelnen Neuerungen im Detail: (1) Das Korpus "Gesprochene Wissenschaftssprache Kontrastiv" (GeWiss) wurde (als GWSS) in die DGD integriert. GeWiss erfasst zentrale Genres der gesprochenen Wissenschaftssprache: wissenschaftliche Vorträge, studentische Referate (jeweils einschließlich Diskussion) und Prüfungsgespräche aus der Germanistik. Über die DGD zugänglich sind nun die deutschsprachigen Teile des Korpus, die von den Projektpartnern an den Universitäten Leipzig, Birmingham (Aston), Wroclaw und Sofia erhoben wurden. Mit knapp 92 Stunden Audio-Aufnahmen und knapp 800.000 transkribierten Tokens steht mit GeWiss jetzt ein weiteres großes und aktuelles Gesprächskorpus in der DGD zur Verfügung. Das GeWiss-Portal an der Universität Leipzig (https://gewiss.uni-leipzig.de/) bleibt bis auf weiteres aktiv. Dort sind die gleichen Daten (teilweise mit zusätzlichen Annotationen) und die nicht-deutschsprachigen Bestandtteile des Korpus abrufbar.  (2) Das Korpus "Deutsche Mundarten" (ZW - Zwirner-Korpus) wurde um 100 Transkripte ergänzt. Diese stammen zum größeren Teil aus einer Nachdigitalisierung von Papier-Transkripten im AGD-Bestand, zum kleineren Teil aus einer Kooperation mit der Universität Augsburg (Dank an Stefan Kleiner!), wo Studierende in einem Seminar ausgewählte Aufnahmen transkribiert haben. Mit 4.060.188 Tokens hat das Zwirner-Korpus damit nun die 4-Millionen-Marke überschritten. (3) Die orthographische Normalisierung des Korpus "Mehrsprachige Kinder im Vorschulalter" wurde manuell korrigiert. Auf der Grundlage der Korrektur wurden das Korpus neu lemmatisiert und POS-getagged. An der DGD-Plattform haben wir folgende Änderungen und Erweiterungen angebracht: (4) Die Website wird jetzt über das sichere HTTPS-Protokoll ausgeliefert. Damit entfallen entsprechende Warnmeldungen in manchen Browsern. (5) Die Hilfe-Seiten wurden neu strukturiert und teilweise überarbeitet. Die Hilfe-Seiten sind jetzt auch ohne Login abrufbar. (6) Wenn Sie ein vergessenens Passwort anfordern oder Ihre DGD-Registrierung löschen möchten, können Sie dies künftig direkt von der Startseite der DGD aus tun. (7) Über eine neue Funktion können jetzt Kollektionen, virtuelle Korpora und gespeicherte Suchergebnisse mit anderen registrierten Benutzern geteilt werden. Beispielsweise kann über folgenden Link auf ein gespeichertes Suchergebnis zu den Verben "teilen" und "herrschen" zugegriffen werden: https://dgd.ids-mannheim.de/DGD2Web/ExternalAccessServlet?command=displaySharedObject&shareID=VfFSjw&objectType=kwic_1 Eine detaillierte Dokumentation dieser Funktionalität findet sich unter http://agd.ids-mannheim.de/download/Doku_ShareID.pdf. Die Zahl der Registrierungen ist zwischenzeitlich auf 7500 angewachsen. Wir hoffen, dass die neuen Daten und Funktionen in Version 2.9 für Ihre Arbeit nützlich sind. Wie immer sind wir für Rückmeldungen an die Adresse dgd(at)ids-mannheim.de dankbar. Mit freundlichen Grüßen Ihr DGD-Team