Datengrundlage

Die Untersuchungen zum Forschungsgegenstand dieses Projektes, der gesprochenen Sprache des Deutschen, erfolgen ausgehend von den vorhandenen Möglichkeiten der am IDS verfügbaren Datenbank für Gesprochenes Deutsch (DGD2, Schmidt 2014b). Seit 2008 wird am IDS das "Forschungs- und Lehrkorpus gesprochenes Deutsch" (FOLK, knapp 229h/2,2 Mio. Tokens, 281 Sprechereignisse: vgl. z.B. Schmidt 2014a, Kupietz/Schmidt 2015; DGD 2.10) als erstes großes Gesprächskorpus des Deutschen aufgebaut. Parallel dazu wird die Datenbank gesprochenes Deutsch (DGD: vgl. Schmidt 2014b), über die FOLK recherchierbar ist, permanent weiterentwickelt und mit innovativen korpustechnologischen Funktionalitäten ausgestattet. Die DGD beinhaltet vielfältige Optionen der Erschließung mündlicher Daten nach linguistischen und interaktionalen Merkmalen, die mit keiner anderen Ressouce für das Deutsche möglich ist. Im Laufe des Projektes soll u.a. an folgenden Themenbereichen weitergearbeitet werden:
  • lexikgeleitete Recherchemöglichkeiten in und Methoden zum Erstellen von Wortprofilen aus mündlichen Korpora
  • Methoden zu Frequenzvergleichen und kontrastiven Analysen zwischen mündlichen und schriftsprachlichen Korpora
Seit September 2018 erlaubt die Nutzung des Tools "Lexical Explorer", einer im LeGeDe-Projekt entwickelten Anwendung, weitere Zugriffe auf FOLK sowie auf das GeWiss-Korpus. Mit dem Lexical Explorer können quantitative Korpusdaten zum gesprochenen Deutsch mit Hilfe von Häufigkeitstabellen bezüglich der Verteilung über Wortformen, Kookkurrenzen und Metadaten erforscht werden.                                           Reference: Lexical Explorer. Institut für Deutsche Sprache, Mannheim 2018. URL: http://www.owid.de/lexex/.