Korpusgrammatik – grammatische Variation im standardsprachlichen und standardnahen Deutsch
Theoretischer Rahmen
Das Projekt schließt inhaltlich und theoretisch an die Tradition der deskriptiven Grammatik am IDS an. Dabei wird im Rahmen einer oberflächenorientierten Konstituentenstrukturgrammatik mit Berücksichtigung syntaktischer Funktionen (wie schon in Systematische Grammatik) ein Ausbau des empirischen Gehalts angestrebt.
Datengrundlage und Methodik
Die Untersuchungen stützen sich hauptsächlich auf das sogenannte Untersuchungskorpus (KoGraUK). Es ist hinsichtlich bestimmter Dokumentmetadaten (Land, Region, Register, Medium, Domäne, Jahrzehnt) vervollständigt und stratifiziert (Bubenhofer et al. 2014, Kap. 1).
- Dokumente: 23 Mio (23.057.608)
- Wörter: 5,8 Mrd. (5.815.846.039)
- Tokens: 7 Mrd (7.042.307.080)
Die Korpusanalysen schließen zum einen an die aktuelle grammatische Forschung an und nutzen zum anderen die Ergebnisse der IDS-Projekte wie der bereits abgeschlossenen Projekte GDS, Grammatik in Fragen und Antworten, HDK, VALBU, GDE-N oder des aktuell laufenden Projekts GDE-V. Dies bedeutet, dass die in der bisherigen Forschung vorgenommen Einschätzungen und Erklärungen zu Variationsphänomenen aufgegriffen und mithilfe moderner korpuslinguistischer Methoden überprüft, vertieft und ggf. modifiziert werden.
Zusammensetzung des Untersuchungskorpus