Korpusgrammatik – grammatische Variation im standardsprachlichen und standardnahen Deutsch
Projektbeschreibung, Projektziele
Aufgabe des Projekts sind systematische korpusorientierte Untersuchungen zu Variationsphänomenen in Morphologie und Syntax und die Dokumentation der Resultate in einer neuen, „variationssensitiven“ Grammatik des Standarddeutschen. Das Projekt befindet sich bereits in seiner Hauptphase, in der die eigentliche Grammatik erarbeitet wird. Zurzeit werden verschiedene Kapitel verfasst, die sich u. a. der Nominalflexion, der Verbalflexion und der Verbalsyntax widmen. Daneben wird kontinuierlich an der theoretischen Fundierung der Variationsforschung (vgl. Kopf/Weber 2023), der Weiterentwicklung der korpuslinguistischen Methodik (vgl. Hansen/Bildhauer/Konopka 2022, Wolfer/Hansen 2022, Fuß/Konopka/Wöllstein (Hrsg.) 2019) und an der Erweiterung und optimalen Aufbereitung der Datenbasis gearbeitet (vgl. etwa Bildhauer/Schäfer 2017).
Einzelne Kapitel („Bausteine“) der Grammatik werden seit 2020 in der Online-Reihe Bausteine einer Korpusgrammatik des Deutschen veröffentlicht.
In der ersten, explorativen Phase des Projekts wurden die theoretischen und methodologischen Grundlagen erarbeitet und eine geeignete Korpusbasis geschaffen (vgl. Bubenhofer/Konopka/Schneider 2014). Danach wurden passende korpuslinguistisch-statistische Analyseroutinen und Werkzeuge entwickelt und in Pilotstudien erprobt. Die Arbeiten sollten folgende Zielsetzungen möglich machen:
-
Deskription: Präzise Beschreibung grammatischer Phänomene auf der Basis großer Korpora.
-
Exploration: Aufdeckung bislang unerkannter grammatischer Muster und Aufstellen neuer Generalisierungen.
-
Inferenz: Bereitstellung einer transparenten inferenzstatistischen Basis für die Validierung theoretischer Hypothesen.
In den Pilotstudien wurden Variationsphänomene verschiedener grammatischer Ebenen (Wortbildung, Morphologie, Syntax, Textgrammatik) untersucht. Alle relevanten Ergebnisse wurden umfassend in Printpublikationen aufbereitet. Die Pilotstudien behandelten:
-
variierende Wortformen und Fugenelemente (Donalies 2011, Bubenhofer/Hein/Brinckmann 2014)
-
Variation der starken Genitivmarkierung des Nomens (u. a. Bubenhofer/Konopka/Hansen-Morath 2014, Konopka/Fuß 2015, Bubenhofer/Hansen-Morath/Konopka/Schneider 2015)
-
Variation zwischen starker und schwacher Adjektivflexion (Bildhauer/Fuß/Hansen-Morath/Münzberg 2019)
-
Verb-Subjekt-Kongruenz bei koordinierten Subjekten (Münzberg/Hansen-Morath 2018)
-
Variation der Relativpronomina (u. a. Brandt/Fuß 2014, Brandt/Fuß 2018, Brandt/Fuß 2019)
-
V2- und dass-Sätze einbettende Partizipien angenommen und vorausgesetzt (Volodina 2019)
-
Variation der Subkategorisierung und Distribution von finiten vs. infiniten Komplementsätzen (u. a. Wöllstein 2015, Brandt 2019)
Zu den evaluierten korpuslinguistischen Methoden gehören kanonische statistische Verfahren der Berechnung von Signifikanzen und Effektstärken, aber auch Techniken des maschinellen Lernens, wie sie sonst im Text- und Data-Mining zur Anwendung kommen. Grundlegende Verfahren, die sich standardisieren ließen, wurden im webbasierten Werkzeug KoGra-R (Falke/Hansen-Morath /Wolfer) bereitgestellt.
Ein Teil der bisherigen Projektergebnisse ist in der Komponente Korpusgrammatik von Grammis dokumentiert.
Projektteam
Projektleitung
MitarbeiterInnen
Studentische MitarbeiterInnen
- Sina Denzel
- Dominique Kreße
- Rilind Rafuni
Computerlinguistische Unterstützung
- Noah Bubenhofer (2009-2012)
- Roman Schneider
Doktorandin
- Katrin Hein (01.11.2011-30.06.2013)
Ehemalige MitarbeiterInnen
- Caren Brinckmann
- Elke Donalies
- Reinhard Fiehler (Univerbierung)
- Eric Fuß
- Franziska Münzberg
- Hans-Christian Schmitz
- Bruno Strecker (Leitung bis 28.02.2011)
- Ulrich Hermann Waßner
- Constantin Weber (Univerbierung)
- Sascha Wolfer