Korpusgrammatik – grammatische Variation im standardsprachlichen und standardnahen Deutsch

© Heidelberg University Publishing, CC BY-ND 4.0.

Projektbeschreibung, Projektziele

Aufgabe des Projekts sind systematische korpusorientierte Untersuchungen zu Variationsphänomenen in Morphologie und Syntax und die Dokumentation der Resultate in einer neuen, „variationssensitiven“ Grammatik des Standarddeutschen. Das Projekt befindet sich bereits in seiner Hauptphase, in der die eigentliche Grammatik erarbeitet wird. Zurzeit werden verschiedene Kapitel verfasst, die sich u. a. der Nominalflexion, der Verbalflexion und der Verbalsyntax widmen. Daneben wird kontinuierlich an der theoretischen Fundierung der Variationsforschung (vgl. Kopf/Weber 2023), der Weiterentwicklung der korpuslinguistischen Methodik (vgl. Hansen/Bildhauer/Konopka 2022, Wolfer/Hansen 2022, Fuß/Konopka/Wöllstein (Hrsg.) 2019) und an der Erweiterung und optimalen Aufbereitung der Datenbasis gearbeitet (vgl. etwa Bildhauer/Schäfer 2017).

Einzelne Kapitel („Bausteine“) der Grammatik werden seit 2020 in der Online-Reihe Bausteine einer Korpusgrammatik des Deutschen veröffentlicht.

In der ersten, explorativen Phase des Projekts wurden die theoretischen und methodologischen Grundlagen erarbeitet und eine geeignete Korpusbasis geschaffen (vgl. Bubenhofer/Konopka/Schneider 2014). Danach wurden passende korpuslinguistisch-statistische Analyseroutinen und Werkzeuge entwickelt und in Pilotstudien erprobt. Die Arbeiten sollten folgende Zielsetzungen möglich machen:

  • Deskription: Präzise Beschreibung grammatischer Phänomene auf der Basis großer Korpora.

  • Exploration: Aufdeckung bislang unerkannter grammatischer Muster und Aufstellen neuer Generalisierungen.

  • Inferenz: Bereitstellung einer transparenten inferenzstatistischen Basis für die Validierung theoretischer Hypothesen.

In den Pilotstudien wurden Variationsphänomene verschiedener grammatischer Ebenen (Wortbildung, Morphologie, Syntax, Textgrammatik) untersucht. Alle relevanten Ergebnisse wurden umfassend in Printpublikationen aufbereitet. Die Pilotstudien behandelten:

Zu den evaluierten korpuslinguistischen Methoden gehören kanonische statistische Verfahren der Berechnung von Signifikanzen und Effektstärken, aber auch Techniken des maschinellen Lernens, wie sie sonst im Text- und Data-Mining zur Anwendung kommen. Grundlegende Verfahren, die sich standardisieren ließen, wurden im webbasierten Werkzeug KoGra-R (Falke/Hansen-Morath /Wolfer) bereitgestellt.

Ein Teil der bisherigen Projektergebnisse ist in der Komponente Korpusgrammatik von Grammis dokumentiert.

Projektteam

Studentische MitarbeiterInnen
  • Sina Denzel
  • Dominique Kreße
  • Rilind Rafuni
Computerlinguistische Unterstützung
Doktorandin