Korpusgrammatik –

grammatische Variation im standardsprachlichen und standardnahen Deutsch


Projektbeschreibung, Projektziele

Aufgabe des Projekts sind systematische korpusorientierte Untersuchungen zu Variationsphänomenen in Morphologie und Syntax und die Dokumentation der Resultate in einer neuen, „variationssensitiven“ Grammatik des Standarddeutschen. Das Projekt befindet sich bereits in seiner Hauptphase, in der die eigentliche Grammatik erarbeitet wird. Zurzeit werden Kapitel verfasst, die sich der Wortbildung im Allgemeinen und der Syntax der Nominalphrase widmen. Daneben wird kontinuierlich an der Weiterentwicklung der korpuslinguistischen Methodik (vgl. Fuß/Konopka/Wöllstein (Hrsg.) 2019) und an der Erweiterung und optimalen Aufbereitung der Datenbasis gearbeitet (vgl. etwa Bildhauer/Schäfer 2017).

Einzelne Kapitel („Bausteine“) der Grammatik werden seit 2020 in der Online-Reihe Bausteine einer Korpusgrammatik des Deutschen veröffentlicht.

In der ersten, explorativen Phase des Projekts wurden die theoretischen und methodologischen Grundlagen erarbeitet und eine geeignete Korpusbasis geschaffen (vgl. Bubenhofer/Konopka/Schneider 2014). Danach wurden passende korpuslinguistisch-statistische Analyseroutinen und Werkzeuge entwickelt und in Pilotstudien erprobt. Die Arbeiten sollten folgende Zielsetzungen möglich machen:

  • Deskription: Präzise Beschreibung grammatischer Phänomene auf der Basis großer Korpora.

  • Exploration: Aufdeckung bislang unerkannter grammatischer Muster und Aufstellen neuer Generalisierungen.

  • Inferenz: Bereitstellung einer transparenten inferenzstatistischen Basis für die Validierung theoretischer Hypothesen.

In den Pilotstudien wurden Variationsphänomene verschiedener grammatischer Ebenen (Wortbildung, Morphologie, Syntax, Textgrammatik) untersucht. Alle relevanten Ergebnisse wurden umfassend in Printpublikationen aufbereitet. Die Pilotstudien behandelten:

Zu den evaluierten korpuslinguistischen Methoden gehören kanonische statistische Verfahren der Berechnung von Signifikanzen und Effektstärken, aber auch Techniken des maschinellen Lernens, wie sie sonst im Text- und Data-Mining zur Anwendung kommen. Grundlegende Verfahren, die sich standardisieren ließen, wurden im webbasierten Werkzeug KoGra-R (Hansen-Morath/Schmitz/Wolfer) bereitgestellt.

Ein Teil der bisherigen Projektergebnisse ist in der Komponente Korpusgestützte Grammatik von Grammis dokumentiert.

Adressatenkreis

Theorie und Methodik

Aktivitäten

Kooperationen

Publikationen

Projektteam

Projektleitung
MitarbeiterInnen
Studentische MitarbeiterInnen
  • René Boye
  • Dang Hoang Nguyen
  • Marcel Impertro

Computerlinguistische Unterstützung

Ehemalige MitarbeiterInnen
Doktorandin