Redewiedergabe

Eine literatur- und sprachwissenschaftliche Korpusanalyse

Projektseite: www.redewiedergabe.de

Seit April 2020 ist das Projekt offiziell abgeschlossen.

Das manuell annotierte Redewiedergabe-Korpus und die automatischen Tagger für Redewiedergabe-Formen stehen zur freien Nutzung zur Verfügung.

Wir sind aber nach wie vor sehr an dem Thema interessiert und freuen uns über Kommentare und Kooperationsideen. Kontakt: per Mail an die Projektleiterin Annelen Brunner oder über die Github-Seite.

In dem gemeinsam mit der Universität Würzburg (Prof. Fotis Jannidis) durchgeführten DFG-geförderten Projekt wird das Phänomen 'Redewiedergabe'  (z.B. direkte Rede: Er sagte: „Ich bin hungrig“, indirekte Rede: Er sagte, er sei hungrig.) auf empirischer Basis untersucht. Schwerpunkte sind

  1. die manuelle Annotation eines Korpus von fiktionalen und nicht-fitkionalen Texten des 19. Jahrhunderts
  2. die Entwicklung eines automatischen Erkenners für Redewiedergabeformen. Dieser Erkenner wird dann zur Annotation von weiterem Textmaterial verwendet

Auf Basis der Ergebnisse werden narratologische und linguistische Analysen zur Entwicklung von Redewiedergabeformen und -konventionen durchgeführt.

Damit unterstützt das Projekt die Theoriebildung in der Narratologie, der Textsorten-/Gattungsforschung und der lexikologischen Argumentstrukturforschung sowie die Entwicklung von NLP-Werkzeugen für die automatisierte Verarbeitung von großen Textsammlungen.

Ergebnisse

Im Fokus des Projekts steht das Phänomen 'Redewiedergabe' aus linguistischer sowie literaturwissenschaftlicher Perspektive. Unterschieden werden dabei die Formen direkte Wiedergabe (Er sagte: "Ich bin hungrig"), indirekte Wiedergabe (Er sagte, er sei hungrig.), erzählte Wiedergabe (Er sprach über das Mittagessen.) und freie indirekte Wiedergabe ('erlebte Rede') (Wo sollte er jetzt nur etwas zu essen her bekommen?).

Das Projekt stellt einen Anwendungsfall quantitativer Sprach- und Literaturwissenschaft dar. Die Entwicklung von Verfahren, die es erlauben, Redewiedergabe auf Grundlage von großen Datenmengen empirisch zu untersuchen, ist daher ein zentrales Forschungsziel. Schwerpunkte sind

1) die manuelle Annotation eines Korpus von Zeitungs- und Zeitschriftentexten sowie Erzähltexten mit einem zeitlichen Schwerpunkt auf den Jahren 1840-1920.

2) die Entwicklung eines automatischen Erkenners für Redewiedergabeformen unter Nutzung von Natural-Language-Processing-Technologien und maschinellen Lernverfahren. Dieser Erkenner wird dann zur Annotation von weiterem Textmaterial verwendet.

Die auf den empirischen Daten aufbauenden Forschungen nehmen verschiedene offene narratologische und linguistische Forschungsfragen zum Ausgangspunkt, z.B.:

  • Wie ist die quantitative Verteilung von unterschiedlichen Typen der Redewiedergabe?

  • Welche Entwicklungen in der Redewiedergabe nehmen ihren Ausgangspunkt in welchen Textsorten?

  • Welche Rolle spielen Unterscheidungen wie ‚populäre‘ versus ‚gehobene‘ Literatur bei der Entwicklung von Redewiedergabeformen?

  • Wie kommt die Dynamik im Bestand an Verben zustande, die als Redeeinleiter in bestimmten argumentstrukturellen Mustern auftreten?

Das Projekt greift auf folgende Vorarbeiten zurück:

Brunner, Annelen (2015): Automatische Erkennung von Redewiedergabe in literarischen Texten. Ein Beitrag zur quantitativen Narratologie - Berlin [u.a.]: de Gruyter.

Brunner, Annelen (2014): An XML Annotation Schema for speech, thought and writing representation, Digital Humanities In: Digital Humanities 2014. (online)

Brunner, Annelen (2013): Automatic recognition of speech, thought, and writing representation in German narrative texts In: Literary and Linguistic Computing 28/4. 2013. (online)

März 2020

Veröffentlichung von automatischen Taggern für vier Typen von Redewiedergabe sowie selbst trainierten Sprachmodellen

März 2020

Veröffentlichung von vielfältigem Zusatzmaterial zum Redewiedergabe-Kernkorpus

März 2020

Vortrag und Publikation von A. Brunner, F. Jannidis, N.D.T. Tu und Lukas Weimer: Redewiedergabe in Heftromanen und Hochliteratur. DHd 2020, S. 190-194.

März 2020

Posterpräsentation und Publikation von L Weimer: Stilometrische Untersuchung von Figurenreden in realistischen Erzähltexten. DHd 2020, S. 365-367.

Dez 2019

Aufsatz zum Thema "Lexikalische Vielfalt von Redeeinleitern" von Tanja Tu, Stefan Engelberg und Lukas Weimer erscheint in den Linguistischen Berichten, Sonderheft 27, S. 13-53.

Nov 2019

Release des vollständigen Redewiedergabe-Kernkorpus auf Github

Nov 2019

Sechstes großes Projekttreffen (in Würzburg)

Okt 2019

Vortrag und Publikation von A. Brunner und T. Tu: Deep learning for Free Indirect Representation. 15th Conference on Natural Language Processing (KONVENS 2019)
11.10.2019, Friedrich-Alexander-Universität Erlangen-Nürnberg

Okt 2019

Posterpräsentation von T. Tu: From a thousand graphics to one conclusion. Visualisation of quotation expressions. eLex 2019: Smart Lexicography, Sintra.

Sep 2019

Posterpräsentaton von L. Weimer: Das Redewiedergabe-Korpus. Eine Ressource für empirisch-linguistische Fragestellungen. GAL-Sektionentagung.

Juli 2019

Posterpräsentation von T. Tu: How sentimental are quotation expressions? A sentiment analysis. Summer School of Computational Humanities „Mixed Methods in the Making“, Ruprecht-Karls-Universität Heidelberg.

April 2019

Fünftes großes Projekttreffen (in Mannheim)

März 2019

Das Beta-Release unseres Redewiedergabekorpus ist auf Github verfügbar: github.com/redewiedergabe/corpus
Außerdem sind jetzt sowohl das Korpus als auch die aktuellen Annotationsrichtlinien des Projekts auf Zenodo archiviert.

März 2019

Das Redewiedergabe-Projekt auf der Tagung DHd 2019 in Frankfurt/Mainz:
Vortrag von A. Brunner: Das Redewiedergabe-Korpus
Vortrag von T. Tu: Automatic recognition of direct speech without quotation marks (gemeinsam mit Markus Krug)

März 2019

Unsere Hilfskraft Anna Hartmann verlässt das Projekt.

Jan 2019

Vortrag von A. Brunner: Redewiedergabe annotieren – Ein Blick in die Werkstatt. Seminar Metasprache und Redewiedergabe, Technische Universität Dresden.

Okt 2018

Unsere Hilfskräfte Christoph Peterek und Laura Schäfer verlassen das Projekt. Wir begrüßen ihre Nachfolgerinnen Sarah Gorke und Janne Lorenzen.

Okt 2018

Viertes großes Projekttreffen (in Mannheim)

Okt 2018

Am 1./2. 10. findet Redewiedergabe-Workshop am Institut für Deutsche Sprache statt (Programm des öffentlichen Teils).

Sep 2018

Tanja Tu stellt das Projekt mit einem Poster auf der DARIAH Grand Tour 2018 vor.

Sep 2018

Vortrag von A. Brunner und L. Weimer: Annotieren, Rechnen, Analysieren – Redewiedergabe als Anwendungsfall der Digital Humanities, GAL-Kongress 2018, Essen.

Juni 2018

Unsere Hilfskraft Theresa Valta verlässt das Projekt. Wir begrüßen ihre Nachfolgerin Lisa Sergel.

März 2018

Das RW-Projekt auf der DGfS-Tagung 2018 (Arbeitsgruppe Rede- und Gedankenwiedergabe in narrativen Strukturen): Vortrag von A. Brunner und L. Weimer zum Projekt; Vortrag von S. Engelberg und T. Tu zu Redeeinleitern

Feb 2018

Das RW-Projekt auf der DHd 2018: Posterpräsentation des Projekts und Workshop zur Annotationsumgebung ATHEN und dem STWRView, der von Tanja Tu entwickelt wurde

Feb 2018

Drittes großes Projekttreffen (in Würzburg)

Nov 2017

Wir heißen zwei weitere Hilfskräfte, Anna Hartmann und Laura Schäfer, im Projekt willkommen.

Okt 2017

Zweites großes Projekttreffen (in Mannheim)

Sep 2017

Die Annotationsrichtlinien für das RW-Projekt sind fertig gestellt. Der Aufbau des RW-Korpus beginnt.

Mai 2017

Wir heißen unsere Hilfskräfte Christoph Peterek und Theresa Valta im Projekt willkommen.

Feb 2017

Erstes großes Projekttreffen (in Würzburg)

Feb 2017

Offizieller Projektstart! Wir heißen Ngoc Duyen Tanja Tu (Mannheim) und Lukas Weimer (Würzburg) im Projekt willkommen.

Sep 2016

Zwei Doktorandenstellen sind für das Projekt zu besetzen, in Mannheim und in Würzburg. Bewerbungsfrist ist der 31.10.2016.

Jul 2016

Die Deutsche Forschungsgemeinschaft genehmigt die Förderung für das Projekt

Projektteam

Projektleitung
Dr. Annelen Brunner
wiss. Mitarbeit (Universität Würzburg)
Prof. Dr. Fotis Jannidis
wiss. Mitarbeit
Prof. Dr. Stefan Engelberg
wiss. Mitarbeit (Universität Würzburg)
Lukas Weimer
wiss. Mitarbeit
Ngoc Duyen Tanja Tu