Redewiedergabe

Startseite

Organisation

Lexik

Abgeschlossene Projekte

Redewiedergabe

Eine literatur- und sprachwissenschaftliche Korpusanalyse (2017-2020)

Seit April 2020 ist das Projekt offiziell abgeschlossen.

Das manuell annotierte Redewiedergabe-Korpus und die automatischen Tagger für Redewiedergabe-Formen stehen zur freien Nutzung zur Verfügung.

Wir sind aber nach wie vor sehr an dem Thema interessiert und freuen uns über Kommentare und Kooperationsideen. Kontakt: per Mail an die Projektleiterin Annelen Brunner oder über die Github-Seite.

In dem gemeinsam mit der Universität Würzburg (Prof. Fotis Jannidis) durchgeführten DFG-geförderten Projekt wird das Phänomen 'Redewiedergabe' (z.B. direkte Rede: Er sagte: „Ich bin hungrig“, indirekte Rede: Er sagte, er sei hungrig.) auf empirischer Basis untersucht. Schwerpunkte sind

die manuelle Annotation eines Korpus von fiktionalen und nicht-fitkionalen Texten des 19. Jahrhunderts
die Entwicklung eines automatischen Erkenners für Redewiedergabeformen. Dieser Erkenner wird dann zur Annotation von weiterem Textmaterial verwendet

Auf Basis der Ergebnisse werden narratologische und linguistische Analysen zur Entwicklung von Redewiedergabeformen und -konventionen durchgeführt.

Damit unterstützt das Projekt die Theoriebildung in der Narratologie, der Textsorten-/Gattungsforschung und der lexikologischen Argumentstrukturforschung sowie die Entwicklung von NLP-Werkzeugen für die automatisierte Verarbeitung von großen Textsammlungen.

Ergebnisse

Das Redewiedergabe-Korpus (Finales Release des Kernkorpus seit 21.11.2019!)
- Beta-Release auch archiviert auf Zenodo unter doi.org/10.5281/zenodo.2635192
Die aktuellen Annotationsrichtlinien; auch auf Zenodo unter doi.org/10.5281/zenodo.3759617

Im Fokus des Projekts steht das Phänomen 'Redewiedergabe' aus linguistischer sowie literaturwissenschaftlicher Perspektive. Unterschieden werden dabei die Formen direkte Wiedergabe (Er sagte: "Ich bin hungrig"), indirekte Wiedergabe (Er sagte, er sei hungrig.), erzählte Wiedergabe (Er sprach über das Mittagessen.) und freie indirekte Wiedergabe ('erlebte Rede') (Wo sollte er jetzt nur etwas zu essen her bekommen?).

Das Projekt stellt einen Anwendungsfall quantitativer Sprach- und Literaturwissenschaft dar. Die Entwicklung von Verfahren, die es erlauben, Redewiedergabe auf Grundlage von großen Datenmengen empirisch zu untersuchen, ist daher ein zentrales Forschungsziel. Schwerpunkte sind

1) die manuelle Annotation eines Korpus von Zeitungs- und Zeitschriftentexten sowie Erzähltexten mit einem zeitlichen Schwerpunkt auf den Jahren 1840-1920.

2) die Entwicklung eines automatischen Erkenners für Redewiedergabeformen unter Nutzung von Natural-Language-Processing-Technologien und maschinellen Lernverfahren. Dieser Erkenner wird dann zur Annotation von weiterem Textmaterial verwendet.

Die auf den empirischen Daten aufbauenden Forschungen nehmen verschiedene offene narratologische und linguistische Forschungsfragen zum Ausgangspunkt, z.B.:

Wie ist die quantitative Verteilung von unterschiedlichen Typen der Redewiedergabe?
Welche Entwicklungen in der Redewiedergabe nehmen ihren Ausgangspunkt in welchen Textsorten?
Welche Rolle spielen Unterscheidungen wie ‚populäre‘ versus ‚gehobene‘ Literatur bei der Entwicklung von Redewiedergabeformen?
Wie kommt die Dynamik im Bestand an Verben zustande, die als Redeeinleiter in bestimmten argumentstrukturellen Mustern auftreten?

Das Projekt greift auf folgende Vorarbeiten zurück:

Brunner, Annelen (2015): Automatische Erkennung von Redewiedergabe in literarischen Texten. Ein Beitrag zur quantitativen Narratologie - Berlin [u.a.]: de Gruyter.

Brunner, Annelen (2014): An XML Annotation Schema for speech, thought and writing representation, Digital Humanities In: Digital Humanities 2014. (online)

Brunner, Annelen (2013): Automatic recognition of speech, thought, and writing representation in German narrative texts In: Literary and Linguistic Computing 28/4. 2013. (online)

März 2020	Veröffentlichung von automatischen Taggern für vier Typen von Redewiedergabe sowie selbst trainierten Sprachmodellen
März 2020	Veröffentlichung von vielfältigem Zusatzmaterial zum Redewiedergabe-Kernkorpus
März 2020	Vortrag und Publikation von A. Brunner, F. Jannidis, N.D.T. Tu und Lukas Weimer: Redewiedergabe in Heftromanen und Hochliteratur. DHd 2020, S. 190-194.
März 2020	Posterpräsentation und Publikation von L Weimer: Stilometrische Untersuchung von Figurenreden in realistischen Erzähltexten. DHd 2020, S. 365-367.
Dez 2019	Aufsatz zum Thema "Lexikalische Vielfalt von Redeeinleitern" von Tanja Tu, Stefan Engelberg und Lukas Weimer erscheint in den Linguistischen Berichten, Sonderheft 27, S. 13-53.
Nov 2019	Release des vollständigen Redewiedergabe-Kernkorpus auf Github
Nov 2019	Sechstes großes Projekttreffen (in Würzburg)
Okt 2019	Vortrag und Publikation von A. Brunner und T. Tu: Deep learning for Free Indirect Representation. 15th Conference on Natural Language Processing (KONVENS 2019) 11.10.2019, Friedrich-Alexander-Universität Erlangen-Nürnberg
Okt 2019	Posterpräsentation von T. Tu: From a thousand graphics to one conclusion. Visualisation of quotation expressions. eLex 2019: Smart Lexicography, Sintra.
Sep 2019	Posterpräsentaton von L. Weimer: Das Redewiedergabe-Korpus. Eine Ressource für empirisch-linguistische Fragestellungen. GAL-Sektionentagung.
Juli 2019	Posterpräsentation von T. Tu: How sentimental are quotation expressions? A sentiment analysis. Summer School of Computational Humanities „Mixed Methods in the Making“, Ruprecht-Karls-Universität Heidelberg.
April 2019	Fünftes großes Projekttreffen (in Mannheim)
März 2019	Das Beta-Release unseres Redewiedergabekorpus ist auf Github verfügbar: github.com/redewiedergabe/corpus Außerdem sind jetzt sowohl das Korpus als auch die aktuellen Annotationsrichtlinien des Projekts auf Zenodo archiviert.
März 2019	Das Redewiedergabe-Projekt auf der Tagung DHd 2019 in Frankfurt/Mainz: Vortrag von A. Brunner: Das Redewiedergabe-Korpus Vortrag von T. Tu: Automatic recognition of direct speech without quotation marks (gemeinsam mit Markus Krug)
März 2019	Unsere Hilfskraft Anna Hartmann verlässt das Projekt.
Jan 2019	Vortrag von A. Brunner: Redewiedergabe annotieren – Ein Blick in die Werkstatt. Seminar Metasprache und Redewiedergabe, Technische Universität Dresden.
Okt 2018	Unsere Hilfskräfte Christoph Peterek und Laura Schäfer verlassen das Projekt. Wir begrüßen ihre Nachfolgerinnen Sarah Gorke und Janne Lorenzen.
Okt 2018	Viertes großes Projekttreffen (in Mannheim)
Okt 2018	Am 1./2. 10. findet Redewiedergabe-Workshop am Institut für Deutsche Sprache statt (Programm des öffentlichen Teils).
Sep 2018	Tanja Tu stellt das Projekt mit einem Poster auf der DARIAH Grand Tour 2018 vor.
Sep 2018	Vortrag von A. Brunner und L. Weimer: Annotieren, Rechnen, Analysieren – Redewiedergabe als Anwendungsfall der Digital Humanities, GAL-Kongress 2018, Essen.
Juni 2018	Unsere Hilfskraft Theresa Valta verlässt das Projekt. Wir begrüßen ihre Nachfolgerin Lisa Sergel.
März 2018	Das RW-Projekt auf der DGfS-Tagung 2018 (Arbeitsgruppe Rede- und Gedankenwiedergabe in narrativen Strukturen): Vortrag von A. Brunner und L. Weimer zum Projekt; Vortrag von S. Engelberg und T. Tu zu Redeeinleitern
Feb 2018	Das RW-Projekt auf der DHd 2018: Posterpräsentation des Projekts und Workshop zur Annotationsumgebung ATHEN und dem STWRView, der von Tanja Tu entwickelt wurde
Feb 2018	Drittes großes Projekttreffen (in Würzburg)
Nov 2017	Wir heißen zwei weitere Hilfskräfte, Anna Hartmann und Laura Schäfer, im Projekt willkommen.
Okt 2017	Zweites großes Projekttreffen (in Mannheim)
Sep 2017	Die Annotationsrichtlinien für das RW-Projekt sind fertig gestellt. Der Aufbau des RW-Korpus beginnt.
Mai 2017	Wir heißen unsere Hilfskräfte Christoph Peterek und Theresa Valta im Projekt willkommen.
Feb 2017	Erstes großes Projekttreffen (in Würzburg)
Feb 2017	Offizieller Projektstart! Wir heißen Ngoc Duyen Tanja Tu (Mannheim) und Lukas Weimer (Würzburg) im Projekt willkommen.
Sep 2016	Zwei Doktorandenstellen sind für das Projekt zu besetzen, in Mannheim und in Würzburg. Bewerbungsfrist ist der 31.10.2016.
Jul 2016	Die Deutsche Forschungsgemeinschaft genehmigt die Förderung für das Projekt

Projektteam

Projektleitung

Dr. Annelen Brunner

wiss. Mitarbeit (Universität Würzburg)

Prof. Dr. Fotis Jannidis

wiss. Mitarbeit

Prof. Dr. Stefan Engelberg

wiss. Mitarbeit (Universität Würzburg)

Lukas Weimer

wiss. Mitarbeit

Redewiedergabe

Eine literatur- und sprachwissenschaftliche Korpusanalyse (2017-2020)

Projektteam

Dr. Annelen Brunner

Prof. Dr. Fotis Jannidis

Prof. Dr. Stefan Engelberg

Lukas Weimer

Ngoc Duyen Tanja Tu

Organisationsstruktur

Informationen

Schnelleinstieg

Kontakt

Social Media