Redewiedergabe
Eine literatur- und sprachwissenschaftliche Korpusanalyse (2017-2020)
Projektseite: www.redewiedergabe.de
Seit April 2020 ist das Projekt offiziell abgeschlossen.
Das manuell annotierte Redewiedergabe-Korpus und die automatischen Tagger für Redewiedergabe-Formen stehen zur freien Nutzung zur Verfügung.
Wir sind aber nach wie vor sehr an dem Thema interessiert und freuen uns über Kommentare und Kooperationsideen. Kontakt: per Mail an die Projektleiterin Annelen Brunner oder über die Github-Seite.
In dem gemeinsam mit der Universität Würzburg (Prof. Fotis Jannidis) durchgeführten DFG-geförderten Projekt wird das Phänomen 'Redewiedergabe' (z.B. direkte Rede: Er sagte: „Ich bin hungrig“, indirekte Rede: Er sagte, er sei hungrig.) auf empirischer Basis untersucht. Schwerpunkte sind
- die manuelle Annotation eines Korpus von fiktionalen und nicht-fitkionalen Texten des 19. Jahrhunderts
- die Entwicklung eines automatischen Erkenners für Redewiedergabeformen. Dieser Erkenner wird dann zur Annotation von weiterem Textmaterial verwendet
Auf Basis der Ergebnisse werden narratologische und linguistische Analysen zur Entwicklung von Redewiedergabeformen und -konventionen durchgeführt.
Damit unterstützt das Projekt die Theoriebildung in der Narratologie, der Textsorten-/Gattungsforschung und der lexikologischen Argumentstrukturforschung sowie die Entwicklung von NLP-Werkzeugen für die automatisierte Verarbeitung von großen Textsammlungen.
Ergebnisse
- Das Redewiedergabe-Korpus (Finales Release des Kernkorpus seit 21.11.2019!)
- Beta-Release auch archiviert auf Zenodo unter doi.org/10.5281/zenodo.2635192
- Die aktuellen Annotationsrichtlinien; auch auf Zenodo unter doi.org/10.5281/zenodo.3759617
Im Fokus des Projekts steht das Phänomen 'Redewiedergabe' aus linguistischer sowie literaturwissenschaftlicher Perspektive. Unterschieden werden dabei die Formen direkte Wiedergabe (Er sagte: "Ich bin hungrig"), indirekte Wiedergabe (Er sagte, er sei hungrig.), erzählte Wiedergabe (Er sprach über das Mittagessen.) und freie indirekte Wiedergabe ('erlebte Rede') (Wo sollte er jetzt nur etwas zu essen her bekommen?).
Das Projekt stellt einen Anwendungsfall quantitativer Sprach- und Literaturwissenschaft dar. Die Entwicklung von Verfahren, die es erlauben, Redewiedergabe auf Grundlage von großen Datenmengen empirisch zu untersuchen, ist daher ein zentrales Forschungsziel. Schwerpunkte sind
1) die manuelle Annotation eines Korpus von Zeitungs- und Zeitschriftentexten sowie Erzähltexten mit einem zeitlichen Schwerpunkt auf den Jahren 1840-1920.
2) die Entwicklung eines automatischen Erkenners für Redewiedergabeformen unter Nutzung von Natural-Language-Processing-Technologien und maschinellen Lernverfahren. Dieser Erkenner wird dann zur Annotation von weiterem Textmaterial verwendet.
Die auf den empirischen Daten aufbauenden Forschungen nehmen verschiedene offene narratologische und linguistische Forschungsfragen zum Ausgangspunkt, z.B.:
-
Wie ist die quantitative Verteilung von unterschiedlichen Typen der Redewiedergabe?
-
Welche Entwicklungen in der Redewiedergabe nehmen ihren Ausgangspunkt in welchen Textsorten?
-
Welche Rolle spielen Unterscheidungen wie ‚populäre‘ versus ‚gehobene‘ Literatur bei der Entwicklung von Redewiedergabeformen?
-
Wie kommt die Dynamik im Bestand an Verben zustande, die als Redeeinleiter in bestimmten argumentstrukturellen Mustern auftreten?
Das Projekt greift auf folgende Vorarbeiten zurück:
Brunner, Annelen (2015): Automatische Erkennung von Redewiedergabe in literarischen Texten. Ein Beitrag zur quantitativen Narratologie - Berlin [u.a.]: de Gruyter.
Brunner, Annelen (2014): An XML Annotation Schema for speech, thought and writing representation, Digital Humanities In: Digital Humanities 2014. (online)
Brunner, Annelen (2013): Automatic recognition of speech, thought, and writing representation in German narrative texts In: Literary and Linguistic Computing 28/4. 2013. (online)
März 2020 | Veröffentlichung von automatischen Taggern für vier Typen von Redewiedergabe sowie selbst trainierten Sprachmodellen |
März 2020 | Veröffentlichung von vielfältigem Zusatzmaterial zum Redewiedergabe-Kernkorpus |
März 2020 | Vortrag und Publikation von A. Brunner, F. Jannidis, N.D.T. Tu und Lukas Weimer: Redewiedergabe in Heftromanen und Hochliteratur. DHd 2020, S. 190-194. |
März 2020 | Posterpräsentation und Publikation von L Weimer: Stilometrische Untersuchung von Figurenreden in realistischen Erzähltexten. DHd 2020, S. 365-367. |
Dez 2019 | Aufsatz zum Thema "Lexikalische Vielfalt von Redeeinleitern" von Tanja Tu, Stefan Engelberg und Lukas Weimer erscheint in den Linguistischen Berichten, Sonderheft 27, S. 13-53. |
Nov 2019 | Release des vollständigen Redewiedergabe-Kernkorpus auf Github |
Nov 2019 | Sechstes großes Projekttreffen (in Würzburg) |
Okt 2019 | Vortrag und Publikation von A. Brunner und T. Tu: Deep learning for Free Indirect Representation. 15th Conference on Natural Language Processing (KONVENS 2019) |
Okt 2019 | Posterpräsentation von T. Tu: From a thousand graphics to one conclusion. Visualisation of quotation expressions. eLex 2019: Smart Lexicography, Sintra. |
Sep 2019 | Posterpräsentaton von L. Weimer: Das Redewiedergabe-Korpus. Eine Ressource für empirisch-linguistische Fragestellungen. GAL-Sektionentagung. |
Juli 2019 | Posterpräsentation von T. Tu: How sentimental are quotation expressions? A sentiment analysis. Summer School of Computational Humanities „Mixed Methods in the Making“, Ruprecht-Karls-Universität Heidelberg. |
April 2019 | Fünftes großes Projekttreffen (in Mannheim) |
März 2019 | Das Beta-Release unseres Redewiedergabekorpus ist auf Github verfügbar: github.com/redewiedergabe/corpus |
März 2019 | Das Redewiedergabe-Projekt auf der Tagung DHd 2019 in Frankfurt/Mainz: |
März 2019 | Unsere Hilfskraft Anna Hartmann verlässt das Projekt. |
Jan 2019 | Vortrag von A. Brunner: Redewiedergabe annotieren – Ein Blick in die Werkstatt. Seminar Metasprache und Redewiedergabe, Technische Universität Dresden. |
Okt 2018 | Unsere Hilfskräfte Christoph Peterek und Laura Schäfer verlassen das Projekt. Wir begrüßen ihre Nachfolgerinnen Sarah Gorke und Janne Lorenzen. |
Okt 2018 | Viertes großes Projekttreffen (in Mannheim) |
Okt 2018 | Am 1./2. 10. findet Redewiedergabe-Workshop am Institut für Deutsche Sprache statt (Programm des öffentlichen Teils). |
Sep 2018 | Tanja Tu stellt das Projekt mit einem Poster auf der DARIAH Grand Tour 2018 vor. |
Sep 2018 | Vortrag von A. Brunner und L. Weimer: Annotieren, Rechnen, Analysieren – Redewiedergabe als Anwendungsfall der Digital Humanities, GAL-Kongress 2018, Essen. |
Juni 2018 | Unsere Hilfskraft Theresa Valta verlässt das Projekt. Wir begrüßen ihre Nachfolgerin Lisa Sergel. |
März 2018 | Das RW-Projekt auf der DGfS-Tagung 2018 (Arbeitsgruppe Rede- und Gedankenwiedergabe in narrativen Strukturen): Vortrag von A. Brunner und L. Weimer zum Projekt; Vortrag von S. Engelberg und T. Tu zu Redeeinleitern |
Feb 2018 | Das RW-Projekt auf der DHd 2018: Posterpräsentation des Projekts und Workshop zur Annotationsumgebung ATHEN und dem STWRView, der von Tanja Tu entwickelt wurde |
Feb 2018 | Drittes großes Projekttreffen (in Würzburg) |
Nov 2017 | Wir heißen zwei weitere Hilfskräfte, Anna Hartmann und Laura Schäfer, im Projekt willkommen. |
Okt 2017 | Zweites großes Projekttreffen (in Mannheim) |
Sep 2017 | Die Annotationsrichtlinien für das RW-Projekt sind fertig gestellt. Der Aufbau des RW-Korpus beginnt. |
Mai 2017 | Wir heißen unsere Hilfskräfte Christoph Peterek und Theresa Valta im Projekt willkommen. |
Feb 2017 | Erstes großes Projekttreffen (in Würzburg) |
Feb 2017 | Offizieller Projektstart! Wir heißen Ngoc Duyen Tanja Tu (Mannheim) und Lukas Weimer (Würzburg) im Projekt willkommen. |
Sep 2016 | Zwei Doktorandenstellen sind für das Projekt zu besetzen, in Mannheim und in Würzburg. Bewerbungsfrist ist der 31.10.2016. |
Jul 2016 | Die Deutsche Forschungsgemeinschaft genehmigt die Förderung für das Projekt |