Programmbereich Sprachinformationssysteme
Leitung: PD Dr. habil. Roman Schneider
Der Programmbereich beschäftigt sich mit Forschungs- und Wissenstransfer innerhalb der linguistischen Forschungsgemeinschaft sowie in die sprachinteressierte Öffentlichkeit. Dazu bündelt er linguistische, empirische und informatische Kompetenzen und betreibt das Online-Informationssystem grammis. Durch reflektierte Anwendung korpuslinguistischer und experimenteller Methoden erschließt er Sprache in ihren verschiedenen Erscheinungsformen für die deskriptive Grammatik- und Orthografieforschung.
Grammatische Ressourcen
Leitung: PD Dr. habil. Roman Schneider
Das Projekt erarbeitet digitale Forschungsressourcen, die grammatisch motivierte Sprachdaten systematisieren, aufbereiten und Forschungsergebnisse unter Einsatz innovativer Analyse- und Visualisierungsansätze in grammis präsentieren.
Methoden der Grammatikforschung
Leitung: Dr. Sandra Hansen
Das Projekt sichert linguistische Hypothesen vermittels konvergierender Evidenz ab und betreibt hierfür multimethodische empirische Forschung und Methodenevaluierung zu morphologisch-syntaktischen Variationsphänomenen.
(Semi-)Automatisierte thematische Textklassifikation für die Grammatik
Leitung: PD Dr. habil. Roman Schneider
Das DFG-Drittmittelprojekt beschäftigt sich mit der thematischen Fachtexterschließung und erforscht Klassifikationsverfahrens des maschinellen Lernens auf hochdetaillierten Systematiken.
Sprachanfragen
Leitung: Dr. Christian Lang
Das Projekt erstellt ein nachhaltig nutzbares Sprachanfragenkorpus, in dem Zweifelsfälle systematisch kuratiert, theoriegestützt strukturiert, computerlinguistisch aufbereitet und zur wissenschaftlichen Analyse zugänglich gemacht werden.
Orthografieforschung und empirische Schreibbeobachtung
Leitung: Prof. Dr. Angelika Wöllstein
Das Projekt erforscht grundlegende Aspekte von Orthografieentwicklung, Normreflexion und -vermittlung anhand stratifizierter digitaler Textkorpora für den gesamten deutschsprachigen Raum.
LernGrammis
Leitung: PD Dr. habil. Roman Schneider
Im Rahmen des BMBF-Drittmittelprojekts Lernzentrum Sprache - Grammatik interaktiv und systematisch wird ein thematisch und medial vielfältiges Lernangebot für den bundesweit vernetzten Digitalen Bildungsraum implementiert.
Aktuelles (Auswahl)
- Oktober 2024: Gesprächsangebote zum Thema "Aktuelle KI-Sprachtechnologie für die Beantwortung von Fragen zur deutschen Rechtschreibung und Grammatik" im Rahmen der Aktion Book a Scientist sowie im Posterformat für das 3. Text+ Plenary.
- Oktober 2024: Organisation eines Bedarfsanalyse-Workshops zur automatisierten thematischen Textklassifikation sowie der IDS-Teilnahme an der Aktion Türen auf mit der Maus.
- September 2024: Vorstellung einer Langzeiterhebung zum grammatischen Wandel als Vortrag auf der Tagung Stabilität und Dynamik in der regionalsprachlichen (Morpho-)Syntax des Deutschen in Düsseldorf.
- September 2024: Online-Bereitstellung des neu erarbeiteten Amtlichen Regelwerks der deutschen Rechtschreibung (Regeln und Wörterverzeichnis).
- August 2024: Kodierung idiomatischer Verwendungen in den Verb-Lesarten des grammis-Valenzlexikons E-VALBU.
- August 2024: Vorstellung experimenteller Forschung zum Finetuning eines Open-Source-Sprachmodells (Llama 3-8B) für Ternary Sentiment Classification im Rahmen einer IDS-Gesprächsrunde.
- Juli 2024: Präsentation auf der 12th International Conference on Language Variation in Europe (ICLaVE) in Wien: Tracking grammatical change: a long-term survey of German.
- Juli 2024: Eingeladener Vortrag an der TH Köln: Retrieval Augmented Generation – Wie können terminologische Systeme für generative LLM eingesetzt werden?
- Juni 2024: Co-Organisation des Workshops Sprachwandel im Deutsch der Gegenwart.
- Juni 2024: Präsentation auf der SwissText 2024 in Chur zu Deep Active Learning für die automatische Identifizierung von Zweifelsfällen in Sprachanfragen sowie Vortrag auf der NLDB 2024 in Turin: Automatic Question Answering for the Linguistic Domain – An Evaluation of LLM Knowledge Base Extension with RAG.
- Mai 2024: Präsentation aktueller sprachtechnologischer Forschung am BMBF-Messestand auf der re:publica Berlin 2024: Sprache digital und systematisch – das Online-Portal grammis für Mensch und KI sowie als Webinar der DHd-AG Angewandte Generative KI in den Digitalen Geisteswissenschaften: Externe Wissensbasen für Large Language Models am Beispiel deutscher Grammatik.
- Mai 2024: Vortrag und Diskussion an der Jagiellonen-Universität Krakau: Das grammatische Informationssystem des IDS - Angebote und Desiderata für die internationale Germanistik.
- April 2024: Vortrag und Workshops zu grammis in Chirchiq, Taschkent und Samarkand im Rahmen der Kooperation des IDS mit den Germanistiken der Universitäten Usbekistans.
- April 2024: Mitarbeit in der Preisjury für das DataFest Germany 2024.
- März 2024: Co-Ausrichtung des Blockseminars "Modeling and Representing Data in Digital Lexicography" im European Master in Lexicography (EMLex) an der Universität Hildesheim.
- März 2024: Posterbeitrag auf der 60. IDS-Jahrestagung zur kontextabhängigen Detektion von Modalpartikeln mit selbstlernenden Algorithmen.
- Februar 2024: Veröffentlichung der Promotionsschrift von Ngoc Duyen Tanja Tu als Open Access: Eine korpuslinguistische Untersuchung zur lexikalischen Vielfalt von direkten und indirekten Redeeinleitern.
- Februar 2024: Zwei neue regelmäßig aktualisierte Rubriken für den Forschungs- und Wissenstransfer im grammatischen Informationssystem grammis: Frage der Woche und Torte der Woche.
- Januar 2024: Roman Schneider wird in den wissenschaftlichen Beirat der Gesellschaft für Sprachtechnologie und Computerlinguistik (GSCL) wiedergewählt.
- Januar 2024: Wissenschaftsöffentliche Bereitstellung eines umfassend annotierten Datensatzes schwache Maskulina zur Erforschung von Schwankungen zwischen schwacher und starker Substantivflexion.
Früher (Auswahl)
- Dezember 2023: Eingeladener Vortrag an der Berlin-Brandenburgischen Akademie der Wissenschaften (BBAW) im virtuellen DH-Kolloquium "Ausweitung der Korpuszone: Neue Daten für die empirische Lexikographie".
- Dezember 2023: Einführungsveranstaltung zur DeReKo-Recherche mit dem RKorAP-Client
- November 2023: Die Masterarbeit "Orthografie als Reflexion gesellschaftlichen Wandels. Die orthografische Integration englischer Komposita unter dem Aspekt soziokultureller Faktoren ins Deutsche" unserer studentischen Hilfskraft Ann-Sophie Bodien wurde mit der Note 1,0 bewertet. Wir gratulieren!
- November 2023: Präsentation des Sprachanfrageprojekts zum Sprachmodell-Finetuning und zur Anreicherung von LLMs um grammatisches Spezialwissen als Coffee Lecture "33 Minuten für… Künstliche Intelligenz" an der Universität Köln.
- Oktober 2023: Das Projekt LernGrammis im Interview auf der Plattform "Digitaler Bildungsraum".
- Oktober 2023: Organisation der IDS-Teilnahme an der Aktion Türen auf mit der Maus, bei der interessierten Kindern Einblick in die Forschung des Instituts vermittelt wurde.
- September 2023: Vielfältige Vortragstätigkeiten, u. a. zur Sprachberatungskompetenz LLM-basierter Chatbots auf der GAL-Jahrestagung, zur Sprachanfragen-Pipeline auf der 4th Conference on Language, Data and Knowledge (LDK 2023) in Wien (Best Paper Award für Christian Lang, Ngoc Duyen Tanja Tu und Laura Zeidler) und zu experimentallinguistisch untersuchten Genusunsicherheiten auf der XPrag X in Paris; Vorstellung von LernGrammis als außerschulischer Lernort beim Bildungspolitischen Forum in Berlin sowie im 58. Linguistischen Kolloquium in Vilnius; Sarah Broll präsentiert mit einem GSCL-Konferenzstipendium ihr Promotionsprojekt "The German Verbal Complex in Different Text Types" im Rahmen der Conference on Natural Language Processing (KONVENS 2023).
- September 2023: Sandra Hansen und Marco Gierke unterrichten Module zu Korpusressourcen und Korpusanalysen bei der Sommerschule der Zürcher Korpuslinguistik und Korpuspragmatik.
- August 2023: Christian Lang unterstützt die Curriculum-Überarbeitung im Zuge der Reakkreditierung des Masterstudiengangs Terminologie und Sprachtechnologie der TH Köln.
- August 2023: Co-Leitung einer AG zum Thema Fachkommunikation im Rahmen der Summer School der Studienstiftung des deutschen Volkes in Wroclaw, Polen.
- Juli 2023: Ngoc Duyen Tanja Tu wird als kooptiertes Mitglied in den Vorstand des Verbands DHd - Digital Humanities im deutschsprachigen Raum berufen.
- Juli 2023: Das Informationssystem grammis präsentiert aktuelle Fragen und Antworten vom Girls' Day 2023.
- Juni 2023: Gemeinsame Aktion (Online-Showroom & Workshops) mit dem Leibniz-Forschungsnetzwerk Bildungspotenziale (LERN) am Digitaltag 2023.
- Juni 2023: "Forschendes Grammatiklernen online": Virtueller Vortrag im Rahmen einer Lektoren-Fortbildung des DAAD China in Peking.
- Mai 2023: Vortrag und Ressourcen-Vorstellung auf der LERN-Jahrestagung zum Thema "Wirksamkeit und Nachhaltigkeit in der Bildung".
- Mai 2023: "Orthographie in Wissenschaft und Gesellschaft": Bericht unserer Organisatorinnen von der 59. IDS-Jahrestagung.
- April 2023: Präsentation der neuen LernGrammis-Module für Schulunterricht und Spracherwerb beim Netzwerktag DaZ in Gießen.
- April 2023: Linguistisches Forschungskolloquium zu Forschungsperspektiven rund um unser wissenschaftsöffentliches Monitorkorpus zu Sprachanfragen.
- März 2023: Mitorganisation der IDS-Jahrestagung, der Programmbereich ist außerdem mit mehreren Plenarvorträgen und Posterpräsentationen vertreten.
- März 2023: Der Programmbereich ist mit einem Vortrag und einer Posterpräsentation auf der DGfS-Jahrestagung zum Rahmenthema "Sprachliche Kreativität und Routine" in Köln vertreten.
- Februar 2023: Experimentallinguistische Online-Datenerhebung im Projekt Sprachanfragen.
- Februar 2023: Wir begrüßen Gertrud Faaß als neue Mitarbeiterin im BMBF-Drittmittelprojekt LernGrammis.
- Januar 2023: Sandra Hansen wird in den Herausgeberbeirat der Zeitschrift Deutsche Sprache berufen.
- Januar 2023: Moderation einer neuen Folge zum Thema "Sprache ausstellen" für den Linguistik-Podcast tuwort.
- Dezember 2022: Postervortrag "Spoken, Written, and the Continuum in Between – Empirical Identification of Heterogenous Language Data" auf der DRDHum 2022 in Jyväskylä/Finnland.
- Dezember 2022: Wir begrüßen Giorgio Antonioli und Niklas Reinken als neue Mitarbeiter im BMBF-Drittmittelprojekt LernGrammis.
- November 2022: IDS-Gesprächsrunde zum Thema "Sprachanfragen – Empirisch gestützte Erforschung von Zweifelsfällen".
- November 2022: Eingeladener Vortrag "Didaktische Potenziale für die Grammatikvermittlung im Online-Informationssystem Grammis“ im Kolloquium Linguistik und Sprachdidaktik der Universität Duisburg-Essen.
- Oktober 2022: Organisation des Aktionstags Türen auf mit der Maus am IDS.
- Oktober 2022: Eingeladener Vortrag "System und Sprachgebrauch: Variationsparameter in der Korpusgrammatik des Deutschen" (gemeinsam mit PB G1) auf der SuW-Tagung in Heidelberg.
- Oktober 2022: Gastaufenthalt von Tanja Tu am Trier Center for Digital Humanities im Rahmen des DFG-Schwerpunktprogramms SPP 2207 Computational Literary Studies .
- September 2022: Vortrag "Wenn sie den richtigen Kandidat wählen - zur schwachen Maskulinflexion im heutigen gesprochenen Deutsch" (gemeinsam mit PB G1) auf der Tagung Das heutige gesprochene Deutsch zwischen Sprachkontakt und Sprachwandel in Turin.
- September 2022: Vortrag "Sprachanfragen als Datenquelle und Werkzeug zur Optimierung fachkommunikativer Prozesse bei heterogenen Wissensvoraussetzungen" auf der Jahrestagung der GAL.
- September 2022: Förderzusage des BMBF für das Drittmittelprojekt LernGrammis im Rahmen der Nationalen Bildungsplattform.
- August 2022: Aufsatz Das grammatische Informationssystem grammis – Inhalte, Anwendungen und Perspektiven in der Zeitschrift für germanistische Linguistik (ZGL).
- Juli 2022: Beteiligung an zwei Kapiteln des Lehrbuchs Wissensrohstoff Text. Eine Einführung in das Text Mining.
- Juli 2022: Neue Online-App KoViT zur Visualisierung von Kopusrecherchen freigeschaltet.
- Juni 2022: Interview für Sportstudio ZDF digital: "Frauenfußball – eine sprachliche Diskriminierung?"
- Juni 2022: Eingeladener Vortrag "Gendersensible Sprache in der Medizin" auf der Jahrestagung der Gesellschaft für Senologie an der Universität Stuttgart.
- Juni 2022: Beteiligung an zwei Beiträgen (Methodik & Fallstudie) im Lehrbuch Forschen in der Linguistik. Eine Methodeneinführung für das Germanistik-Studium.
- Mai 2022: Vortrag "Vom Korpus zur Grammatik" (gemeinsam mit PB G1) auf dem Internationalen Symposium der deutsch-chinesischen Sprachwissenschaft an der Universität Nanjing.
- Mai 2022: Wir begrüßen Sarah Broll (Doktorandin) und Tanja Tu (Postdoc) als neue Mitarbeiterinnen.
- April 2022: Eingeladene Teilnahme an der Podiumsdiskussion Dialog kontrovers an der Hochschule Mittweida.
- April 2022: Organisation des Workshops "Orthografische Zweifelsfälle" am IDS (gemeinsam mit der BBAW).
- April 2022: Zwei eingeladene Vorträge am Institut für Germanistik der Universität Graz.
- März 2022: Aufsatz "Gendern in der Schule: Zwischen Sprachwandel und orthografischer Norm" in den Mitteilungen des Deutschen Germanistikverbandes.
- März 2022: Aufsatz Zwischen Schriftlichkeit und Mündlichkeit: Songtexte in der deskriptiven Sprachforschung im Sprachreport.
- Februar 2022: Neue Ressource Sociopolitical Keywords and Distribution, dazugehöriger Artikel "Das Vokabular von Songtexten im gesellschaftlichen Kontext" erscheint im Jahrbuch Sprache in Politik und Gesellschaft.
- Februar 2022: Schulung der Arbeitsgruppe Erläuterungstexte im Projekt Bürgernahe Sprache.
- Januar 2022: Start des neuen IDS-Arbeitsplans und damit von vier innovativen Forschungsprojekten im Programmbereich.
Publikationen
Ausführliche Publikationslisten finden Sie im alphabetischen Katalog und auf den persönlichen Webseiten.
Studienpraktika
Team
- Dr. Giorgio Antonioli
- Sarah Broll, MA
- Dr. Felix Bildhauer
- Gertrud Faaß, PhD
- Dipl.-Inf. Peter M. Fischer
- Marco Gierke, MA
- Dr. Sandra Hansen
- Dr. Franziska Kretzschmar
- Dr. Christian Lang
- Dr. Niklas Reinken
- PD Dr. habil. Roman Schneider
- Uyen-Nhu Tran M.A.
- Dr. Ngoc Duyen Tanja Tu
- Dr. Anna Volodina
Studentische Hilfskräfte
- Jennifer Behr
- Daniil Gronskiy
- Fabio Massacci