16. Vortrag im Rahmen des internationalen Gästeforums

Informationssysteme mit dynamischen semantischfundierten Beispielen auf der Grundlage natürlicher Sprachverarbeitung und -generierung

Foto von María José Domínguez Vázquez
© María José Domínguez Vázquez

María José Domínguez Vázquez
Universidade de Santiago de Compostela – ILG – EMLex

Mittwoch, 15. Juni 2022, 14:30-16:00 Uhr
IDS Mannheim, Vortragssaal

Der Vortrag zeichnet nach, wie neue lexikographische Tools auf der Grundlage schon vorhandenen lexikographischen Wissens, der Interaktion zwischen der Lexikographie und der natürlichen Sprachverarbeitung (NLP) und -generierung (NLG) sowie der Datenintegration und Ressourceninteroperabilität zustande kommen können. Das bereits Umrissene wird am Beispiel der drei plurilingualen Sprachgeneratoren Xera, Combinatoria und CombiContext veranschaulicht. Im Konkreten wird ihr aktueller Stand, die ihnen zugrundeliegende Methode und die verwendeten sowie ad hoc entwickelten Ressourcen dargestellt.

Xera und Combinatoria vermitteln Auskunft über den syntaktisch-semantischen Rahmen der Nominalphrase aus syntagmatischer und paradigmatischer Sicht: Xera generiert einfache syntaktisch-semantische Argumentstrukturen bzw. Beispiele, wie z.B. Die Reise nach Berlin. Combinatoria bietet komplexere nominale Muster an, wie z.B die Reise der Sprachwissenschaftlerin nach Deutschland. Der dritte Prototyp – CombiContext – dient der Einbettung der automatisch generierten Nominalphrasen in Sätze, wie z.B. Das Reisebüro organisiert die Reise der Sprachwissenschaftlerin nach Deutschland. All drei Simulatoren stehen für das Deutsche, das Französische und das Spanische zur Verfügung.

Die drei Prototypen bilden ein Beispiel für automatische computergestützte syntagmatische plurilinguale Ressourcen zur Beschreibung des Kombinationspotentials der Nominalphrase auf phrasaler und satzwertiger Ebene, die eine gezielte Abfrage und Interaktion seitens menschlicher Nutzer ermöglichen.  Aus diesem Grund lassen sich  die von ihnen vermittelten Beispiele als dynamisch bezeichnen. Die Integration ihrer Daten in andere E-Tools oder Informationssysteme ist ebenfalls möglich.

Zur Person:

María José Domínguez Vázquez ist Professorin für Germanistik an der Universität Santiago de Compostela (Spanien) und Stipendiatin der Alexander von Humboldt Stiftung. Ihre Forschungsschwerpunkte sind die Valenzgrammatik und -lexikographie, die kontrastive Linguistik und die digitalen Sprachwissenschaften. Sie leitet Forschungsprojekte auf dem Gebiet  der multilingualen Lexikographie sowie der automatischen Sprachverarbeitung und -generierung sprachlicher syntaktischer-semantischer Muster. Sie ist die spanische Koordinatorin des Master Erasmus Mundus in LexikographieEMLex – und Vorsitzende seines Leitungsgremius.

Literatur:

Domínguez Vázquez, María José (2022): “Contribución de la semántica combinatoria al desarrollo de herramientas digitales multilingües”. Círculo de Lingüística Aplicada a la Comunicación, n. 90, 171-188.

Domínguez Vázquez, María José & Bardanca Outeiriño, Daniel & Simões, Alberto (2021): “Automatic Lexicographic Content Creation: Automating Multilingual Resources Development for Lexicographers”, in Post-editing Lexicography – Elex 2021. Proceedings of the eLex 2021 conference. 5-7 Julio 2021,  Brno, 269-287.

Domínguez Vázquez, María José (2021): “Zur Darstellung eines mehrstufigen Prototypbegriffs in der multilingualen automatischen Sprachgenerierung: vom Korpus über word embeddings bis zum automatischen Wörterbuch”, in Lexikos 31, 20-50.

Domínguez Vázquez, María José & Valcárcel Riveiro, Carlos (2020): “PORTLEX as a multilingual and cross-lingual online dictionary”, in Domínguez Vázquez, María José & Mirazo Balsa, Mónica & Valcárcel Riveiro, Carlos (Hrsg.): Studies on multilingual lexicography. Berlin: De Gruyter, 135-158.

Domínguez Vázquez, Mª José & Engel, Ulrich & Paredes Suárez, Gemma (2017): Neue Wege zur Verbvalenz. Band I: Theoretische und methodologische Grundlagen. Band II: Deutsch-spanisches Valenzlexikon Frankfurt: Peter Lang.

Portal lexicográfico PORTLEX = http://portlex.usc.gal/