Neuerscheinungen

IDSopen 7 Fiedler et al., Tablet mit Frontansicht
© IDS-Verlag 2024

Fiedler, Norman/Köller, Christoph/Bopp, Jutta/Schneider, Felix (2024): Linguistisches Impact-Assessment: Maschinelle Prognose mit Realitätsabgleich im Projekt TextTransfer. (= IDSopen 7). Mannheim: IDS-Verlag.

Empirische Ansätze halten zunehmend Einzug in die Methodik und Herangehensweise geisteswissenschaftlicher Forschung. Die Sprachwissenschaften stützen sich zunehmend auf Forschungsdaten und Sprachmodelle, um ein digitales Bild natürlicher Sprachen zu erzeugen. Auf dieser Grundlage wird es möglich, entlang nutzerspezifischer Suchanfragen des distant reading automatisiert semantische Muster in Texten zu erkennen. Seit mithilfe solcher Modelle, etwa in Suchmaschinen, webbasierten Übersetzungs- oder Konversationstools, sprachliche Informationen maschinell in sinnhaften Zusammenhängen reproduziert werden können, sind die Implikationen sogenannter Künstlicher Intelligenz (KI) zu einem Thema im gesamtgesellschaftlichen Diskurs avanciert. Vielen Linguisten ist es deshalb ein Anliegen, ihre Erkenntnisse für neue Anwendungsfelder jenseits ihrer unmittelbaren disziplinären Umgebung zu öffnen und zu einer fundierten Debatte beizutragen. Dieser Feststellung gegenüber steht die Einsicht, dass Forschungsergebnisse aller Disziplinen zwar archiviert, aber mangels gezielter Interpretierbarkeit großer und komplexer Datenmengen häufig für diesen breiten Diskurs nicht genutzt werden. Ein nachweisbarer Impact bleibt aus. An dieser Schnittstelle erarbeitet das vom Bundesministerium für Bildung und Forschung (BMBF) finanzierte Projekt TextTransfer einen Ansatz, um per distant reading auf Art und Wahrscheinlichkeit eines gesellschaftlichen, wirtschaftlichen oder politischen Impacts textgebundenen Forschungswissens zu schließen. Zu diesem Zweck baut TextTransfer ein maschinelles Lernverfahren auf, das auf empirischem Erfahrungswissen zu Impacterfolgen von Forschungsprojekten fußt. Als wesentlicher Baustein dieses Erfahrungsgewinns gilt die Verifizierbarkeit der Lernergebnisse. Der vorliegende Artikel zeigt einen ersten Ansatz im Projekt, ein Sprachmodell in einem gesteuerten Lernverfahren mit belastbaren Lerndaten zu trainieren, um möglichst hohe Präzision im Impact-Assessment zu erreichen.

Buchumschlag mit Brücke, Cover
© IDS-Verlag 2024

Becker, Maria (2024): Building Bridges - Reconstructing Implicit Information in Argumentative Texts Using Commonsense Knowledge. (= amades 61). Mannheim: IDS-Verlag.

In many argumentative texts a substantial amount of knowledge remains implicit. This implicit knowledge is often crucial for a deep understanding and correct interpretation of arguments. In this work we investigate how to automatically reconstruct implicit knowledge in argumentative texts, and how the reconstruction of implicit knowledge can help in improving computational argument analysis. We point out that knowledge which stays implicit can in most cases be framed as commonsense knowledge, which has been shown to be helpful for solving many Natural Language Processing (NLP) tasks. However, it has not yet been leveraged for an in-depth analysis of arguments. This work closes this research desideratum by integrating commonsense knowledge in computational argument analysis. We explore ways to fill implicit knowledge gaps in arguments automatically by utilizing commonsense knowledge, in order to build bridges between argumentative sentences – with the ultimate goal of improving argument analysis.

Buchumschlag, Deutschlandkarte in Dialektbereiche geteilt, Cover
© IDS-Verlag 2024

Adler, Astrid/Plewnia, Albrecht/Ribeiro Silveira, Maria: Dialektkompetenz und Dialektgebrauch in Deutschland. Mannheim: IDS-Verlag.

Die deutsche Sprachlandschaft ist entscheidend geprägt von arealer Variation, Dialekte haben sowohl im kollektiven Sprachwissen als auch im sprachlichen Alltag ihren festen Platz. Allerdings hat der Dialekt heutzutage nicht mehr denselben Stellenwert wie vor mehreren Jahrzehnten. Wie ist es heute genau um die Dialektkompetenz und den Dialektgebrauch der Menschen in Deutschland bestellt? Das Leibniz-Institut für Deutsche Sprache (IDS) hat dazu in Kooperation mit dem Deutschen Institut für Wirtschaftsforschung eine bundesweite Repräsentativerhebung unter 4.380 Gewährspersonen durchgeführt; die zentralen Ergebnisse dieser Befragung werden in der vorliegenden Broschüre präsentiert.

Buchumschlag mit Schmetterlingen, Cover
© IDS-Verlag 2024

Domizi, Alessandra (2024): Die ästhetische Wahrnehmung der deutschen Sprache im europäischen Raum. (= amades 62). Mannheim: IDS-Verlag.

Ist Deutsch eigentlich die hässlichste Sprache Europas? Dieser Beitrag analysiert, wie die deutsche Sprache im europäischen Raum ästhetisch wahrgenommen wird und was hinter dieser Wahrnehmung sprachwissenschaftlich gesehen steckt. Die Studie kombiniert qualitative und quantitative Forschungsmethoden miteinander. So werden auf der einen Seite Sprachurteile dokumentiert und analysiert. Auf der anderen Seite wird die durchgeführte europaweite Befragung mit über 2000 Proband*innen ausgewertet, was gleichzeitig einen methodischen Ausgangspunkt für weitere Erhebungen festlegt. Überwiegt die Wahrnehmung des Deutschen als „harte“ Sprache wirklich? Ist „hart“ denn direkt „hässlich“? Und ist die Wahrnehmung mancher Sprachen als besonders reizlos tatsächlich nur gesellschaftlich konstruiert, wie der bisherige Stand der Forschung nahelegt, oder spielen universelle kognitive Prozesse doch eine größere Rolle als gedacht? Basierend auf einem beträchtlichen Datensatz wirft diese Studie neues Licht auf eine der umstrittensten und methodisch herausforderndsten Kontroversen der Linguistik.

elektronische Publikation im Pad dargestellt
© IDS-Verlag 2024

Tu, Ngoc Duyen Tanja (2024): Eine korpuslinguistische Untersuchung zur lexikalischen Vielfalt von direkten und indirekten Redeeinleitern. (= IDSopen 6). Mannheim: IDS-Verlag.

Redeeinleiter sind sprachliche Ausdrücke unterschiedlicher Wortarten, die relativ zur Redewiedergabe in Voran-, Mittel- oder Nachstellung stehen und eine direkte oder indirekte Redewiedergabe einleiten. Dadurch sind Redeeinleiter sehr vielfältig, womit sie sich als Untersuchungsgegenstand einer Analyse zur lexikalischen Vielfalt von Teilwortschätzen eignen.
Als Datengrundlage der vorliegenden Untersuchung dienen die manuell annotierten direkten und indirekten Redeeinleiter des Redewiedergabe-Korpus. Dieses setzt sich aus fiktionalen und nicht-fiktionalen Textausschnitten, die zwischen 1840–1920 veröffentlicht wurden, zusammen. Ziel der Analyse ist es, zu ermitteln, wie sich der Teilwortschatz der direkten und der der indirekten Redeeinleiter in ihrer lexikalischen Vielfalt voneinander unterscheiden und wie diese Unterschiede zu begründen sind. Dafür wird ein Set an quantitativen Methoden erarbeitet mit dem die lexikalische Vielfalt von Teilwortschätzen bestimmt werden kann und das in zukünftigen Untersuchungen zur lexikalischen Vielfalt als Standardrepertoire herangezogen werden kann.

SPRACHREPORT
© IDS

Leibniz-Institut für Deutsche Sprache (2024): SPRACHREPORT – Informationen und Meinungen zur deutschen Sprache. Mannheim: IDS-Verlag.

Vierteljährlich erscheint ein neues Heft unserer Zeitschrift SPRACHREPORT. Das neueste Heft finden Sie unter folgendem Link.