IDS-Logo
Startseite : : Über uns : : Jahrestagungen : : Jahrestagung 2006 : : Abstract

Präsentation: Dr. Heike Zinsmeister (Universität Tübingen)

TUSNELDA - Tuebinger Sammlung Nutzbarer Empirischer Linguistischer Datenstrukturen

Abstract

Das System unfasst eine Sammlung XML-annotierter Texte verschiedener Sprachen, die von Teilprojekten des Tübinger SFBs 441 erarbeitet wurden. Basierend auf bestehenden Standards wurde ein gemeinsames XML-Annotationsschema für die Kodierung linguistischer Phänomene ausgearbeitet und eine allgemeine Spezifikationen für Metadaten enwickelt. In der Systempräsentation stellen wir den TUSNELDA-Annotationsstandard anhand von Beispielkorpora vor und demonstrieren die Korpusabfrage mittels Internet-Abfrage-Schnittstellen.

Präsentation: Dr. Andreas Witt (Universität Tübingen)

Poster: Nachhaltigkeit linguistischer Daten - ein Kooperationsprojekt der SFBs 441, 538 und 632

Abstract

In den linguistischen Sonderforschungsbereichen 441, 538 und 632 entstehen aufwändig er-stellte und qualitativ hochwertige elektronische Kollektionen linguistischer Daten, die für die Untersuchung sprachwissenschaftlicher Fragestellungen genutzt werden. Das bis 2008 geför-derte Projekt C2 des SFBs 441 besitzt den Status eines Kooperationsprojekts der drei SFBs. Ein Ziel von C2 ist es, die Voraussetzungen für die nachhaltige allgemeine Verfügbarkeit dieser Daten, auch nach der Beendigung der SFBs, zu schaffen. Daraus ergibt sich ein weite-res allgemeineres Ziel: es sollen generische Lösungen entwickelt werden, die auf andere lin-guistische Daten-Kollektionen übertragbar sind.