Jahrestagungen
Präsentation: Dr. Silvia Hansen-Schirra (Universität Saarbrücken)
Das TIGER-Korpus - Annotations- und Suchwerkzeuge
Abstract
Das TIGER-Korpus ist eine Baumbank für das Deutsche. Es besteht aus Zeitungstexten der Frankfurter Rundschau. Neben syntaktischen Informationen (Phrasenstruktur und grammatische Funktionen) wurden auch Wortklassen, Morphologie und Lemma annotiert. Zur halb-automatischen Annotation wurde das Annotationswerkzeug ANNOTATE eingesetzt. Das Korpus umfasst 50.000 Sätze (ca. 900.000 Tokens).
Zur Baumbank-Abfrage wurde das Suchwerkzeug TIGERSearch entwickelt. Es erlaubt die Suche nach Textsegmenten und/oder Annotationskategorien. Durch komplexe Anfragen können Linguisten theoretische Forschungsfragen empirisch überprüfen. Zur leichteren Handhabung der Anfragesprache steht hierzu eine graphische Benutzerschnittstelle zur Verfügung.
