COSMAS-I-Rückblick
Corpus Search, Management and Analysis System

Morphosyntaktische Annotationen

In den automatisch morphosyntaktisch analysierten und annotierten (getaggten) Korpora sind den Textwörtern Annotationen als (dem Benutzer unsichtbare) Attribute zugefügt worden:

Textwort#ANA#WORTKLASSE#Merkmal_1#Merkmal_2#...#,

z.B.: Tisch#ANA#NOU#com#sg#m#dat#.

Die morphosyntaktischen Annotationen sind gültige Suchobjekte (eine diesbezügliche Liste ist abrufbar). Das bedeutet, dass sie sich direkt suchen lassen, dass Elemente in einer Annotationskette durch den Platzhalteroperator * ersetzt werden können und dass sie mit anderen Suchobjekten kombinierbar sind.

Zur einfachen Formulierung von Annotationssuchbegriffen steht in der ein interaktiver CosmasAnnotationsAssistent zur Verfügung. <applet codebase="/kl/projekte/cosmas_I/" archive="AnnotationWizzard.jar" code="AnnotationWizzard.AnnotationWizzard.class" alt="CosmasAnnotationsAssistent" name="CosmasAnnotationWizzard" width="1" height="1"> In einem Java-fähigen Browser wird an dieser Stelle eine Demonstration des AnnotationsAssistenten gestartet. In Ihrem Browser ist Java leider nicht aktiviert. </applet>

Beispiel-Suchanfragen in Bezug auf morphosyntaktische Annotationen:

#ANA#AUX#pl#*#1#*

sucht nach Hilfs-/Modalverben in der 1. Person Plural, z.B.:

wir müssen / können / sollen / konnten

haben / wollen / hatten / werden

könnten / sollten / hätten

#ANA#VRB*fut*

sucht nach Verbformen im Futur I und II, z.B.:

..., später werde ich dir alles erzählen.

... wird die Umstellung am 14. April abgeschlossen sein ...

#ANA#ADJ*sup*gen*

sucht nach allen Adjektiven im Superlativ und dazu im Genitiv, z.B.:

einer der beliebtesten deutschen Filmstars

wertvollen /+w1 #ANA#NOU*pl*acc*

sucht nach der Wortform wertvollen, gefolgt von Substantiven im Akkusativ Plural, z.B.:

für seine wertvollen Informationen

zu /w0 #ANA#AUX*

sucht nach Infinitiven mit zu, z.B.:

... die Chance zu nutzen.

 ... Schulden beglichen zu haben ...

#ANA#ADV*pref* /w0 auf

sucht nach dem abgetrennten Verbpräfix auf, z.B.:

wies ... auf  [aufweisen]

rufen ... auf [aufrufen]

&nehmen /+s0 #ANA#ADV*pref*

sucht nach Verbformen von nehmen und nachgestellten abgetrennten Verbpräfixen innerhalb eines Satzes, z.B.:

nahmen ... ein [einnehmen]

nimm ... hoch  [hochnehmen]

für /+w2 (#ANA#NUM#* #ANA#NOU#*#pl#*#acc#*)

sucht nach der Präposition für und - im Abstand von ein bis zwei Wörtern ihr nachgestellt - nach Numeralia, gefolgt von Substantiven im Akkusativ Plural, z.B.:

für mindestens zwei Tage für 50 Pfennige

Die Wortklassen, Merkmale und deren Wertebereiche basieren auf dem MECOLB-Minimal-Tagset, s. Jan Cloeren, Morphosyntaktische Annotationen in einem mehrsprachigen Umfeld (in LDV-Info, Heft 8, IDS Mannheim, 1996).

zu COSMAS I