COSMAS-I-Rückblick
Corpus Search, Management and Analysis System
Morphosyntaktische Annotationen
In den automatisch morphosyntaktisch analysierten und annotierten (getaggten) Korpora sind den Textwörtern Annotationen als (dem Benutzer unsichtbare) Attribute zugefügt worden:
Textwort#ANA#WORTKLASSE#Merkmal_1#Merkmal_2#...#,
z.B.: Tisch#ANA#NOU#com#sg#m#dat#
.
Die morphosyntaktischen Annotationen sind gültige Suchobjekte (eine diesbezügliche Liste ist abrufbar). Das bedeutet, dass sie sich direkt suchen lassen, dass Elemente in einer Annotationskette durch den Platzhalteroperator * ersetzt werden können und dass sie mit anderen Suchobjekten kombinierbar sind.
Zur einfachen Formulierung von Annotationssuchbegriffen steht in der WWW-Version von COSMAS I ein interaktiver CosmasAnnotationsAssistent zur Verfügung.
Beispiel-Suchanfragen in Bezug auf morphosyntaktische Annotationen:
- #ANA#AUX#pl#*#1#*
- sucht nach Hilfs-/Modalverben in der 1. Person Plural, z.B.:
- wir müssen / können / sollen / konnten
- haben / wollen / hatten / werden
- könnten / sollten / hätten
- #ANA#VRB*fut*
- sucht nach Verbformen im Futur I und II, z.B.:
- ..., später werde ich dir alles erzählen.
- ... wird die Umstellung am 14. April abgeschlossen sein ...
- #ANA#ADJ*sup*gen*
- sucht nach allen Adjektiven im Superlativ und dazu im Genitiv, z.B.:
- einer der beliebtesten deutschen Filmstars
- wertvollen /+w1 #ANA#NOU*pl*acc*
- sucht nach der Wortform wertvollen, gefolgt von Substantiven im Akkusativ Plural, z.B.:
- für seine wertvollen Informationen
- zu /w0 #ANA#AUX*
- sucht nach Infinitiven mit zu, z.B.:
- ... die Chance zu nutzen.
- ... Schulden beglichen zu haben ...
- #ANA#ADV*pref* /w0 auf
- sucht nach dem abgetrennten Verbpräfix auf, z.B.:
- wies ... auf [aufweisen]
- rufen ... auf [aufrufen]
- &nehmen /+s0 #ANA#ADV*pref*
- sucht nach Verbformen von nehmen und nachgestellten abgetrennten Verbpräfixen innerhalb eines Satzes, z.B.:
- nahmen ... ein [einnehmen]
- nimm ... hoch [hochnehmen]
- für /+w2 (#ANA#NUM#* #ANA#NOU#*#pl#*#acc#*)
- sucht nach der Präposition für und - im Abstand von ein bis zwei Wörtern ihr nachgestellt - nach Numeralia, gefolgt von Substantiven im Akkusativ Plural, z.B.:
- für mindestens zwei Tage für 50 Pfennige
Die Wortklassen, Merkmale und deren Wertebereiche basieren auf dem MECOLB-Minimal-Tagset, s. Jan Cloeren, Morphosyntaktische Annotationen in einem mehrsprachigen Umfeld (in LDV-Info, Heft 8, IDS Mannheim, 1996).