COSMAS-I-Rückblick
Corpus Search, Management and Analysis System
Morphosyntaktische Annotationen
In den automatisch morphosyntaktisch analysierten und annotierten (getaggten) Korpora sind den Textwörtern Annotationen als (dem Benutzer unsichtbare) Attribute zugefügt worden:
Textwort#ANA#WORTKLASSE#Merkmal_1#Merkmal_2#...#,
z.B.: Tisch#ANA#NOU#com#sg#m#dat#.
Die morphosyntaktischen Annotationen sind gültige Suchobjekte (eine diesbezügliche Liste ist abrufbar). Das bedeutet, dass sie sich direkt suchen lassen, dass Elemente in einer Annotationskette durch den Platzhalteroperator * ersetzt werden können und dass sie mit anderen Suchobjekten kombinierbar sind.
Zur einfachen Formulierung von Annotationssuchbegriffen steht in der ein interaktiver CosmasAnnotationsAssistent zur Verfügung. <applet codebase="/kl/projekte/cosmas_I/" archive="AnnotationWizzard.jar" code="AnnotationWizzard.AnnotationWizzard.class" alt="CosmasAnnotationsAssistent" name="CosmasAnnotationWizzard" width="1" height="1"> In einem Java-fähigen Browser wird an dieser Stelle eine Demonstration des AnnotationsAssistenten gestartet. In Ihrem Browser ist Java leider nicht aktiviert. </applet>
Beispiel-Suchanfragen in Bezug auf morphosyntaktische Annotationen:
#ANA#AUX#pl#*#1#*
sucht nach Hilfs-/Modalverben in der 1. Person Plural, z.B.:
wir müssen / können / sollen / konnten
haben / wollen / hatten / werden
könnten / sollten / hätten
#ANA#VRB*fut*
sucht nach Verbformen im Futur I und II, z.B.:
..., später werde ich dir alles erzählen.
... wird die Umstellung am 14. April abgeschlossen sein ...
#ANA#ADJ*sup*gen*
sucht nach allen Adjektiven im Superlativ und dazu im Genitiv, z.B.:
einer der beliebtesten deutschen Filmstars
wertvollen /+w1 #ANA#NOU*pl*acc*
sucht nach der Wortform wertvollen, gefolgt von Substantiven im Akkusativ Plural, z.B.:
für seine wertvollen Informationen
zu /w0 #ANA#AUX*
sucht nach Infinitiven mit zu, z.B.:
... die Chance zu nutzen.
... Schulden beglichen zu haben ...
#ANA#ADV*pref* /w0 auf
sucht nach dem abgetrennten Verbpräfix auf, z.B.:
wies ... auf [aufweisen]
rufen ... auf [aufrufen]
&nehmen /+s0 #ANA#ADV*pref*
sucht nach Verbformen von nehmen und nachgestellten abgetrennten Verbpräfixen innerhalb eines Satzes, z.B.:
nahmen ... ein [einnehmen]
nimm ... hoch [hochnehmen]
für /+w2 (#ANA#NUM#* #ANA#NOU#*#pl#*#acc#*)
sucht nach der Präposition für und - im Abstand von ein bis zwei Wörtern ihr nachgestellt - nach Numeralia, gefolgt von Substantiven im Akkusativ Plural, z.B.:
für mindestens zwei Tage für 50 Pfennige
Die Wortklassen, Merkmale und deren Wertebereiche basieren auf dem MECOLB-Minimal-Tagset, s. Jan Cloeren, Morphosyntaktische Annotationen in einem mehrsprachigen Umfeld (in LDV-Info, Heft 8, IDS Mannheim, 1996).