[IDS-Logo] Online-Hilfe zu COSMAS II/web: Syntax der zeilenorientierten Suchanfragesprache
Syntax der ZeileneingabeAllgemeines zur SuchanfrageZeichensatz und Sonderzeichen

Zeichensatz und Sonderzeichen

COSMAS II akzeptiert die deutschen Sonderzeichen (ä, Ä, ö, Ö, ü, Ü sowie ß) in den Wörtern der Suchanfrage sowie alle weiteren Sonderzeichen von ISO 8859-1, dem Zeichensatz der westeuropäischen Sprachen.

[ISO-Latin1.jpg]

(Grafik entnommen aus Wikipedia)

Das Et-Zeichen &

Eine Ausnahme innerhalb ISOlat1 bildet das Et-Zeichen '&', das wegen seiner Funktion in HTML- und UNICODE-Zeichenkodierungen als & kodiert ist und als solches gesucht werden muss.

H&M-Kette

Diese Suchanfrage findet Vorkommnisse von H&M-Kette.

Wird das & als freistehendes Zeichen und nicht als Bestandteil eines Wortes gesucht, muss es zwischen " und " geschrieben werden:

Bang "&" Olufsen

Sonderzeichen am Wortende

Jede Wortform, die in den Korpustexten mit einem Sonderzeichen endet, ist nur ohne dieses Zeichen suchbar. Davon ausgenommen sind Abkürzungen, sie behalten ihren Punkt auch in der Suchanfrage.

Wenn z.B. nach "usw." oder "Prof." gesucht werden soll, muss in der Suchanfrage stehen:

Beispiel-Suchanfragen:

usw.
Prof.

Suche nach Wortformen mit Sonderzeichen außerhalb von ISOLat1

COSMAS II nutzt als Standard-Zeichensatz ISOLat1 (entspricht ISO8859-1). Zeichen, die sich nicht in diesem Zeichensatz befinden bzw. Zeichen, von denen man nicht genau weiss, wie man sie über die Tastatur eingeben soll, können als XML-Zeichen mit dezimalem UNICODE-Wert eingegeben werden.

Beispiel: Auslassungspunkte

Zeichen Symbol HTML-Zeichen UNICODE-Wert
dezimal
UNICODE-Wert
hexadezimal
Auslassungspunkte … 8230 x2026

Beispiel: Suchanfrage nach dem Sonderzeichen allein

"…"

Bemerkung: da das &-Zeichen am Anfang des Suchbegriffs steht, muss der gesamte Suchbegriff zwischen Anführungszeichen geschrieben werden, damit COSMAS II es vom Lemmatisierungsoperator unterscheiden kann.

Beispiel: Suchanfrage nach dem Sonderzeichen innerhalb eines Suchbegriffs

"*…"
"*…*"
"…*"

Wie lautet die Kodierung meines Sonderzeichens

Der Dezimalwert vieler Sonderzeichen läßt sich z.B. in Wikipedia nachschlagen. Siehe zum Beispiel den Wikipedia-Eintrag für die Auslassungspunkte.

Wortliste

Der WORT-Operator verfügt außerdem über eine globale Wortformliste, die Sie aufrufen können, um sich die Wortformen im momentan aktiven Archiv präsentieren zu lassen und gegebenenfalls eine davon auszuwählen.

COSMAS II, Zentrale DV-Dienste - 18. 01. 2018