[IDS-Logo] [COSMAS-II-Logo]
Seite drucken Thema drucken Sitemap Suche Impressum Datenschutz Kontakt

Die Ergebnis-Ansicht nach Wort-Types

In dieser Darstellungsform werden die Treffer nach ihren Wort-Types zusammengefasst und sortiert. Dabei werden unter Berücksichtigung der unten beschriebenen Optionen identische Treffer auf denselben Type abgebildet.

Die 4-spaltige Ergebnispräsentation, bei der jede Spalte auf- und absteigend sortiert werden kann, enthält die folgenden Daten:

Wort-Type-Ansicht für Suchanfrage *ameise

Treffer der Suchanfrage *ameise in der Wort-Type-Ansicht
sortiert nach ihrer relativen Häufigkeit

Optionen

Die Wort-Types-Ansicht wird von den hier beschriebenen Optionen gesteuert und kann je nach Kombination dieser Optionen länger oder kürzer ausfallen:

Option: WortType
Einstellung BedeutungErscheinungsbild in der Tabelle
Ei bzw. Eb Erstes Zeichen:
Groß-/Kleinschreibung ignorieren bzw. beachten
Erstes Zeichen: groß
Ri bzw. Rb restliche Zeichen:
Groß-/Kleinschreibung ignorieren bzw. beachten
restliche Zeichen: groß
Di bzw. Db diakritische Zeichen:
ignorieren bzw. beachten
diakritische Zeichen: entfernt
Si bzw. Sb Sonderzeichen an den Wortenden:
ignorieren bzw. beachten
Sonderzeichen an den Wortenden: entfernt
Worttype-Endlänge = Zahl bei Zahl > 0 wird die Länge der Wort-Type-Endungen festgelegt. die Wort-Types werden nach ihrer Endung sortiert.
Worttype-Endlänge = 0 die Sortierung nach der Endung der Wort-Types wird ausgeschaltet.

Tab.: die Optionen WortType und Worttype-Endlänge

Die zum Aufbau der Wort-Type-Ansicht genommenen Einstellungen werden zur Information sowohl bei der Anzeige als auch beim Export im Kopf der Spalte Wort-Types angezeigt (hier Ei+Ri+Di+Si). Das Erscheinungsbild der angezeigten Wort-Types richtet sich, wie in der obigen Tabelle beschrieben, nach den eingestellten Optionen. Die Originalschreibweise der Treffer kann im KWIC, in den Sub-KWICs und den Belegen eingesehen werden.

Setzen der Optionen

Diese Optionen werden mit dem #SET-Kommando im Suchanfrage-Fenster wie folgt gesteuert bzw. ein- und ausgeschaltet. Hierzu wird das Kommando in das Suchanfrage-Fenster geschrieben und mit dem Schalter Suchen ausgeführt.

#SET Worttype = Ei+Ri+Db+Si Setzen der erwünschten Beachtungs-/Ignorierungsoptionen für das erste Zeichen und die restlichen Zeichen eines Wortes, die diakritischen Zeichen und die Sonderzeichen.
#SET Worttype-Endlänge = 2 Setzen der Endungslänge auf 2 Zeichen und Einschalten der Sortierung nach Wort-Type-Endungen.
#SET Worttype-Endlänge = 0 Ausschalten der Sortierung nach Wort-Type-Endungen.

Interpretation der Types

Beispiele für Suchanfrage würde
Einstellung Types Frequenz
Eb Würde
würde
25
20
Ei Würde 37
Rb Würde
WÜRDE
WürDE
25
10
1
Ri WÜRDE 36
Db Würde
Wurde
25
32
Di Wurde 57
Sb Wurde
(wurde)
"wurde"
2
3
7
Si Wurde 12

Beispiel

Ein ausführliches Beispiel über die adjektivische Konstruktion nicht … un-Adjektiv zeigt zwei Anwendungsfälle der Ansicht nach Wort-Types auf.

Wort-Types, die sich nicht eindeutig zuordnen lassen

Textstellen, aus denen mehrere suchbare Begriffe extrahiert wurden, führen zu einem besonderen Problem. COSMAS II kann in diesem Fall nachträglich, also beim Aufbau der Ansicht nach Wort-Types, die Zuordnung vom Suchbegriff zu seinem Wort-Type nicht mehr eindeutig durchführen, wie das folgende Schema ausführt:

Vorbereitung der Suche:

Textstelle → Tokenisierung → mehrere Suchbegriffe → mehrere Wort-Types.

Aufbau der Wort-Type-Ansicht:

KWIC → Textstelle → 1 Default-Wort-Type.

Für diese Fälle findet COSMAS II nur den Default-Wort-Type. Dieser besteht aus der links stehenden Wortform der Zeichenkette, bereinigt von Sonderzeichen. In der folgenden Tabelle werden einige Fälle genannt:

Textstelle suchbare Begriffe angezeigter Wort-Type
»... Studentin.Die ...« Studentin
die
Studentin
»... Mutter.Studentin...« Mutter
Studentin
Mutter
»... elternbriefe@ane.de.Berlin.Studenten ...« elternbriefe@ane
de
Berlin
Studenten
elternbriefe@ane
»... (Ex)Studentinnen ...« Ex
Studentinnen
Ex

Es gibt außerdem einige wenige fehlerhafte Zuordnungen, in dem Sinne, als dass eine Textstelle irrtümlicherweise auf ein beliebiges Sonderzeichen als Wort-Type abgebildet wird, das im Text nicht vorkommt. Dies ist auf einen Systemfehler zurückzuführen. Die Fundstelle bzw. der Treffer ist allerdings korrekt. Beispiele für fehlerhafte Wort-Types: "#", "+", "%", etc.

COSMAS II, Zentrale DV-Dienste - 09. 06. 2015