[IDS-Logo] [IDS-Logo]
Seite drucken Thema drucken Sitemap Suche Impressum Datenschutz Kontakt
zeilenorientierte Eingabethemenspezifische Fragestellungen(Folgen von) Wortendungen suchen

Suchen nach (Folgen von) Wortendungen

Suchen nach Wortendungen in großen Archiven

Es gibt in COSMAS II eine Vielzahl von Möglichkeiten, Belege über Wortendungen zu suchen:

Nachteil

In den großen Archiven wie W - W4 hat dies den Nachteil, dass zuerst eine sehr lange Liste von zu der Endung passenden Wörtern erstellt werden muss. Diese Liste kann Millionen von Wörtern enthalten und die Zeit für ihren Aufbau 1 Stunde und länger betragen.

Wenn außerdem mehrere solche Listen zu einer komplexen Suchanfrage verknüpft werden, kann die Ausführungszeit unverhältnismäßig ansteigen oder sogar wegen Überschreiten eines Zeitlimits abbrechen. Dazu das nächste Beispiel.

Suche nach Folgen von bestimmten Endungen von Nomen

Gesucht werden Belege von Folgen von Nomen auf ung nach dem Muster: N+ung N+ung,
wie z.B. in »… in Richtung Brandstiftung ermittelt wird.«.

Recherchiert wird in den folgenden Beispielen in den annotierten Archiven TAGGED-C und TAGGED-C2.

Wie eingangs erläutert wurde, ist die folgende naheliegende Suchanfrage unvorteilhaft bezüglich ihrer Ausführungszeit:

S1: (*ung /w0 MORPH(N)) /+w1:1,s0 (*ung /w0 MORPH(N))

In der Folge wird ein anderer Weg in COSMAS II beschrieben, um schneller bzw. überhaupt die gewünschten Ergebnisse zu erhalten.

Schnelle Suchanfrage mit anschließender Ergebnispräsentation nach Endungen

Um überhaupt in kürzerer Zeit an Belege zu kommen, wird hier empfohlen, zuerst eine Suchanfrage für Sequenzen von 2 Nomen auszuführen:

S2: MORPH(N){2:2}

Diese Suchfrage ist zwar allgemeiner als S1, ist aber syntaktisch gleichwertig, da mit dem Muster Nomen + Nomen nach einer Sequenz von 2 Wörtern gesucht wird. Außerdem ist sie sehr viel schneller, weil die Endungen noch nicht gesucht werden und der Wiederholungsoperator {2:2} rasch ausgeführt werden kann.

Die Ergebnisansicht nach Wortendungen

Das aufwändige Ausfindigmachen von Wortendungsfolgen in einer Treffermenge von hier ca. 90 Millionen Nomen-Paaren wird in COSMAS II nun in der Ergebnisansicht nach Endungen vorgenommen. Dazu muss in diesem Fall eine Endungslänge von 3 Zeichen eingestellt werden. Das geschieht in der gegenwärtigen Version mit folgender Anweisung im Suchfenster von COSMAS II, die mit dem Schalter suchen ausgelöst wird:

Im Reiter für die Ergebnisse wähle man nun die Ansicht nach Wort-Endungen, sortiere sie z.B. nach den Wortendungen und suche über die Suchfunktion des Browsers die Folge "UNG UNG", um zu dieser Endungsfolge zu gelangen.

Unter Umständen lohnt sich in dieser Ansicht ein Blick auf die Verteilung der verschiedenen Endungsfolgen, was mit der Suchanfrage S1 nicht möglich gewesen wäre.

Exportieren der gesuchten Belege

Durch Aufklappen z.B. des Eintrags für die Endungsfolge "UNG UNG" wird der entsprechende KWIC-Ausschnitt eingeblendet. Falls die Belege exportiert werden sollen, können sie in diesem Popup-Fenster ausgewählt bzw. aktiviert werden, z.B. über das Menü Seite aktivieren (links über den Häkchen):

Im Exportmenü wähle man dazu die Option nur ausgewählte Treffer, damit genau diese Belege (KWIC oder Volltext) exportiert werden.

Verfeinerungen und Varianten der Suchanfrage

S3: MORPH(N){2:2} %w0 ,

Suchanfrage S3 verfeinert die Suchanfrage S2, indem sie diejenigen Nomen-Folgen ausschließt, die mit einem Komma auftreten.

Die Ansicht nach Wort-Types und weitere Optionen

Die Ergebnisansicht nach Wort-Types kann ebenfalls dazu herangezogen werden, bestimmte Wortendungen oder Sequenzen von Wortendungen aufzufinden. Bei eingeschalteter Option Worttype-Endlänge = 3, siehe oben, wird die gesamte Wort-Type-Ansicht nach den Endungen sortiert, die Endungen werden blau angezeigt:

Der Nachteil ist der, dass diese Ansicht Endungsfolgen mehrfach anzeigt, da sie nach den Wort-Types und nicht nach den Endungen zusammengefasst wird. Es sind also wesentlich mehr Einträge in der Ansicht nach Wort-Types zu erwarten als in der Ansicht nach Endungen. Die Darstellung dieser langen Liste ist in einem Browser dementsprechend sehr langsam.

Intern wird die Ansicht nach Endungen aus der Ansicht nach Wort-Types generiert. Deshalb gelten für beide Präsentationsformen die Optionen für die Ansicht nach Wort-Types (in der aktuellen Version ist der Schalter Optionen nur in der Ansicht nach Wort-Types erreichbar):

Hinweis: Bei der Betrachtung von Endungen ist es von Vorteil, die Option Sonderzeichen auf beachten zu setzen, sollen nicht die Sonderzeichen selber an den Wortenden zusammengefasst und sortiert werden.

COSMAS II, Zentrale DV-Dienste - 02. 02. 2016