[IDS-Logo] [COSMAS-II-Logo]
Seite drucken Thema drucken Sitemap Suche Impressum Datenschutz Kontakt

Fenster "Ergebnisse"

Die Ansicht nach Mehrwortspanne

Anmerkung: diese Ansicht hieß früher statistische KWIC-Auswertung.

In dieser Darstellungsform werden die Treffer nach ihrer Größe in Anzahl Wörter ausgewertet.

Die 3-spaltige Ergebnispräsentation, bei der jede Spalte auf- und absteigend sortiert werden kann, enthält die folgenden Daten:

Die Treffer werden also nach ihrer Größe sortiert und jeder Tabelleneintrag verweist auf das Sub-KWIC für alle Treffer der entsprechenden Größe.

Sinnvoll ist diese Auswertung erst bei Mehrwort-Treffern. Bei Suchanfragen, die nur Einzelwort-Treffer liefern, besteht die berechnete Tabelle aus 1 Eintrag, da 100% aller Treffer die Größe 1 besitzen.

Im weiteren werden drei Anwendungsbeispiele vorgestellt.

Beispiel 1: Auswertung eines Wortpaares

Eine KWIC-Auswertung der Suchanfrage Papst und Tod im selben Satz nach der Mehrwortspanne sieht wie folgt aus:

&Papst /+s0 &Tod

Ansicht nach Mehrwortspanne für &Papst /+s0 &Tod

Ansicht nach Mehrwortspanne für &Papst /+s0 &Tod
sortiert nach dem prozentuallen Anteil (gekürzte Darstellung)

Die resultierenden 346 Treffer verteilen sich auf 36 unterschiedliche Größen bzw. Abstände zwischen den beiden Wörtern. 8,67% der Treffer haben einen Abstand von 4 Wörtern (Größe 5 - 1) und weitere 8,67% einen Abstand von 6 Wörtern (Größe 7 - 1) voneinander. Der durchschnittliche Abstand zwischen den beiden Wörtern beträgt 11.72 Wörter (Größe 12,72 - 1).

Beispiel 2: Auswertung der Satzlänge eines virtuellen Korpus

Eine KWIC-Auswertung der Satzlänge eines virtuellen Korpus sieht wie folgt aus:

<s>

Sätze werden mit dem Kürzel <s> abfragt. Wir haben die Auswertung im vordefinierten virtuellen Korpus lit - Belletristik/Trivialliteratur durchgeführt.

Ansicht nach Mehrwortspanne für &Papst /+s0 &Tod

Ansicht nach der Spanne von Satzlängen im virt. Korpus lit
(gekürzte Darstellung)

Die Durchschnittslänge beträgt 17.04 Wörter (Größe des Satzes = Länge des Satzes). Sätze der Länge 5-7 kommen am häufigsten vor (mit je über 5%) und Sätze bestehend aus 1 Wort machen 2,18% aus. Darunter sind Überschriften miteingerechnet. Einige exotische Fälle zählen bis zu 2.648 Wörter.

Beispiel 3: Auswertung der Satzposition des ersten finiten Verbs eines Satzes

Mit der folgenden Suchanfrage läßt sich der Abstand des vordersten finiten Verbs vom Satzanfang bestimmen:

<sa> /+s0 #BEG( MORPH(V -PCP -INF) /+s0 <se> )

Die Suche nach dem vordersten finiten Verb wird ähnlich wie die Suche nach dem ersten Komma eines Satzes aufgebaut. Dabei steht MORPH(V -PCP -INF), das vom MORPH-Assistenten generiert wird, für das finite Verb im CONNEXOR-Tagset (es gibt keinen direkten Suchbegriff FIN für finite Verben im CONNEXOR-Tagset).

Das gefundene Verb wird mit dem Satzanfang <sa> kombiniert. Das resultierende KWIC besteht aus den Wortpaaren Satzanfang/vorderstes finites Verb. Die "Größe" des Wortpaares ist gleichzeitig der Abstand des finiten Verbs vom Satzanfang. Größe 1 bedeutet: Verb an Position 1; Größe 2: Verb an Position 2, etc..

Für die folgende Auswertung haben wir die finiten Verben mit Hilfe des CONNEXOR-Tagsets im Archiv TAGGED-C gesucht.

Satzposition des finiten Verbs

Bestimmung der Satzposition des vordersten finiten Verbs
in Archiv TAGGED-C (gekürzte Darstellung)

Die Durchschnittliche Satzposition des finiten Verbs in TAGGED-C beträgt somit 4,67.

COSMAS II, Zentrale DV-Dienste - 29. 01. 2015