[IDS-Logo] COSMAS II für Einsteiger - Druckversion

COSMAS II für Einsteiger

Übersicht

Die 8 W's rund um COSMAS II sollen Ihnen helfen, sich eine erste Vorstellung vom Sinn und Zweck eines Korpusrecherchesystems zu machen und den nachfolgenden Einstieg etwas zu erleichtern.

Eine stark vereinfachte Übersicht über eine COSMAS II-Sitzung:


Was ist COSMAS II?

Eine am IDS konzipierte Volltextdatenbank für das linguistisch motivierte Recherchieren in den Textsammlungen (= Korpora) des IDS.

COSMAS II steht für Corpus Search, Management and Analysis System und ist das Nachfolgesystem von COSMAS I (1991-2003) am IDS.

Suchanfragen werden u.a. gebildet aus

Ergebnisse können u.a.

Belege werden

Das stetig wachsende Deutsche Referenzkorpus (Umfang von ca. 3,2 Mrd. Wörtern), das COSMAS II zugänglich macht, umfasst Zeitungen, Sach-, Fach- sowie schöngeistige Literatur aus Deutschland, Österreich und der Schweiz von 1772 bis heute.

Was ist COSMAS II nicht?

COSMAS II ist keine Suchmaschine (wie z.B. Google, Yahoo! o.ä.),


Welche Anwender benutzen COSMAS II?

Ca. 80% der in COSMAS II ausgeführten Recherchen stammen von externen NutzerInnen.

Welche Projekte im IDS benutzen die COSMAS II-Applikationen?

Welche Projekte im IDS benutzen COSMAS II-Technologie?


Wozu braucht man (große) Textkorpora?

Vom Wort zur Vielfalt

Die Größe der IDS-Korpora erlaubt


Welche Fragen können mit COSMAS II beantwortet werden?

Mögliche Fragestellungen für Sprachinteressierte


Wo findet man die COSMAS II-Applikationen?

COSMAS II liegt in mehreren Varianten vor:

- COSMAS IIwin

[Icon C2-WIN]

Diese Version ist nur auf WINDOWS-Betriebssystemen oder -Emulationen lauffähig und muss einmalig installiert werden. Eine Anleitung zum Herunterladen und zur Installation ist auf der Installationsseite von COSMAS IIwin verfügbar.

Bei Problemen im Zusammenhang mit WINDOWS-Emulationen finden Sie im FAQ weitere Hinweise.

Informationen zu Aufruf und Anmeldung der Applikation erhalten Sie in der Online-Hilfe.

- COSMAS IIweb

[Icon C2-WIN]

COSMAS IIweb ist - unabhängig vom Betriebssystem - in jedem einigermaßen aktuellen Browser lauffähig, es muss nichts installiert werden. Die Applikation kann direkt über https://cosmas2.ids-mannheim.de/cosmas2-web/ gestartet werden.

Informationen zu Aufruf und Anmeldung der Applikation erhalten Sie in der Online-Hilfe.

- COSMAS IIscript

[Icon C2-WIN]

Diese Anwendung - auf SOLARIS-Betriebssystemen lauffähig - ist nur innerhalb des IDS und auf Anfrage verfügbar.


Wo findet man die Applikationen, die COSMAS II-Technologie benutzen?

Die Datenbank Gesprochenes Deutsch liegt in der Verantwortung des Archivs für Gesprochenes Deutsch (AGD) und ist von dort aus zu erreichen.
Für diese Anwendung gelten eigene Richtlinien, was Registrierung, Anmeldung etc. anbetrifft. Wenden Sie sich bei diesbezüglichen Fragen bitte direkt an das AGD.

Die COSMAS II-basierte Anwendung zur Recherche in Diskurstranskripten (DITRA) liegt ebenfalls in der Verantwortung des Archivs für Gesprochenes Deutsch. Sie ist nur innerhalb des IDS verfügbar.


Wie recherchiert man in COSMAS II?

Das nachfolgende Anwendungsbeispiel soll einen in erster Linie visuellen Eindruck der wichtigsten Funktionalitäten von COSMAS II vermitteln.
Eine stark vereinfachte Erläuterung der Funktionalitäten findet sich in der Quicktour.

Die im Recherchebeispiel durchgespielte Aufgabe besteht darin, alle Vorkommen des Ausdrucks roter Faden in den gebräuchlichen Flexionsformen zu ermitteln.

Die ausgewählten Bildschirmausschnitte sind einer Sitzung der Applikation COSMAS IIweb entnommen:

Recherchebeispiel - Suchanfrage

Die Suchanfrage lautet umschrieben:

"Suche alle Vorkommen des Ausdrucks roter Faden in allen Flexionsformen."

Übersetzt in die Suchanfragesprache:

"Alle Flexionsformen des Wortes rot gefolgt von allen Flexionsformen des Wortes Faden mit dem Wortabstand 1."

[Bildausschnitt]

Bildschirmausschnitt des Suchanfragefensters aus COSMAS IIweb

Recherchebeispiel - Wortformliste

Vor der eigentlichen Suche wird für beide Wörter eine Wortformliste mit allen gefundenen Flexionsformen aufgebaut. Unser Bild zeigt die Wortformliste (mit der Anzahl der Treffer) von Faden, bei der alle aufgelisteten Varianten (samt Frequenzen) in die anschließende Suche mit einbezogen werden.

[Bildausschnitt]

Bildschirmausschnitt der Wortformlistenanzeige aus COSMAS IIweb

Recherchebeispiel - Chronologische Sortierung

Nach erfolgreicher Suche wird die Trefferliste aufgebaut, die nach verschiedenen Kriterien sortiert werden kann. Der Bildschirmausschnitt zeigt eine Sortierung nach Jahrzehnten an.

Für die nachfolgende Beleg-Ansicht wird der Treffer aus dem Jahrzehnt 1800-1809 ausgewählt.

[Bildausschnitt]

Bildschirmausschnitt der Trefferanzeige aus COSMAS IIweb

Recherchebeispiel - Beleg-Ansicht

Der ausgewählte Treffer stammt aus den "Wahlverwandtschaften" von Goethe. In der Titelleiste des Treffers ist die Kurzzitierform eingeblendet.
Der angezeigte Vor- und Nachbereich bezüglich des Suchausdrucks beläuft sich hier auf vier Sätze.

[Bildausschnitt]

Bildschirmausschnitt der Volltextanzeige aus COSMAS IIweb

Recherchebeispiel - Kookkurrenzanalyse

Zu guter Letzt wird über alle Treffer noch eine Kookkurenzanalyse ausgeführt. Dabei wird das Umfeld der in der Suchanfrage spezifizierten Wörter durchsucht und statistisch aufbereitet. Auf diese Weise lassen sich weniger bekannte Wortverbindungen erkennen oder bekannte überprüfen.

Trefferlisten und Statistiken können zur Nachbereitung exportiert und somit auf dem lokalen Rechner verfügbar gemacht werden.

[Bildausschnitt]

Bildschirmausschnitt der Kookkurrenzanalyse aus COSMAS IIweb


Wann erscheinen neue Versionen der COSMAS II-Applikationen?

In der Regel wird für jede Applikation mindestens eine Version x.y pro Jahr freigegeben. Den jeweiligen Zeitpunkt können wir verständlicherweise selbst nur grob abschätzen.

Korrekturen oder kleinere Verbesserungen an den Applikationen - Versionen x.y.z - erscheinen in kürzeren Abständen.

Stichpunktartige Informationen über geplante oder in Arbeit befindliche Versionen finden Sie auf der Zeittafel. Dort sind auch alle bisher erschienenen Versionen der COSMAS II-Applikationen chronologisch aufgelistet.

Wird COSMAS II weiterentwickelt?

Diese Frage lässt sich eindeutig mit Ja beantworten.

In größeren Zeitabständen werden neue Funktionalitäten oder umfangreiche Erweiterungen in die Applikationen integriert und abschließend in Form von "Releases" oder Programmfreigaben veröffentlicht. Die Spannbreite an Neuerungen reicht dabei von zusätzlichen Sortierkriterien oder Trefferansichten bis hin zu neuen korpuslinguistischen Analyseverfahren.

Selbst in einem ausgereiften Recherchesystem, das bereits jahrelang in Betrieb ist, haben sich noch genügend Fehlerchen versteckt, die ausfindig gemacht werden müssen. Daher werden regelmäßig Fehlerkorrekturen und kleinere Verbesserungen eingebracht, die in sogenannte "Patches" oder Korrekturversionen münden.

Beispiel: Die Version 1.2.1 von COSMAS IIweb ist lediglich eine leicht korrigierte Fassung der offiziellen Freigabeversion 1.2.

Wie erfahre ich, ob neue Versionen verfügbar sind?

Seit Version 3.7 für COSMAS IIwin bzw. Version 1.3 für COSMAS IIweb erhalten die aktiven BenutzerInnen über einen Mailverteiler aktuelle Informationen zum Betrieb der Applikationen, so auch zu aktuellen Freigaben. Wenn Sie in diesen Verteiler aufgenommen werden möchten, können Sie dies im Menüpunkt OptionenCOSMAS II-Newsletter einstellen.

Unabhängig vom oben genannten Mailverteiler informiert Sie die WINDOWS-Benutzeroberfläche von COSMAS II bei Ihrer Anmeldung darüber, wenn neue Versionen verfügbar sind und ob deswegen eine aktualisierte Programmversion (oder "Upgrade") heruntergeladen werden muss.

[Icon C2-WIN]

Unabhängig vom oben genannten Mailverteiler informiert Sie die Benutzeroberfläche der WWW-Applikation beim Start über die aktuelle Version sowie über vorgenommene Korrekturen oder hinzugekommene Funktionalitäten.
Von Benutzerseite aus sind in dieser Hinsicht keine Maßnahmen erforderlich oder möglich.

[Icon C2-WIN]

Weshalb sind die COSMAS II-Applikationen oder -Datenbanken manchmal nicht erreichbar?

COSMAS II, Zentrale DV-Dienste - 23. 11. 2007