[IDS-Logo] [IDS-Logo]
Seite drucken Thema drucken Sitemap Suche Impressum Kontakt

Virtuelle Korpora

Allgemeines

Eine COSMAS II-Recherche wird immer in einem sogenannten aktiven Korpus durchgeführt. Das aktive Korpus wird dadurch bestimmt, dass man noch vor der Suche einen Eintrag aus der Liste der vordefinierten virtuellen Korpora wählt oder ein benutzerdefiniertes virtuelles Korpus lädt.

Ein virtuelles Korpus in COSMAS II ist ein beliebiger Ausschnitt aus einem einzigen Archiv (genauer: eine beliebige Auswahl aus den Dokumenten beliebiger Korpora eines einzigen Archivs). Das virtuelle Korpus legt also fest, welche Dokumente welches Archivs durchsucht werden sollen, wenn dieses virtuelle Korpus aktiviert wird. Das einfachste virtuelle Korpus enthält nur ein einziges Dokument, das maximale virtuelle Korpus umfasst alle Dokumente aller Korpora eines Archivs.

Virtuelle Korpora können

Vordefinierte virtuelle Korpora

COSMAS II stellt automatisch für jedes verfügbare Archiv mindestens ein vordefiniertes virtuelles Korpus bereit: dieses virtuelle Korpus umfasst das gesamte Archiv. Darüber hinaus werden vom COSMAS II-Administrator für jedes Archiv je nach Bedarf weitere virtuelle Korpora definiert.

Alle vordefinierten virtuellen Korpora der jeweils verfügbaren Archive werden (unter Berücksichtigung der Zugriffsrechte) in der COSMAS II-Korpusauswahlliste zur Aktivierung angeboten.

Zur Zeit sind in COSMAS II 313 virtuelle Korpora vordefiniert. Weitere virtuelle Korpora können jederzeit definiert werden.

Benutzerdefinierte virtuelle Korpora

Die BenutzerInnen können sich aber auch eigene virtuelle Korpora zusammenstellen, indem sie eine beliebige Auswahl aus den im jeweiligen Archiv befindlichen Dokumenten treffen. Die Möglichkeiten zur Erstellung solcher Korpora stehen allen COSMAS II-BenutzerInnen zur Verfügung.

Die resultierenden Korpora können als benutzerdefinierte virtuelle Korpora gespeichert, geladen und durchsucht werden.

Übersicht über die aktuellen virtuellen Korpora

Der aktuelle Stand der Organisation der virtuellen Korpora unter COSMAS II ist in der folgenden Übersicht dokumentiert.
Die Korpusgröße ist in Millionen von laufenden Wortformen angegeben.

Virtuelle Korpora im Archiv W der geschriebenen Korpora

Virtuelles Korpus Zusammensetzung Bezeichnung Größe Zugang
N-gesamt brz-N bvz-N dpa-N haz-N hmp-N mm-N non-N nun-N nuz-N rhp-N rhz-N sgt-N soz-N spk-N vdi-N taz-N zeit-N alle Neuakquisitionen 245,50 n. öffentl.
N-öffentlich brz-N bvz-N haz-N hmp-N mm-N non-N nun-N nuz-N rhz-N sgt-N soz-N spk-N vdi-N alle öffentlichen Neuakquisitionen 178,20 öffentl.
W-gesamt N-gesamt W-ohneN alle Korpora des Archivs W 3998,25 n. öffentl.
W-ohneN bmp bvz-ohneN brz-ohneN bzk bzt cz dkg dpa-ohneN dpr faz frr fsp gri goe haz-ohneN hbk hmp-ohneN iko lim klz lit mk mld mm-ohneN nkz non nun-ohneN nuz-ohneN oon rei rhp-ohneN rhz-ohneN sbn sgt-ohneN soz-ohneN spiegel spk-ohneN taz-ohneN thm ttz van vdi-ohneN wkb wkd wkv wpd zeit-ohneN zta alle Korpora des Archivs W (ohne Neuakquisitionen) 3752,75 n. öffentl.
W-ohneN-öffentlich bmp bvz-ohneN brz-ohneN bzk cz dpr fsp-pub frr goe gri haz-ohneN hbk hmp-ohneN klz lim lit-pub mk mld mm-ohneN nkz non nun-ohneN nuz-ohneN oon rei rhz-ohneN sbn sgt-ohneN soz-ohneN spk-ohneN ttz van vdi-ohneN wkb wkd wpd zta alle öffentlichen Korpora des Archivs W (ohne Neuakquisitionen) 2688,50 öffentl.
W-öffentlich N-öffentlich W-ohneN-öffentlich alle öffentlichen Korpora des Archivs W 2866,70 öffentl.
bih  -- Herausgebertexte zum Korpus bio 0,28 n. öffentl.
bio bio-npub bio-pub Biografische Literatur 2,02 n. öff. / öff.
bmp  -- Berliner Morgenpost, Oktober 1997, Mai - Dezember 1998, Januar - Dezember 1999 22,25 öffentl.
brz brz-ohneN brz-N Braunschweiger Zeitung, September 2005 - Dezember 2011 164,93 öffentl.
bvz bvz-ohneN bvz-N Burgenländische Volkszeitung, Januar 2007 - Juli 2011 25,18 öffentl.
bzk  -- Bonner Zeitungskorpus 3,05 öffentl.
bzt  -- Berliner Zeitung, August 1997 - September 2008 206,02 n. öffentl.
cz  -- Computer Zeitung, Januar 1993 - Dezember 1998 8,02 öffentl.
div div-npub div-pub Belletristik des 20. und 21. Jahrhunderts: Diverse Schriftsteller 3,35 n. öff. / öff.
dkg  -- Fachsprachen-Korpus 2: Gentechnologie 0,91 n. öffentl.
dpa dpa-ohneN dpa-N Meldungen der Deutschen Presse-Agentur, Januar 2006 - Dezember 2009, April 2010 - Dezember 2011 226,80 n. öffentl.
dpr  -- Die Presse, September 1991 - Dezember 2000 109,59 öffentl.
faz  -- Frankfurter Allgemeine, 1993, 1995 und 1997 - 2005 (ungerade Jahrgänge und Monate) 139,99 n. öffentl.
frr  -- Frankfurter Rundschau, Januar 1997 - Dezember 1999 105,73 öffentl.
fsp fsp-npub fsp-pub Fachsprachen-Korpus 1 0,96 n. öff. / öff.
goe  -- Goethes Werke 1,41 öffentl.
gr1  -- Grammatik-Korpus 0,22 öffentl.
gri  -- Brüder Grimm: Sagen, Kinder- und Hausmärchen, Kinderlegenden 0,43 öffentl.
haz haz-ohneN haz-N Hannoversche Allgemeine, August 2007 - Dezember 2011 39,91 öffentl.
hbk  -- Handbuch-Korpora, 1985 - 1988 10,83 öffentl.
hes  -- Belletristik des 20. Jahrhunderts: Stefan Heym 0,34 n. öffentl.
hmp hmp-ohneN hmp-N Hamburger Morgenpost, April 2005 - Dezember 2011 46,66 öffentl.
iko  -- Interviewkorpus 0,71 n. öffentl.
klz  -- Kleine Zeitung, August 1996 - Dezember 2000 66,18 öffentl.
les  -- Belletristik des 20. Jahrhunderts: Siegfried Lenz 1,98 n. öffentl.
lim  -- LIMAS-Korpus 1,06 öffentl.
lit lit-npub lit-pub Belletristik/Trivialliteratur 12,72 n. öff. / öff.
loz loz-npub loz-pub Belletristik des 20. und 21. Jahrhunderts 6,34 n. öff. / öff.
mk mk1 mk2 Mannheimer Korpora 1+2 2,54 öffentl.
mk1  -- Mannheimer Korpus 1 2,20 öffentl.
mk2  -- Mannheimer Korpus 2 0,34 öffentl.
mld  -- Korpus Magazin Lufthansa Bordbuch/deutsch 0,23 öffentl.
mm mm-ohneN mm-N Mannheimer Morgen, Januar 1995 - Dezember 2011 (die Jahrgänge 1995, 1997 und 2000 sind unvollständig) 308,15 öffentl.
ndR ndR-npub ndR-pub Korpora mit überwiegend neuer Rechtschreibung 789,65 n. öff. / öff.
nkz  -- Neue Kronen-Zeitung, Januar 1994 - Mai 2000 74,91 öffentl.
non  -- Niederösterreichische Nachrichten, Januar 2007 - Dezember 2010 124,00 öffentl.
nun nun-ohneN nun-N Nürnberger Nachrichten, Januar 1990 - Dezember 2011 195,77 öffentl.
nuz nuz-ohneN nuz-N Nürnberger Zeitung, Juni 2002 - Dezember 2011 95,40 öffentl.
oon  -- Oberösterreichische Nachrichten, Januar 1996 - Dezember 1997 14,33 öffentl.
ozk dpr klz nkz oon sbn ttz van Österreichisches Zeitungskorpus, 1991 - 2000 469,36 öffentl.
rei  -- Reden und Interviews, Januar 2002 - Dezember 2006 1,88 öffentl.
rhp rhp-ohneN rhp-N Rheinpfalz, August 2007 - Dezember 2011 51,94 n. öffentl.
rhz rhz-ohneN rhz-N Rhein-Zeitung, Januar 1996 - Dezember 2011 769,75 öffentl.
sbn  -- Salzburger Nachrichten, Juni 1991 - Dezember 2000 112,26 öffentl.
sgt sgt-ohneN sgt-N St. Galler Tagblatt, April 1997 - Dezember 2001, August 2007 - Dezember 2011 223,14 öffentl.
soz soz-ohneN soz-N Die Südostschweiz, März 2005 - Dezember 2011 108,48 öffentl.
spiegel  -- Der Spiegel, Heft 1/93 - Heft 52/94 8,13 n. öffentl.
spk spk-ohneN spk-N spektrumdirekt, Januar 1997 - September 2011 12,55 öffentl.
taz taz-ohneN taz-N die tageszeitung, September 1986 - März 2011 382,78 n. öffentl.
thm  -- Thomas-Mann-Korpus 3,41 n. öffentl.
ttz  -- Tiroler Tageszeitung, Januar 1996 - Dezember 2000 51,94 öffentl.
van  -- Vorarlberger Nachrichten, Januar 1997 - Dezember 2000 40,15 öffentl.
vdi vdi-ohneN vdi-N VDI Nachrichten, Februar 2006 - Dezember 2011 10,88 öffentl.
wam  -- Belletristik des 20. Jahrhunderts: Martin Walser 0,66 öffentl.
wk wkb wkd Wendekorpora West+Ost 3,24 öffentl.
wkb  -- Wendekorpus/West 1,75 öffentl.
wkd  -- Wendekorpus/Ost 1,48 öffentl.
wkv  -- Wendekorpus/Vereinigung 0,12 n. öffentl.
wpd  -- Wikipedia 52,17 öffentl.
zeit zeit-ohneN zeit-N Die Zeit, Dezember 1994 - Dezember 2011 102,31 n. öffentl.
zta  -- Zürcher Tagesanzeiger, Januar 1996 - April 2000 59,79 öffentl.

Virtuelle Korpora im Archiv TAGGED-C

Virtuelles Korpus Zusammensetzung Bezeichnung Größe Zugang
TAGGED-C-gesamt bih bio brz bvz bzt dpa haz hmp mm non nun nuz oon rei rhp rhz sgt soz spiegel spk taz thm van vdi wpd zeit alle Korpora des Archivs TAGGED-C 1505,82 n. öffentl.
TAGGED-C-öffentlich bio brz bvz haz hmp mm non nun nuz oon rei rhz sgt soz spk van vdi wpd alle öffentlichen Korpora des Archivs TAGGED-C 1024,79 öffentl.
bih  -- Herausgebertexte zum Korpus bio 0,29 n. öffentl.
bio  -- Biografische Literatur 1,90 öffentl.
brz  -- Braunschweiger Zeitung, September 2005 - Dezember 2009 116,72 öffentl.
bvz  -- Burgenländische Volkszeitung, Januar 2007 - Dezember 2009 18,45 öffentl.
bzt  -- Berliner Zeitung, August 1997 - September 2008 188,20 n. öffentl.
dpa  -- Meldungen der Deutschen Presse-Agentur, Januar 2006 - Dezember 2009 157,13 n. öffentl.
haz  -- Hannoversche Allgemeine, August 2007 - Dezember 2009 35,08 öffentl.
hmp  -- Hamburger Morgenpost, Januar 2006 - Dezember 2009 28,78 öffentl.
mm  -- Mannheimer Morgen, Januar 2006 - Dezember 2009 84,95 öffentl.
non  -- Niederösterreichische Nachrichten, Januar 2007 - Dezember 2009 96,24 öffentl.
nun  -- Nürnberger Nachrichten, Januar 2006 - Dezember 2009 47,06 öffentl.
nuz  -- Nürnberger Zeitung, Januar 2006 - Dezember 2009 43,08 öffentl.
oon  -- Oberösterreichische Nachrichten, 1999 9,00 öffentl.
rei  -- Reden und Interviews, Januar 2002 - Dezember 2006 1,94 öffentl.
rhp  -- Rheinpfalz, August 2007 - Dezember 2009 27,19 n. öffentl.
rhz  -- Rhein-Zeitung, Januar 2006 - Dezember 2009 225,61 öffentl.
sgt  -- St. Galler Tagblatt, April 1997 - Dezember 2001, August 2007 - Dezember 2009 170,42 öffentl.
soz  -- Die Südostschweiz, Januar 2006 - Dezember 2009 68,22 öffentl.
spiegel  -- Der Spiegel, 1994 4,12 n. öffentl.
spk  -- spektrumdirekt, Januar 1997 - Dezember 2009 5,63 öffentl.
taz  -- die tageszeitung, Januar 2006 - März 2009 68,91 n. öffentl.
thm  -- Thomas-Mann-Korpus 3,47 n. öffentl.
van  -- Vorarlberger Nachrichten, 1999 10,26 öffentl.
vdi  -- VDI Nachrichten, Februar 2006 - Dezember 2009 7,42 öffentl.
wpd  -- Wikipedia 54,04 öffentl.
zeit  -- Die Zeit, Januar 2006 - Dezember 2009 31,71 n. öffentl.

Virtuelle Korpora im Archiv TAGGED-T

Virtuelles Korpus Zusammensetzung Bezeichnung Größe Zugang
TAGGED-T-gesamt bih bio brz bvz bzt dpa haz hmp mm non nun nuz oon rei rhp rhz sgt soz spiegel spk taz thm van vdi wpd zeit alle Korpora des Archivs TAGGED-T 1500,64 n. öffentl.
TAGGED-T-öffentlich brz bvz haz hmp mm non nun nuz oon rei rhz sgt soz spk van vdi wpd alle öffentlichen Korpora des Archivs TAGGED-T 1020,17 öffentl.
bih  -- Herausgebertexte zum Korpus bio 0,29 n. öffentl.
bio  -- Biografische Literatur 1,90 n. öffentl.
brz  -- Braunschweiger Zeitung, September 2005 - Dezember 2009 116,04 öffentl.
bvz  -- Burgenländische Volkszeitung, Januar 2007 - Dezember 2009 18,42 öffentl.
bzt  -- Berliner Zeitung, August 1997 - September 2008 187,30 n. öffentl.
dpa  -- Meldungen der Deutschen Presse-Agentur, Januar 2006 - Dezember 2009 156,18 n. öffentl.
haz  -- Hannoversche Allgemeine, August 2007 - Dezember 2009 35,00 öffentl.
hmp  -- Hamburger Morgenpost, Januar 2006 - Dezember 2009 28,68 öffentl.
mm  -- Mannheimer Morgen, Januar 2006 - Dezember 2009 85,13 öffentl.
non  -- Niederösterreichische Nachrichten, Januar 2007 - Dezember 2009 96,01 öffentl.
nun  -- Nürnberger Nachrichten, Januar 2006 - Dezember 2009 45,53 öffentl.
nuz  -- Nürnberger Zeitung, Januar 2006 - Dezember 2009 42,83 öffentl.
oon  -- Oberösterreichische Nachrichten, 1999 8,96 öffentl.
rei  -- Reden und Interviews, Januar 2002 - Dezember 2006 1,93 öffentl.
rhp  -- Rheinpfalz, August 2007 - Dezember 2009 27,03 n. öffentl.
rhz  -- Rhein-Zeitung, Januar 2006 - Dezember 2009 224,97 öffentl.
sgt  -- St. Galler Tagblatt, April 1997 - Dezember 2001, August 2007 - Dezember 2009 171,00 öffentl.
soz  -- Die Südostschweiz, Januar 2006 - Dezember 2009 67,97 öffentl.
spiegel  -- Der Spiegel, 1994 4,11 n. öffentl.
spk  -- spektrumdirekt, Januar 1997 - Dezember 2009 6,03 öffentl.
taz  -- die tageszeitung, Januar 2006 - März 2009 68,57 n. öffentl.
thm  -- Thomas-Mann-Korpus 3,47 n. öffentl.
van  -- Vorarlberger Nachrichten, 1999 10,22 öffentl.
vdi  -- VDI Nachrichten, Februar 2006 - Dezember 2009 7,37 öffentl.
wpd  -- Wikipedia 54,09 öffentl.
zeit  -- Die Zeit, Januar 2006 - Dezember 2009 31,62 n. öffentl.

Virtuelle Korpora im Archiv HIST der historischen Korpora

Virtuelles Korpus Zusammensetzung Bezeichnung Größe Zugang
HIST-gesamt dgb goe gri hik marx alle historischen Korpora des Archivs HIST 65,39 n. öffentl.
HIST-öffentlich goe gri marx alle öffentlichen Korpora des Archivs HIST 4,33 öffentl.
dgb dgb01 dgb02 dgb45 Historisches Korpus/Digitale Bibliothek 57,67 n. öffentl.
dgb01  -- Historisches Korpus/Digitale Bibliothek: Deutsche Literatur von Lessing bis Kafka 30,37 n. öffentl.
dgb02  -- Historisches Korpus/Digitale Bibliothek: Philosophie von Platon bis Nietzsche 12,91 n. öffentl.
dgb45  -- Historisches Korpus/Digitale Bibliothek: Deutsche Literatur von Frauen 14,40 n. öffentl.
goe  -- Goethes Werke 1,41 öffentl.
gri  -- Brüder Grimm: Sagen, Kinder- und Hausmärchen, Kinderlegenden 0,43 öffentl.
hik  -- Historisches Korpus/Querschnittskorpora 3,38 n. öffentl.
marx meg mew mwa Marx-Engels-Korpora 2,49 öffentl.
meg  -- Korpus Marx-Engels-Gesamtausgabe (ausgewählte Texte) 1,49 öffentl.
mew  -- Korpus Marx-Engels-Werke (ausgewählte Texte) 0,83 öffentl.
mwa  -- Herausgeber-Anmerkungstexte zu mew 0,17 öffentl.

Virtuelle Korpora im Archiv UMB des Projekts "Sprachliche Umbrüche des 20. Jahrhunderts"

Virtuelles Korpus Zusammensetzung Bezeichnung Größe Zugang
UMB-gesamt umb45 umb68 alle Korpora des Archivs UMB 2,35 n. öffentl.
umb45  -- Schulddiskurs 1945-1955 1,74 n. öffentl.
umb68  -- Protestdiskurs 1967/68 0,61 n. öffentl.

Virtuelle Korpora im Archiv TAGGED-M

Virtuelles Korpus Zusammensetzung Bezeichnung Größe Zugang
TAGGED-M-gesamt lim-TAGGED mm-TAGGED spiegel-tagged alle Korpora des Archivs TAGGED-M 28,92 n. öffentl.
TAGGED-M-öffentlich lim-TAGGED mm-TAGGED alle öffentl. Korpora des Archivs TAGGED-M 19,74 öffentl.
lim-TAGGED  -- LIMAS-Korpus (morphosyntaktisch annotiert) 1,22 öffentl.
mm-TAGGED  -- Mannheimer Morgen, 1991 und 1994 - 1996 (morphosyntaktisch annotiert) 18,52 öffentl.
spiegel-TAGGED  -- Der Spiegel, Heft 1/93 - Heft 52/94 (morphosyntaktisch annotiert) 9,18 n. öffentl.

Virtuelle Korpora im Archiv GFDS, Korpus-Kartei der Gesellschaft für deutsche Sprache, Wiesbaden (GfdS)

Virtuelles Korpus Zusammensetzung Bezeichnung Größe Zugang
GFDS-gesamt gfds alle Korpora des Archivs GFDS 0,34 n. öffentl.
GFDS-öffentlich gfds alle öffentlichen Korpora des Archivs GFDS 0,34 öffentl.
gfds  -- Kartei der Gesellschaft für deutsche Sprache 0,34 öffentl.

Virtuelle Korpora im Archiv WK-PH der phasengegliederten Wendekorpora

Virtuelles Korpus Zusammensetzung Bezeichnung Größe Zugang
WK-PH-gesamt wkb-ph wkd-ph alle Wendekorpora West+Ost des Archivs WK-PH, phasengegliedert 3,23 n. öffentl.
WK-PH-öffentlich wkb-ph wkd-ph alle öffentlichen Wendekorpora West+Ost des Archivs WK-PH, phasengegliedert 3,23 öffentl.
wkb-ph  -- Wendekorpus/West, phasengegliedert 1,76 öffentl.
wkd-ph  -- Wendekorpus/Ost, phasengegliedert 1,47 öffentl.

Virtuelle Korpora im Archiv W-ÜBRIG der aussortierten geschriebenen Korpora

Die Korpora in diesem Archiv wurden wegen Mängel aus ihrem angestammten Archiv W (Archiv der geschriebenen Korpora) aussortiert. Sie stehen den Benützern von COSMAS II hier nach wie vor für Recherchen oder zum Überprüfen von älteren Recherchen zur Verfügung.

Virtuelles Korpus Zusammensetzung Bezeichnung Größe Zugang
W-ÜBRIG-gesamt mm oon alle Korpora des Archivs W-ÜBRIG 41,78 n. öffentl.
W-ÜBRIG-öffentlich mm oon alle öffentlichen Korpora des Archivs W-ÜBRIG 41,78 öffentl.
mm  -- Mannheimer Morgen, 1989, 1991, 1994 (Die Jahrgänge 1991 und 1994 sind unvollständig) 15,05 öffentl.
oon  -- Oberösterreichische Nachrichten, 1998 - 2000 26,73 öffentl.

Virtuelle Korpora im Archiv SZ der Süddeutschen Zeitung

Die Süddeutsche Zeitung wird ab Sep. 2007 wieder über COSMAS II angeboten, befindet sich nun aber in einem gesonderten Archiv, auf welches die folgenden Zugriffsbeschränkungen gelten: nur IDS-intern und nur eine Benutzersitzung gleichzeitig.

Virtuelles Korpus Zusammensetzung Bezeichnung Größe Zugang
SZ-gesamt sz alle Korpora des Archivs SZ 155,68 n. öffentl.
sz  -- Süddeutsche Zeitung, Januar 1995 - Dezember 1999 155,68 n. öffentl.

COSMAS II, Zentrale DV-Dienste - 23.03.2012