Korpora der geschriebenen Sprache
Mannheimer Morgen (mmm)
Das Korpus beinhaltet eine außerordentlich große Menge von Zeitungsartikeln, die in elektronischer Form vom Verlagshaus der Tageszeitung Mannheimer Morgen bezogen wurde bzw. wird (ohne Anzeigenteil). Das gesamte Textmaterial wurde bzw. wird im IDS vollautomatisch aufbereitet. Das Korpus ist ein sog. Monitorkorpus, für das kennzeichnend ist, dass sich seine Zusammensetzung mit der Zeit ändert, und zwar in diesem Fall durch regelmäßiges Hinzufügen von Zeitungsartikeln jüngeren Datums.
Fehlende Jahrgänge und größere Abweichungen in der Anzahl der Texte und Wortformen von Jahrgang zu Jahrgang bis 1997 sind einerseits darin begründet, dass nur die Zeitungsartikel aufgenommen wurden, die zu Beginn der Datenübernahme per Modem (Anfang 1995) im Verlagshaus in vollautomatisch verarbeitbarer Datenform vorhanden waren. Andererseits verursachte die im Verlagshaus 1997 vorgenommene Umstellung der Computertechnik weitere Lücken im ansonsten großzügig auch für externe Nutzer zur Verfügung gestellten Bestand. Seit 1998 sind die Ausgaben des Mannheimer Morgens lückenlos in den Korpora enthalten.
Zu beachten ist, dass das im Quellennachweis eines Artikels enthaltene Datum das Datum der Zeitungsausgabe ist, für die der jeweilige Artikel vorgesehen war. Tatsächlich jedoch kann er in einer anderen Ausgabe, also zu einem anderem Datum, erschienen sein.
Jahrgang | Anzahl Artikel | Anzahl laufende Wortformen (ca.) |
M89 1989 | 45626 | 10.29 Mill. |
M91 1991 | 12755 | 2.78 Mill. |
M94 1994 | 12485 | 2.46 Mill. |
M95 1995 | 34946 | 6.42 Mill. |
M96 1996 | 19988 | 3.56 Mill. |
M97 1997 | 6633 | 1.64 Mill. |
M98 1998 | 78651 | 19.30 Mill. |
M99 1999 | 64885 | 14.36 Mill. |
M00 2000 | 68925 | 18.92 Mill. |
M01 2001 | 83980 | 23.49 Mill. |
M02 2002 | 86664 | 24.31 Mill. |
M03 2003 | 88052 | 25.35 Mill. |
M04 2004 | 94867 | 26.85 Mill. |
M05 2005 | 99351 | 27.14 Mill. |
M06 2006 | 92624 | 25.18 Mill. |
M07 2007 | 42516 | 12.14 Mill. |
mmm gesamt | 932948 | 244.20 Mill. |