Programmbereich Korpuslinguistik
Korpora der geschriebenen Sprache
| Mannheimer Morgen (mmm) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Das Korpus beinhaltet eine außerordentlich große Menge von
Zeitungsartikeln, die in elektronischer Form vom Verlagshaus der
Tageszeitung Mannheimer Morgen bezogen wurde bzw. wird (ohne
Anzeigenteil). Das gesamte Textmaterial wurde bzw. wird im IDS
vollautomatisch aufbereitet. Das Korpus ist ein sog. Monitorkorpus, für das
kennzeichnend ist, dass sich seine Zusammensetzung mit der Zeit ändert, und
zwar in diesem Fall durch regelmäßiges Hinzufügen von Zeitungsartikeln
jüngeren Datums.
Fehlende Jahrgänge und größere Abweichungen in der Anzahl der Texte und Wortformen von Jahrgang zu Jahrgang bis 1997 sind einerseits darin begründet, dass nur die Zeitungsartikel aufgenommen wurden, die zu Beginn der Datenübernahme per Modem (Anfang 1995) im Verlagshaus in vollautomatisch verarbeitbarer Datenform vorhanden waren. Andererseits verursachte die im Verlagshaus 1997 vorgenommene Umstellung der Computertechnik weitere Lücken im ansonsten großzügig auch für externe Nutzer zur Verfügung gestellten Bestand. Seit 1998 sind die Ausgaben des Mannheimer Morgens lückenlos in den Korpora enthalten. Zu beachten ist, dass das im Quellennachweis eines Artikels enthaltene Datum das Datum der Zeitungsausgabe ist, für die der jeweilige Artikel vorgesehen war. Tatsächlich jedoch kann er in einer anderen Ausgabe, also zu einem anderem Datum, erschienen sein. |
||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||
