Korpora der geschriebenen Sprache


Kooperationen des Projekts

Externe Kooperationen

Im Rahmen der EU-Projekts CLARIN und des vom BMBF und MWK-BW geförderten Projekts CLARIN-D arbeitet das Projekt Ausbau und Pflege von Korpora geschriebener Gegenwartssprache mit folgenden Partnern am Aufbau einer Forschungsinfrastruktur (FI) für die Sprachwissenschaft:


Schwerpunkte im Rahmen der Kooperation sind:

  • der Aufbau von dedizierten FI-Zentren und die Sicherung ihrer Nachhaltigkeit
  • Kanonisierung und Standardisierung von Formaten und Schnittstellen
  • Best-Practice-Richtlinien für den Umgang mit Ressourcen, die nicht frei von Rechten Dritter sind sowie entsprechende Lizenzmodelle
  • eine an der Maxime der Replizierbarkeit orientierte Ermöglichung der persistenten Identifizierbarkeit (und der Zitierbarkeit) von elektronischen Ressourcen - ein entsprechender ISO-Standardisierungsprozess wurde zusammen mit dem MPI Nijmegen und dem SfS der Uni Tübingen initiiert

Kooperation im IDS

  • Grundlegend im Hinblick auf generelle wissenschafstheoretische und methodische Maximen und um einen möglichst engen Zyklus von der Erstellung von Forschungsprimärdaten zu ihrer sprachwissenschaftlichen Auswertung zu gewährleisten, ist die enge Verzahnung mit dem Projekt Methoden der Korpusanalyse und -erschließung.
  • Das Projekt arbeitet außerdem eng mit der Arbeitsstelle Zentrale DV-Dienste und dem COSMAS II-Projekt zusammen:
    • Eric Seubert ist maßgeblich an der Entwicklung des TEI-basierten Textmodells des IDS beteiligt. Ausserdem entwickelt er Programme zur XML-Konvertierung und zur Qualitätssicherung von Korpora und betreut Hilfskräfte bei der Korrektur und Markierung der Ausgangstexte.
    • Peter Harders analysiert DV-Formate akquirierter Rohdaten und entwickelt Programme für ihre Konvertierung.
  • Insbesondere im Bereich der Klärung rechtlicher und ethischer Fragestellungen bei der Gewinnung, Verwertung und Bereitstellung linguistischer Daten kooperiert das Projekt eng mit dem Projekt Forschungs- und Lehrkorpus (FOLK) im Archiv für gesprochenes Deutsch der Abteilung Pragmatik.
  • Das Projekt berät außerdem das Projekt Historisches Textkorpus der Abteilung Lexik.
  • Doris al-Wadi berät (nach langjähriger Mitarbeit) das Projekt in Fragen des IDS-Textmodells, insbesondere der Korpustext-Bibliografie.

 

zum Überblick