Langzeitarchivierung, Standards und Recht
Das Projekt integriert die am IDS entwickelten Lösungen für die Archivierung und Bereitstellung von Forschungsprimärdaten aus der germanistischen Linguistik in einer einheitlichen übergeordneten Struktur.
Es betreibt und betreut erstens ein Repositorium, über das mündliche Daten aus dem Archiv für Gesprochenes Deutsch (Programmbereich 5 Mündliche Korpora), schriftliche Daten aus dem Programmbereich 6 Korpuslinguistik sowie Wörterbuchdaten in einer gemeinsamen Oberfläche für Infrastrukturdienste verfügbar und persistent adressierbar gemacht werden.
Das Projekt erarbeitet zweitens mittelfristig die Basis für die Langzeitarchivierung der am IDS archivierten Ressourcen, indem es geeignete Prozesse und Verfahren zur Sicherung, Versionierung und Formatwandlung der Daten definiert und anwendet. Im Rahmen der Kooperation zwischen dem Leibniz-Zentrum Allgemeine Sprachwissenschaft (ZAS) und dem IDS werden die Langzeitarchivierungsstrategien der beiden Einrichtungen aufeinander abgestimmt.
Drittens wirkt das Projekt an der Entwicklung datentechnischer und dokumentatorischer Standards und Best-Practice-Richtlinien für die Arbeit mit sprachwissenschaftlichen Daten mit und stimmt die diesbezüglichen Arbeiten innerhalb des IDS zwischen den betreffenden Programmbereichen und extern mit Kooperationspartnern des IDS sowie mit relevanten Infrastrukturinitiativen und nationalen und internationalen Standardisierungsgremien (insb. in den Normierungsgremien DIN/ISO und TEI und im CLARIN Standards Committee) ab. All diese Arbeiten erfolgen in enger Anbindung an die Programmbereiche 5 bzw. 6, was sich auch in der Leitungsgruppe des Projektes widerspiegelt.
Mit einer zwischen dem Projekt und den Programmbereichen abgestimmten gemeinsamen Richtlinie, die Voraussetzungen, Zuständigkeiten und Prozesse für Übernahmen germanistischer Primärdaten klärt, wird das Angebot des IDS zur Archivierung für externe Datengeber dokumentiert.
Der Bereich Recht befasst sich mit den juristischen und ethischen Rahmenbedingungen beim Umgang mit digitalen Sprachressourcen. Er analysiert systematisch Fragen des Urheber- und Datenschutzes sowie weitere juristische Fragen, die sich bei Archivierung, Verarbeitung und Weitergabe der am IDS vorhandenen Ressourcen stellen und dokumentiert die betreffenden Analysen im Sinne einer Best Practice. Über diesen Bereich bringt das IDS außerdem die Interessen der geisteswissenschaftlichen Forschung auch in die nationale und europäische Diskussion neuer Gesetzgebungen ein.
Mitarbeiterinnen und Mitarbeiter:
- Prof. Dr. Andreas Witt (Leitung)
- Dr. Marc Kupietz (Leitung)
- Dr. Piotr Bański
- Dr. Peter Fankhauser