ISO/DIN-Projekt "WG 6 PWI 24624 Language resource management – Transcription of spoken language"
Projektleiter: Dr. Thomas Schmidt
Im ISO/DIN-Projekt "WG 6 PWI 24624 Language resource management – Transcription of spoken language" hat der Programmbereich in Kooperation mit dem Programmbereich "Forschungsinfrastrukturen" einen Standard zur digitalen Repräsentation von Transkriptionen gesprochener Sprache erarbeitet.
Der Standard geht von den Richtlinien der Text Encoding Initiative aus, insbesondere von deren Kapitel 8 "Transcription of Speech". Er ordnet sich damit zum einen in einen größeren Zusammenhang von Standardisierungsbemühungen im Bereich der Digital Humanities ein. Zum anderen wird durch die Anbindung an das ISO committee TC37/SC4 "Language Resource Management" eine Verbindung zu anderen ISO/DIN-Standards im Bereich digitaler Sprachressourcen hergestellt.
Ziel des Standards ist die Herstellung einer Kompatibilität der betreffenden TEI-Richtlinien mit den relevanten De-Facto-Standards, die sich in den wissenschaftlichen Communities in Form von Tool-Formaten (z.B. EXMARaLDA, FOLKER, ELAN, Transcriber) und Transkriptionskonventionen (z.B. GAT, HIAT, CHAT) etabliert haben.
Eine Darstellung dazu findet sich bei:
- Schmidt, Thomas (2011): A TEI-based approach to standardising spoken language transcription. In: Journal of the Text Encoding Initiative, 1 (2011). http://jtei.revues.org/142
Kooperationspartner sind:
- Prof. Dr. Andreas Witt, Leiter der Abteilung Digitale Sprachwissenschaft
- Dr. Laurent Romary, Direktor des DARIAH-Projekts und Chairman des ISO committee TC37/SC4
- Das Konsortium 'Corpus Oraux et multimodaux (IRCOM)', das Standardisierungsbemühungen für mündliche Korpora im frankophonen Raum koordiniert
ISO-Veröffentlichung des Standards:
Am 15.08.2016 hat die International Standard Organisation (ISO) den Standard "ISO 24624:2016: Language resource management -- Transcription of spoken language" veröffentlicht.