Dr. Thomas Schmidt
Leibniz-Institut für Deutsche Sprache
R 5, 6-13
D-68161 Mannheim
E-Mail: thomas(at)linguisticbits.de
Wissenschaftlicher Mitarbeiter im Programmbereich "Mündliche Korpora" der Abteilung "Pragmatik" (2012-2021)
- Leitung der Projekte "QUEST: Quality - Established: Erprobung und Anwendung von Kurationskriterien und Qualitätsstandards für audiovisuelle, annotierte Sprachdaten" und "Zugang zu multimodalen Korpora gesprochener Sprache: Vernetzung und zielgruppenspezifische Ausdifferenzierung (ZuMult)"
- Leitung der Projekte "Archiv für Gesprochenes Deutsch (AGD)" und "Korpustechnologie für Mündliche Korpora" (von 2012 bis 2021)
- Leitung des Projekts "Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK)" (von 2012 bis 2019)
- Leitung des Projektes "SegCor - Segmentation of Oral Corpora" (Projektlaufzeit: 2016-2020)
- Mitarbeit im Projekt "Lexik des Gesprochenen Deutsch" (Projektlaufzeit: 2015-2019)
Zur Person:
- 1992 - 1998: Studium Allgemeine Sprachwissenschaften / Anglistik / Romanistik sowie Mathematik / Informatik an den Universitäten Kaiserslautern und Mainz
- 1996 - 1997: Studium Computational Linguistics / Artificial Intelligence an der University of Edinburgh
- 1998 - 1999: Language Resource Engineer bei Philips Speech Processing Aachen
- 1999 - 2000: Studium "European Master of Linguistics" an der FU Berlin und der Université Paris VIII
- 2000 - 2011: Wissenschaftlicher Mitarbeiter / Projektleiter im Projekt „Computergestützte Erfassungs- und Analysemethoden multilingualer Daten” am SFB 538 Mehrsprachigkeit, Universität Hamburg
- 2004 Promotion an der Universität Dortmund zum Thema "Computergestützte Transkription - Modellierung und Visualisierung gesprochener Sprache mit texttechnologischen Mitteln"
- 2005 - 2006: DAAD-Postdoc-Stipendiat am International Computer Science Institute, Berkeley
- 2007 - 2008: Wissenschaftlicher Mitarbeiter im Digitalen Wörterbuch der Deutschen Sprache, Berlin-Brandenburgische Akademie der Wissenschaften
- 2012 - 2021: wiss. Angestellter am IDS
- September 2021 bis August 2022: Aufbau und Leitung von "Research and Infrastructure Support (RISE)" an der Universität Basel
Entwickler des EXMARaLDA-Systems und von FOLKER, Autor des Kicktionary, Gründungsgeschäftsführer des Hamburger Zentrums für Sprachkorpora, Mitglied im wissenschaftlichen Netzwerk "Internetlexikographie"
Mündliche Korpora, Korpuslinguistik, Texttechnologie, Computerlexikographie
Aktuelle Publikationen:
- Batinić, Josip/Frick, Elena/Schmidt, Thomas (2021): Accessing spoken language corpora: an overview of current approaches. In: Corpora 16 (3). Edinburgh: Edinburgh University Press, S. 417–445.
- Zimmer, Christian/Wiese, Heike/Simon, Horst J./Zappen-Thomson, Marianne/Bracke, Yannic/Stuhl, Britta/Schmidt, Thomas (2020): Das Korpus Deutsch in Namibia (DNam): Eine Ressource für die Kontakt-, Variations- und Soziolinguistik. In: Deutsche Sprache 3/20. Berlin: Schmidt, S. 210-232
- Schnabel, Eva-Luisa/Wahl, Hans-Werner/Streib, Christina/Schmidt, Thomas (2020): Elderspeak in Acute Hospitals? The Role of Context, Cognitive and Functional Impairment. In: Research on Aging.
- Schmidt, Thomas (2019): Das Berliner Wendekorpus am Archiv für Gesprochenes Deutsch. In: Dittmar, Norbert/Paul, Christine (Hrsg.): Sprechen im Umbruch. Zeitzeugen erzählen und argumentieren rund um den Fall der Mauer im Wendekorpus. Mannheim: Leibniz-Institut für Deutsche Sprache, S. 23-27.
- Kupietz, Marc/Schmidt, Thomas (Hrsg.) (2018): Korpuslinguistik. (=Germanistische Sprachwissenschaft um 2020, Bd. 5). Berlin/Boston: de Gruyter. PDF
- Kupietz, Marc/Schmidt, Thomas (2018): Einleitung. In: Kupietz, Marc/Schmidt, Thomas (Hrsg.) (2018): Korpuslinguistik. (=Germanistische Sprachwissenschaft um 2020, Bd. 5). Berlin/Boston: de Gruyter, S. 1-3. PDF
- Schmidt, Thomas (2018): Gesprächskorpora. In: Kupietz, Marc/Schmidt, Thomas (Hrsg.) (2018): Korpuslinguistik. (=Germanistische Sprachwissenschaft um 2020, Bd. 5). Berlin/Boston: de Gruyter, S. 209-230. PDF
- Batinić, Dolores / Schmidt, Thomas (2018): Reconstruction of separable particle verbs in a corpus of spoken German. In: Rehm, Georg / Declerck, Thierry (Hg.): Language technologies for the challenges of the digital age. 27th International Conference, GSCL 2017 Berlin, Germany, September 13–14, 2017. Proceedings. Cham, Switzerland: Springer, 2018. S. 3-10. PDFSchmidt, Thomas (2017): DGD – Die Datenbank für Gesprochenes Deutsch. Mündliche Korpora am Institut für Deutsche Sprache (IDS) in Mannheim. In: Zeitschrift für Germanistische Linguistik 45(3), S. 451-463. PDF
- Cassidy, Steve / Schmidt, Thomas (2017): Tools for Multimodal Annotation. In: Ide, Nancy / Pustejovsky, James (eds.): Handbook of Linguistic Annotation. Springer, Dordrecht, S. 209-227.
- Schmidt, Thomas (2017): Construction and Dissemination of a Corpus of Spoken Interaction – Tools and Workflows in the FOLK project. In: Corpus Linguistic Software Tools, Journal for Language Technology and Computational Linguistics (JLCL 31/1), by Kupietz, Marc & Geyken, Alexander (Hrsg.), S. 127-154. PDF
- Schmidt, Thomas / Hedeland, Hanna / Jettka, Daniel (2017): Conversion and Annotation Web Services for Spoken Language Data in CLARIN. In: Selected papers from the CLARIN Annual Conference 2016, Aix-en-Provence, 26–28 October 2016, CLARIN Common Language Resources and Technology Infrastructure, Borin, Lars (Hg.), Linköping Electronic Conference Proceedings, S. 113-130. PDF
- Schütte, Wilfried / Schmidt, Thomas (2017): Niederdeutsche Aufnahmen aus dem Korpus "Deutsche Mundarten" – Sprachliche und kulturhistorische Aspekte. In: Sprachreport 1/2017, S. 8-19. PDF
- Schmidt, Thomas (2016): Good practices in the compilation of FOLK, the Research and Teaching Corpus of Spoken German. In: Compilation, transcription, markup and annotation of spoken corpora, by Kirk, John M. and Gisle Andersen (eds.), Special Issue of the International Journal of Corpus Linguistics [IJCL 21:3], S. 396-418.
- Westpfahl, Swantje / Schmidt, Thomas (2016): FOLK-Gold – A GOLD standard for Part-of-Speech-Tagging of Spoken German. In: Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC’16), Portorož, Slovenia. Paris: European Language Resources Association (ELRA), S. 1493-1499. PDF
- Fandrych, Christian / Frick, Elena / Hedeland, Hanna / Iliash, Anna / Jettka, Daniel / Meißner, Cordula / Schmidt, Thomas / Wallner, Franziska / Weigert, Kathrin / Westpfahl, Swantje (2016): User, who art thou? User Profiling for Oral Corpus Platforms. In: Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC’16), Portorož, Slovenia. Paris: European Language Resources Association (ELRA), S. 280-287. PDF
- Reimer, Eva / Trevisan, Bianka / Eraßme, Denise / Schmidt, Thomas / Jakobs, Eva-Maria (2015): Annotating Modality Interdependencies. In: Proceedings of the Int. Conference of the German Society for Computational Linguistics and Language Technology, University of Duisburg-Essen, Germany, Sep 30–Oct 2 2015, S. 110-11. PDF
- Herzog, Gottfried / Heid, Ulrich / Trippel, Thorsten / Bański, Piotr / Romary, Laurent / Schmidt, Thomas / Witt, Andreas / Eckart, Kerstin (2015): Recent Initiatives towards New Standards for Language Resources. In: Proceedings of the Int. Conference of the German Society for Computational Linguistics and Language Technology, University of Duisburg-Essen, Germany, Sep 30–Oct 2 2015, S. 154–156. PDF
- Kupietz, Marc / Schmidt, Thomas (2015): Schriftliche und mündliche Korpora am IDS als Grundlage für die empirische Forschung. In: Eichinger, Ludwig M. (Hrsg.): Sprachwissenschaft im Fokus. Positionsbestimmungen und Perspektiven. S. 297-322 - Berlin/Boston: de Gruyter, 2015. (Jahrbuch des Instituts für Deutsche Sprache 2014).
- Ruhi, Şükriye / Haugh, Michael / Schmidt, Thomas / Wörner, Kai (Hrsg.) (2014): Best Practices for Spoken Corpora in Linguistic Research. Newcastle: Cambridge Scholars Publishing.
- Schmidt, Thomas (2014): Gesprächskorpora und Gesprächsdatenbanken am Beispiel von FOLK und DGD. In: Gesprächsforschung - Online-Zeitschrift zur verbalen Interaktion 15, S. 196-233. PDF
- Schmidt, Thomas / Wörner, Kai (2014): EXMARaLDA. In: Jacques Durand, Ulrike Gut, and Gjert Kristoffersen (eds.): The Oxford Handbook of Corpus Phonology. Oxford: OUP 2014, S. 402-419.
- Schmidt, Thomas (2014): The Database for Spoken German – DGD2. In: Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC’14), Reykjavik, Iceland: European Language Resources Association (ELRA). PDF
- Schmidt, Thomas (2014): The Research and Teaching Corpus of Spoken German – FOLK. In: Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC’14), Reykjavik, Iceland: European Language Resources Association (ELRA). PDF
- Deppermann, Arnulf / Schmidt, Thomas (2014): Gesprächsdatenbanken als methodisches Instrument der Interaktionalen Linguistik - Eine exemplarische Untersuchung auf Basis des Korpus FOLK in der Datenbank für Gesprochenes Deutsch (DGD2). In: Domke, Christine & Gansel, Christa (Hrsg.): Korpora in der Linguistik - Perspektiven und Positionen zu Daten und Datenerhebung [= Mitteilungen des Deutschen Germanistenverbandes 1/2014], S. 4-17. PDF
- Stift, Ulf-Michael / Schmidt, Thomas (2014): Mündliche Korpora am IDS: Vom Deutschen Spracharchiv zur Datenbank für Gesprochenes Deutsch. In: Institut für Deutsche Sprache (Hrsg.): Ansichten und Einsichten. 50 Jahre Institut für Deutsche Sprache. Redaktion: Melanie Steinle, Franz Josef Berens. S. 360-375 - Mannheim: Institut für Deutsche Sprache, 2014.
- Westpfahl, Swantje / Schmidt, Thomas (2013): POS für(s) FOLK – Part of Speech Tagging des Forschungs- und Lehrkorpus Gesprochenes Deutsch. In: Journal for Language Technology and Computational Linguistics, H. 1, S. 139-156. PDF
- Schmidt, Thomas / Dickgießer, Sylvia / Gasch, Joachim (2013): Die Datenbank für Gesprochenes Deutsch - DGD2. Mannheim: Institut für Deutsche Sprache. PDF
