(Projektlaufzeit: 2006 - 2009)

TextGrid

Personal: Dr. Andrea Zielinski, Christian Simon

Forschungsgegenstand und -ziele: Das Projekt errichtet eine nationale Forschungsinfrastruktur für die Geisteswissenschaften. In dieser virtuellen Forschungsumgebung können wissenschaftliche Texte kollaborativ erstellt, bearbeitet, annotiert, durchsucht und nachhaltig gespeichert werden. Die dafür notwendigen Werkzeuge sowie die sprachtechnologischen Ressourcen, Wörterbücher und Lexika sind Teil der Arbeitsumgebung und stehen für eine Weiterentwicklung offen.

TextGrid hat hierzu den Begriff eHumanities wesentlich mitgeprägt und auf zahlreichen Konferenzen vertreten. Dabei wurde eine Vernetzung zu verwandten nationalen und internationalen Initiativen (z.B. AHDS, DARIAH, CLARIN) vorgenommen und zahlreiche Kontakte zu potentiellen Anwendern (z.B. GerManC) geknüpft. Es wurden eine Reihe von TextGrid-Szenarien spezifiziert und daraus konkrete fachwissenschaftliche Anforderungen für einzelne Werkzeuge abgeleitet. Realisiert wurden innherhalb von TextGrid weitgehend generische Tools wie ein XML-Editor, ein Recherchetool und eine Wörterbuchsuche, außerdem ein TEI-annotiertes Campe Wörterbuch und das Morphologietool Morphisto (siehe unten).

Publikationen:

  • Aschenbrenner, Andreas/Blanke, Tobias/Dunn, Stuart/Kerzel, Martina/Rapp, Andrea/Zielinski, Andrea (2007):
    Von e-Science zu e-Humanities - Digital vernetzte Wissenschaft als neuer Arbeits- und Kreativbereich für Kunst und Kultur. In: Bibliothek. Forschung und Praxis, Jahrgang 31, 1/2007, S. 11-21.
  • Zielinski, Andrea (2006):
    TextGrid Szenarien. Version 10.12.2006. Sprachkorpora, Kapitel 5, S. 31-35.
  • Gietz, Peter/Aschenbrenner, Andreas/Buedenbender, Stefan/Jannidis, Fotis/Küster, Marc Willem/Ludwig, Christoph/Pempe, Wolfgang/Vitt, Thorsten/Wegstein, Werner/Zielinski, Andrea (2006):
    TextGrid and eHumanities. In: Conference on e-Science and Grid Computing, 2006. e-Science 2006. Second IEEE International. Amsterdam, The Netherlands, S. 133-140.
  • Pempe, Wolfgang/Zielinski, Andrea/Gietz, Peter/Haase, Martin/Funk, Stefan Funk/Simon, Christian (forthcoming):
    TEI Documents in the Grid. Journal of Literary and Linguistic Computing. Special Issue on TEI.
  • Zielinski, Andrea/Simon, Christian (2008):
    Morphisto - An Open-source Morphological Analyzer for German. In: Seventh International Workshop on Finite-State Methods and Natural Language Processing, 11-12 September 2008. FSMNLP 2008. Ispra, Italy, S. 177-182.

Offizielle Projektseite:

Im Rahmen des Projektes TextGrid hat das Institut für Deutsche Sprache eine morphologische Lexikonkomponente Morphisto entwickelt, die hiermit der linguistischen Community frei zur Verfügung gestellt werden kann.
Morphisto basiert auf den freiverfügbaren SFST-Tools der Universität Stuttgart (Schmid 2005), die bereits erfolgreich mit der Morphologiekomponente SMOR (Schmid, Fitschen, Heid 2004) eingesetzt wurden und eine minimale Basisgrammatik bestehend aus den wesentlichen deutschen morphotaktischen und orthographisch/phonologischen Regeln beinhaltet. Das Morphisto-Lexikon enthält derzeit ca. 30.000 lexikalische Einträge mit Informationen zum Lemma, der Wortklasse und dem Paradigma. Die Lemmaauswahl orientiert sich an der DeReWo-Liste, einer Liste der 30.000 häufigsten Wörter bezogen auf das Deutsche Referenzkorpus (DeReKo). Für diese hochfrequenten Wörter der deutschen Sprache liefert der Transducer eine korrekte Analyse, was durch eine manuelle Verifizierung sichergestellt wurde. Die eigentliche Abdeckungsrate des Morphologietools ist dank der Wortbildungsanalyse jedoch wesentlich höher.

Bezeichung Typ Anzahl Einträge veröffentlicht am  
morphisto-2008-12-31-0.1 xml-kodiertes Morphisto-Lexikon 18.000  12. Dezember 2008      download
  • Das Morphisto-Lexikon steht derzeit unter der Attribution Non-commercial Share Alike (by-nc-sa) frei zur Verfügung.
  • Installationshinweise: Für die Kompilierung des Transducers müssen die SFST-Tools installiert sein. Es wird ein Rechner mit mindestens 8 GB RAM empfohlen.

Bei Fragen oder Anregungen senden Sie bitte eine E-Mail an morphisto(at)ids-mannheim.de.