CATMA, CLÉA & heureCLÉA
CATMA (Computer AidedTextual Markup and Analysis) ist eine intuitiv bedienbare Software für Text-MarkUp und Textanalyse. CATMA wird in einer Vielzahl von internationalen Projekten sowie in Lehrveranstaltungen eingesetzt; seine Verwendung verlangt keinerlei Vorkenntnisse und ermöglicht es damit auch Nicht-Fachleuten, standardkonforme (TEI/XML) und mit anderen Forschern austauschbare, nachhaltig nutzbare Textannotationen zu erarbeiten. Im CATMA-Projekt wurde diese frei erhältliche Software zunächst als Desktop-Applikation für PC und Mac OS entwickelt; mittlerweile ist die Anwendung komplett browserbasiert nutzbar und verwendet ausserdem ein Internet-Datenrepositorium. Die Programmarchitektur einer integrierten Annotations- und Analysesoftware wurde 2008 konzipiert in der BSc-Arbeit von Malte Meister.
Maltes ursprüngliche Aufgabenstellung war die Portierung der seit den 1980er Jahren verwendeten DOS-Softwaresuite TACT (Textual Analysis Computing Tools), die John Bradley in Modula 2 programmiert hatte, in eine Windows-Umgebung. Es zeigte sich aber schnell, dass eine komplette Re-Implementierung notwendig war; sie wurde für den sog. ‘Analyzer’ von Malte in C++ und von Marco Petris für den ‘Tagger’ in JAVA umgesetzt, um so zwei verschiedene Ansätze miteinander vergleichen zu können. Ab der zweiten Version übernahm Marco dann die Gesamtentwicklung in JAVA bis hin zum Release von CATMA 3.0.
In dem anschließenden, zwei Mal mit einem Google Digital Humanities Award geförderten Projekt CLÉA haben wir sodann die komplett Browser-basierte und webfähige Version CATMA 4.0 entwickelt, die direkt auf digitale Textsammlungen im Internet – u.a. auf Google Books – zugreifen und mit der kollaboratives Markup erstellt und ausgetauscht werden kann.
Und im Anschlussprojekt heureCLÉA, das 2013-2016 vom BMBF gefördert wurde, haben wir gemeinsam mit einem Informatikerteam um den Heidelberger Kollegen Prof. Michael Gertz bereits erarbeitetes narratologisches Markup mit Machine Learning- Verfahren analysiert. Ziel war es, CATMA nunmehr um ein heuristisches Werkzeug zu ergänzen, das erzähltechnische Phänomene in Texten selbständig identifizieren und dem Nutzer eine relevante Vorauswahl entsprechender Annotationen zur Auswahl anbieten kann.
Die aktuelle, webbasierte Version CATMA 5.0 steht zur Verfügung unter https://catma.de
CATMA 6.0 wird im ersten Quartal 2019 zur Verfügung stehen und eine neue Projektmanagement-Funktion mit einer GitLab-basierten Versionierungstechnologie, eine hochperformante Neo4J-Datenbank sowie ein komplett neues User Interface beinhalten.
Weitere Informationen
zu CATMA, CLÉA und heureCLÉA
entnehmen Sie bitte der Projektwebsite.
CATMA & CLÉA Projektmitarbeiter (grazie mille an mein Super-Team!):
Marco Petris, Dipl.Comp.Sc.; Janina Jacke, MA; Dr. Evelyn Gius