{"id":111,"date":"2012-06-27T07:35:12","date_gmt":"2012-06-27T07:35:12","guid":{"rendered":"http:\/\/jcmdev.fruitbatdesign.com\/?page_id=111"},"modified":"2023-06-02T16:16:21","modified_gmt":"2023-06-02T16:16:21","slug":"catma","status":"publish","type":"page","link":"https:\/\/jcmeister.de\/projects\/catma\/","title":{"rendered":"CATMA, CL\u00c9A & heureCL\u00c9A"},"content":{"rendered":"
… in English<\/a><\/p>\n CATMA (Computer Aided Textual Markup\u00a0 and Analysis) ist eine intuitiv bedienbare Software f\u00fcr Text-MarkUp und\u00a0 Textanalyse. CATMA wird in einer Vielzahl von internationalen Projekten sowie in Lehrveranstaltungen eingesetzt; seine Verwendung verlangt keinerlei Vorkenntnisse und erm\u00f6glicht es damit auch Nicht-Fachleuten, standardkonforme (TEI\/XML) und mit anderen Forschern austauschbare, nachhaltig nutzbare Textannotationen zu erarbeiten. Im CATMA-Projekt wurde diese frei erh\u00e4ltliche Software zun\u00e4chst als Desktop-Applikation f\u00fcr PC und Mac OS entwickelt; mittlerweile ist CATMA eine reine Webapplikation und damit plattformunabh\u00e4ngig nutzbar.<\/p>\n \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 CATMA-Logo (2008 – 2018)<\/span><\/p><\/div>\n Die Programmarchitektur von CATMA als einer integrierten Annotations- und Analysesoftware wurde 2008 von Malte Meister konzipiert. Unser Ziel war damals eigentlich die Portierung der seit den 1980er Jahren verwendeten DOS-Softwaresuite TACT (Textual Analysis Computing Tools), die John Bradley in Modula 2 programmiert hatte, in eine Windows-Umgebung. Es zeigte sich aber schnell, dass eine komplette Re-Implementierung notwendig war; sie wurde f\u00fcr den sog. ‘Analyzer’ von Malte in C++ und von Marco Petris f\u00fcr den ‘Tagger’ in JAVA umgesetzt, um so zwei verschiedene Ans\u00e4tze miteinander vergleichen zu k\u00f6nnen. Ab der zweiten Version \u00fcbernahm Marco dann die Gesamtentwicklung in JAVA, die erstmals mit dem Release von CATMA 3.0 umgesetzt wurde.<\/p>\n In dem anschlie\u00dfenden, zwei Mal mit einem Google Digital Humanities Award<\/em> gef\u00f6rderten Projekt CL\u00c9A haben wir sodann die erste komplett Browser-basierte Version CATMA 4.0 entwickelt, mit der direkt auf digitale Textsammlungen im Internet zugegriffen und\u00a0 kollaboratives Markup erstellt und ausgetauscht werden konnte.<\/p>\n In dem Anschlussprojekt heureCL\u00c9A<\/em><\/a>, das 2013-2016 vom BMBF gef\u00f6rdert wurde, haben wir mit dem Team des Heidelberger Informatikers Prof. Michael Gertz zusammengearbeitet. Kernidee dieses Gemeinschaftsprojektes war es, Texte mit erz\u00e4hltechnischen Annotationen (sog. ‘narratologisches Markup’), die mit CATMA bearbeitet worden waren, als Trainingsmaterial f\u00fcr einen Machine Learning-Algorithmus zu verwenden. Dieser Algorithmus sollte dabei so trainiert werden, dass man mit ihm bestimmte erz\u00e4hltechnische Ph\u00e4nomene in Texten automatisch identifizieren und so dem CATMA-Nutzer eine relevante Vorauswahl entsprechender Annotationen zur Auswahl anbieten kann – also eine heuristische “Such- und Finde”-Funktion, mit der die Arbeit des Annotators unterst\u00fctzt wird. Der Prototyp eines solchen Algorithmus wurde dann erstmals 2017 in die Version CATMA 5.0 integriert.<\/p>\n F\u00fcr CATMA bedeutete dies, die Norm des sog. ‘inter annotator agreement’ als notwendiger Voraussetzung bei der Erstellung von Textannotationen endg\u00fcltig aufzugeben – also statt der methodischen Leitidee der einen, f\u00fcr alle Annotatoren als verpflichtend geltenden ‘richtigen’ Annotation, die dann entsprechend von der Software als einzige in die entsprechende Datenbank aufgenommen wird, die Leitidee der Annotationsvielfalt und der Auswahl zu r\u00fccken. Tongue in cheek<\/em> war damit der Slogan von der “undogmatischen Annotation” mit CATMA geboren. Und da wir ohnehin gerade dabei waren, das Interface unserer Webapplikation f\u00fcr die n\u00e4chste Version komplett zu \u00fcberarbeiten, schlug Johanna Drucker vor, unseren konzeptionell ‘undogmatischen’ Ansatz doch bitte auch im neuen CATMA-Logo zum Ausdruck zu bringen –\u00a0 und verpasste dem CATMA-Schriftzug auf der Stelle zwei Katzenohren auf dem ‘C’ und einen Schwanz am Ende: “Cats are as un-dog-matic as it can get, right?”<\/p>\n \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0 CATMA-Logo seit Version 6.0 \/ 2019<\/span><\/p><\/div>\n Dieser konzeptionelle Fokus wurde technologisch umgesetzt mit CATMA 6.0 (Release 2019). Mit dieser Version gab es nicht nur ein komplett neues graphisches Interface, sondern erstmals eine\u00a0 Projektmanagement-Funktion in Kombination mit einer GitLab-basierten Versionierungstechnologie.<\/p>\n Mit meinem Eintritt in den Ruhestand Anfang 2020 hat Prof. Evelyn Gius von der Technischen Universit\u00e4t Darmstadt die Projektleitung \u00fcbernommen. CATMA hat damit nach zw\u00f6lf Jahren eine neue institutionelle Heimat und doch zugleich eine neue Projektleiterin bekommen, die das “K\u00e4tzchen” als ehemalige Mitarbeiterin in meinem CATMA-Team bereits von Anfang an begleitet hat: besser geht’s nicht! Wie wichtig und positiv diese Amts\u00fcbergabe an Evelyn f\u00fcr CATMA gewesen ist, demonstriert die letzte, neueste Version CATMA 7.0<\/a>, die Evelyn und ihr Team seit Ende Mai 2023 im Web zur Verf\u00fcgung stellen – mit erheblich gesteigerter Performanz bei der kollaborativen Arbeit mit komplexen Text- und Annotationskorpora. Miau!<\/p>\n Weitere Informationen<\/a>
<\/p>\n
<\/a><\/p>\n
<\/a>Einen f\u00fcr die\u00a0 Weiterentwicklung von CATMA besonders wichtigen Impuls lieferte das Forschungsvorhaben “3DH”, das\u00a0 2016-2019 in enger Kooperation mit Prof. Geoffrey Rockwell (University of Alberta) und Prof. Johanna Drucker (UCLA) durchgef\u00fchrt wurde. Bei der ‘dritten Dimension’ denkt man bei Visualisierungen f\u00fcr gew\u00f6hnlich an den r\u00e4umlichen Effekt, der komplexe Daten anschaulicher macht. Uns hingegen ging es um eine andere, zunehmend ignorierte dritte Dimension, die allen Datenvisualiserungen notwendig eingeschrieben ist: n\u00e4mlich die der Selektivit\u00e4t, die bei der Auswahl und Akzentuierung bestimmter Datentypen und Datenreihen durch Visualisierungsalgorithmen technisch unumg\u00e4nglich ist. Visualisierungen sind nie ‘objektiv’ – sie sind interessegeleitete Repr\u00e4sentationen von Daten, die sich ihrerseits bei kritischer Betrachtung oft als nur relativ aussagef\u00e4hige Me\u00dfwerte erweisen. Und so gesehen sind Daten-Visualisierungen vergleichbar mit Text-Annotationen – beides sind Interpretationskonstrukte. Was w\u00e4re nun, wenn man sowohl die ‘Gemachtheit’, ja mitunter gar die Subjektivit\u00e4t von Textannotationen wie die von Visualisierungen bei der Konzipierung und Verwendung der entsprechenden Softwaretools durchgehend transparent machen und halten k\u00f6nnte?<\/p>\n
<\/a>
\nzu CATMA<\/strong>, CL\u00c9A<\/strong> und heureCL\u00c9A<\/strong>
\nentnehmen Sie bitte der Projektwebsite<\/a>.<\/p>\n