3DH
Dreidimensionale dynamische Daten-Visualisierung und Exploration für Digital Humanities-Forschung
Physically visualizing data empowers human cognitive processes and enables us to see what might not otherwise be seen when reviewing more traditional representations. (Chavez 2012:3)Kurzbeschreibung
3DH ist ein 3-jähriges Pilotprojekt zur Vorbereitung eines umfassenderen Verbundforschungsvorhabens in der anschließenden Hauptphase. Laufend aktualisierte Fortschrittsberichte finden Sie auf der 3DH-Projektwebsite.
Forschungsgegenstand ist die dynamische Visualisierung und Exploration geisteswissenschaftlicher Daten in den Digital Humanities unter besonderer Berücksichtigung von 3D-Visualisierungsmethoden. Das Pilotprojekt soll hierzu (a) eine theoretisch-methodische Orientierung sowie prototypische Visualisierungstools als Demonstratoren erarbeiten und auf dieser Grundlage (b) einen Antrag zur Finanzierung des Verbundforschungsvorhabens (Hauptphase) formulieren und einreichen. Potentielle Förderformate für die Hauptphase sind u.a. HORIZON 2020-REFLECTIVE 7 und das DFG/NEH Bi-lateral Digital Humanities Programme. Das Projekt 3DH wird ab 2016 und für die Dauer von drei Jahren von der Behörde für Wissenschaft und Forschung der Hansestadt Hamburg gefördert.
Projektstart
Das 3DH-Projekt ist offiziell am 1. February 2016 gestartet. Während des Sommersemesters 2016 (April bis Juli) begrüssen wir als Gastprofessoren und Visualisierungsexperten in unserem Team
- Prof. Johanna Drucker, UCLA – https://gseis.ucla.edu/directory/johanna-drucker/
- Prof. Geoffrey Rockwell, University of Alberta / Canada – http://geoffreyrockwell.com/
Johanna und Geoffrey: Willkommen in Hamburg – wir freuen uns auf die Zusammenarbeit!
Während des Sommersemesters 2016 wird das 3DH Projekt lose koordiniert mit einer zeitgleich stattfindenden öffentlichen Rinvorlesung (auf Englisch), die unter dem Titel “Dynamic Data Visualization in the Humanities” ab dem 7. April läuft (Donnerstags 16-18:00 in ESA J – LV 52-125).
Das 3DH -Projekt wird darüberhinaus fruchtbare Verbindungen herstellen zu meinem Seminar II mit dem Titel “Distant reading‘ und Datenvisualisierung” (Montags 10-12 am – Code 52-241)
Projektteam 2016
- Prof. Jan Christoph Meister – Projektleiter
- Marco Petris, Dipl. Inf. – wiss. Mitarbeiter
- Rabea Kleymann, MA – wiss. Mitarbeiterin
- Jana Berens – Studentische Hilfskraft
- Prof. Johanna Drucker (Gastprofessorin im Sommersemester 2016)
- Prof. Geoffrey Rockwell (Gastprofessor im Sommersemester 2016)
Ausführliche Projektbeschreibung und Zielsetzungen
1 Problemstellung
Der Einsatz digitaler Methoden in den Geisteswissenschaften und insbesondere im Rahmen von Digital Humanities-Projekten hat in den letzten Jahren große Mengen an Daten produziert, die die Big data-Thematik auch für die Geisteswissenschaften zunehmend relevant machen. Nicht nur die schiere Menge dieser Objekt- und Meta-Daten wächst jedoch stetig. Kennzeichnend für geisteswissenschaftliche Primär- und Metadaten ist zugleich, dass sie besonders komplexe und teils sogar exponentiell expandierende Daten-Strukturen aufweisen: die Forschungsfragen, die den geisteswissenschaftlichen Erkenntnisprozess motivieren, sind typischerweise multidimensional; sie reflektieren Zustände, aber zugleich auch historische Abläufe und Bezüge; sie interagieren i.d.R. dynamisch mit dem Erkenntnisinteresse. Die für diesen Typus von Forschungsdesign relevanten Antworten lassen sich entsprechend selten aus Datenlisten oder Tabellen entnehmen – sie erschließen sich nicht direkt aus ermittelten Messwerten, sondern aus dynamischen Modellen, die sich iterativ fortentwickeln. Big data meint insofern in den Geisteswissenschaften immer zugleich: complex & dynamic data. Diese methodische Erfordernis macht Modellierungen wie Datenanalysen um ein vielfaches aufwändiger – und das nicht nur für den Computer, der die Daten generiert, sondern vor allen Dingen für den Forscher, der die generierten Daten in seinem Erkenntnisprozess fruchtbar machen will. Visualisierungen spielen bei der Datenexploration heute in allen Wissenschaften eine zentrale Rolle. Sie müssen jedoch eine zusätzliche Eigenschaft aufweisen, wenn sie der besonderen Dynamik geisteswissenschaftlicher Forschungsprozessen gerecht werden wollen – die der Interaktivität. Entsprechend formuliert Sinclair (2013):
Interactive visualizations […] aim to explore available information, often as part of a process that is both sequential and iterative. That is, some steps come before others, but the researcher may revisit previous steps at a later stage and make different choices, informed by the outcomes produced in the interim. (Sinclair et al. 2013:2)Vor diesem Hintergrund hat Grinstein (2012) einen sog. ‘grand challenge’ formuliert: die Entwicklung eines Visualisierungssystems, das automatisch auf disziplinspezifische Anforderungen reagiert und die in Hinblick auf die jeweilige Forschungsfrage wie die verfügbaren Daten optimale Visualisierungslösung generiert – eine utopische Idee, die für Culy (2013) jedoch “is worth taking as a point of departure for the visualization of language and linguistic data.”
2 Forschungsfrage
Eine zentrale Fragestellung der aktuellen Digital Humanities-Forschung, die sich aus dieser Problemstellung ableitet, lautet: Wie können komplexe geisteswissenschaftliche Daten durch interaktive visuelle Darstellung besser zugänglich und dadurch für geisteswissenschaftliche Analysen nutzbar gemacht werden? Wie können also Daten mittels Visualisierung in Wissen übersetzt werden? Vorausgesetzt wird dabei, dass in computergestützten Prozessen bestimmte Merkmale unserer Welt zunächst in eine vom Computer verarbeitbare Form übersetzt werden müssen, diese maschinell bearbeitete Übersetzung jedoch anschließend auch wieder in eine nicht-algorithmisierte Form gebracht werden muss, um überhaupt sinnvoll von Menschen verstanden und bearbeitet werden zu können. Dies entspricht dem Konzept der Expansion nach Goodings (2003), das überall dort zum Einsatz kommen muss, wo Information nach ihrer Verarbeitung wieder für das menschliche Sinnverstehen zugänglich gemacht werden soll:
Having reduced some aspect of the world to a form that can be processed according to rules, the output of the computation needs to be reintroduced into the world of meaningful, human action. […] This involves translating the output into a familiar notational system and, in some cases, restoring more basic sensory modes of apprehension, as in the case of data visualization or the phenomenology of a thought experiment. […] Instead of looking for cognitive capacities of the sort required by an algorithmic view of science as rule-based reasoning about an inherently digitizable world, we should investigate those cognitive capacities that enable practitioners from different cultures to exchange meanings and methods. (Goodings 2003:281; vgl. dazu auch Willard McCarty 2014)Ein wesentliches Forschungsdesiderat ist damit für die Digital Humanities die Entwicklung von Methoden, die eine konzeptionell reflektierte “Rückübersetzung” generierter Daten in eine visuelle Form garantieren, die ihrerseits als geisteswissenschaftlicher Befund über das untersuchte Objekt/die untersuchten Objekte interpretiert werden und für die weitere Analyse interaktiv manipuliert werden kann. Konkrete Visualisierungstools und Visualisierungsmetaphern gibt es zwar schon jetzt in einer schier unüberschaubaren Vielfalt – ein reflektiertes Visualisierungskonzept für die Geisteswissenschaften, das von einer Typologie der Forschungsfragen und der methodischen Logik ihrer Forschungsprozesse her entworfen ist, steht jedoch aus. Digitale Visualisierungslösungen werden von den Geisteswissenschaften deshalb zumeist unhinterfragt aus anderen Verwendungskontexten importiert (z.B. Kreisdiagramme, Verlaufskurven, Scatter Plots etc. aus der Statistik) oder bestenfalls als ein ‚irgendwie‘ erstaunlich funktionales Tool angenommen (z.B. Word Clouds), das Dank des sog. Wow-Effekts zwar intuitiv überzeugt, methodisch wie epistemologisch jedoch letztlich opak bleibt. Im Unterschied zu diesem trial and error-Ansatz in der bisherigen geisteswissenschaftlichen Visualisierungspraxis orientiert sich das hier konzipierte Forschungsvorhaben an einer ausgewiesenen methodischen Leitidee: der interaktiven Exploration geistes- wissenschaftlicher Datenkomplexe (d.h. den multimedialen bzw. intermedialen Primärdaten zuzüglich des Gesamtspektrums an Meta- und Sekundärdaten und Verweisen, die auf diese referieren). Derart methodisch fokussiert können bestehende wie noch zu entwickelnde digitale Visualisierungen die Analyse und Interpretation in verschiedenen disziplinären Anwendungskontexten gezielt unterstützen, indem sie die dort etablierten geisteswissenschaftlichen Methoden als zentrale Elemente in Konzeption und Entwicklung bzw. die Auswahl von Visualisierungen integrieren. Wichtig ist dabei insbesondere, geeignete visuelle Metaphern für bestimmte Datentypen bzw. Gruppierungen der Daten zu finden, oder jene Aktionen zu identifizieren, die durch die interaktive Manipulation der Visualisierungen als mögliche Forschungszugänge unterstützt werden sollen. Zugespitzt gesagt lautet die Prämisse des Vorhabens also: die Prinzipien, auf denen die Visualisierungen basieren, müssen methodisch aus den Geisteswissenschaften abgeleitet werden – und nicht umgekehrt. Ein solcher methodisch reflektierter Zugang ist ausschlaggebend für die Nutzbarkeit – und gleichzeitig auch: für die Akzeptanz – der entwickelten Visualisierungen, wurde aber bisher nur in geringem Maße diskutiert (vgl. hierzu insbesondere sprachwissenschaftliche Zugänge in Culy 2013). Er garantiert, dass die Darstellung der untersuchten Daten nicht mehr auf einem Black Box-Modell basiert, das die Prinzipien für die Generierung der Visualisierungen ausblendet, sondern es ermöglicht Dank seiner Transparenz einen methodisch reflektierten, visuell unterstützten Zugang, der für eine hermeneutisch funktionale Big Data-Forschung in den Geisteswissenschaften erforderlich ist. Entsprechend gilt, was Lu Xiao et al. (2013) in einem vergleichbaren Projekt im Bereich der Menschenrechtsforschung beobachten:
The move toward data-driven research suggests the automatic sifting of large scale information hoping for patterns that may be revealing; and indeed they may. But it runs counter to the scientific method of starting with a hypothesis and looking for the relevant data against which to test it. Data – in the sense of evidence – is only data for a theory or hypothesis. Lu Xiao et al. (2013:104)Dieses Credo teilen wir ebenso, wie die von den Autoren vertretene Idee eines nutzerzentrierten, partizipatorischen Design- und Entwicklungs-Workflows für Visualisierungslösungen.