VisOnFire. Workflows verstehen und visualisieren

Visual Analysis of Large and Heterogeneous Scientific Workflows for Analytical Provenance – Ein forensisches Analysetool soll die Visualisierung von Datenanalyseworkflows ermöglichen und so die Reproduzierbarkeit von Studien erhöhen.
Externe Projektleitung
Gesamtprojektleitung:
Ass. Prof. DI Dr. Marc Streit, Johannes Kepler Universität Linz, Institut für Computergrafik
Externe MitarbeiterInnen
DI Samuel Gratzl, BSc, Johannes Kepler Universität Linz, Institut für Computergrafik
PartnerInnen
  • Harvard University, School of Engineering & Applied Sciences, Visual Computing Group (Pfister Lab)
  • Harvard Medical School, Center for Biomedical Informatics, Computational Genomics Group (Park Lab)
  • Universität Rostock, Institut für Informatik, Visual Computing und Computergraphik
Finanzierung
Fonds zur Förderung der wissenschaftlichen Forschung (FWF)
Laufzeit
01.01.2016 – 31.12.2019
Projektstatus
laufend

Komplexe Analyse von großen Datenmengen

In den letzten Jahren finden sich immer mehr wissenschaftliche Disziplinen mit einer großen Menge höchst komplexer Daten konfrontiert.  In groß angelegten Analyseexperimente werden Daten mithilfe von Workflows, bestehend aus Datentransformationen und Analyseoperationen, ausgewertet. Oft arbeiten große Forschungsteams von verschiedenen Standorten aus an solchen Workflows, administrieren und ändern sie laufend. Dadurch ist es schwierig nachzuvollziehen, wo welche Änderungen vollzogen wurden und welche Auswirkungen diese auf Resultate hatten. So wird die Reproduzierbarkeit und Nachvollziehbarkeit von repräsentativen Studien, einem Fundament der Wissenschaft, in Mitleidenschaft gezogen.  Denn was, wenn die einzelnen Forschungsschritte nicht mehr nachvollziehbar sind? 

Den Workflow verstehen und visualisieren

Der Schlüssel zu Nachvollziehbarkeit und Reproduzierbarkeit liegt in der Sammlung von Informationen über die verarbeiteten Daten, die angewandten Werkzeuge und Algorithmen im Laufe der Zeit. Derzeit ist es, wenn überhaupt möglich, sehr zeitaufwändig herauszufinden, welche konkreten Änderungen auf dem Level der Eingangsdatensätze, dem Workflow selbst oder der Parametrisierung bei der Wiederholung von Studien zu Variationen im Resultat geführt haben. Um ein forensisch visuelles Werkzeug für die Analyse von Workflow Provenance Graphen zu ermöglichen, werden folgende Komponenten entwickelt:

  1. Neuartige visuelle Analysemethoden für skalierbare Workflow-Visualisierung,
  2. Möglichkeiten zum Vergleich von komplexen Datenstrukturen, sowie
  3. Metriken zum Quantifizieren von Änderungen.

Nachvollziehbarkeit und Reproduzierbarkeit

Ziel des Projekts ist die Nachvollziehbarkeit auf allen Ebenen, also dass die Herkunft der Daten zu jeder Zeit klar und sichtbar ist. Visualisierung und detaillierte Beschreibung einzelner Arbeitsschritte sind mithilfe der neuen Tools möglich und machen die Herkunft von Änderungen klar ersichtlich und identifizierbar. Das garantiert AnalystInnen ein besseres Verständnis des Workflows und somit auch einen Einblick darin, wie sich Änderungen im Workflow auf die Resultate auswirken. So kann die Nachvollziehbarkeit von Analyseergebnissen garantiert und die Reproduzierbarkeit veröffentlichter Studien gehoben werden. Das Projekt birgt also für viele Bereiche und Disziplinen der Wissenschaft großes Potential.

Weiterführende Links

Project Website

Publikationen

Dahnert, M., Rind, A., Aigner, W., & Kehrer, J. (2019). Looking beyond the horizon: Evaluation of four compact visualization techniques for time series in a spatial context. ArXiv:1906.07377 [Cs].
Streit, M., Aigner, W., & Girardi, D. (2018, March). Injecting Life into Visualizations for Biomedical Research. Presented at the DBMI Open Insights Seminar, Harvard University.
Niederer, C., Stitz, H., Hourieh, R., Grassinger, F.-G., Aigner, W., & Streit, M. (2018). TACO: Visualizing Changes in Tables Over Time. IEEE Transactions on Visualization and Computer Graphics (InfoVis "17), 24(1), 677–686. https://doi.org/10.1109/TVCG.2017.2745298
Rind, A., Haberson, A., Blumenstein, K., Niederer, C., Wagner, M., & Aigner, W. (2017). PubViz: Lightweight Visual Presentation of Publication Data. In B. Kozlíková, T. Schreck, & T. Wischgoll (Eds.), Proc. Eurographics Conf. Visualization (EuroVis) – Short Paper (pp. 169–173). EuroGraphics. https://doi.org/10.2312/eurovisshort.20171152
Aigner, W. (2017, April). Mit Visual Analytics zu Data-Driven Banking. Keynote presented at the Bankensymposium Wachau, Göttweig (Austria).
Tominski, C., Aigner, W., Miksch, S., & Schumann, H. (2017). Images of Time: Visual Representation of Time-Oriented Data. In A. Black, P. Luna, O. Lund, & S. Walker (Eds.), Information Design: Research and Practice (pp. 23–42). Gower/Routledge.
Kromer, L., Wagner, M., Blumenstein, K., Rind, A., & Aigner, W. (2016). Performance Comparison between Unity and D3.js for Cross-Platform Visualization on Mobile Devices. In Proceedings of the 9th Forum Media Technology 2016 (pp. 47–52). CEUR-WS.
Aigner, W. (2016, October). Visual Analytics of Time-Oriented Data and its Complex Structures. Invited talk, Rutgers University, USA.
Aigner, W. (2016, May). Research Highlights at the Institute of Creative\Media/Technologies. Inivited talk presented at the Chair of Computer Graphics, University of Rostock, Germany.
Blumenstein, K., Niederer, C., Wagner, M., Schmiedl, G., Rind, A., & Aigner, W. (2016). Evaluating Information Visualization on Mobile Devices: Gaps and Challenges in the Empirical Evaluation Design Space. In Proceedings of 2016 Workshop on Beyond Time And Errors: Novel Evaluation Methods For Visualization (pp. 125–132). Baltimore, MD, USA: ACM. https://doi.org/10.1145/2993901.2993906
Wagner, M., Blumenstein, K., Rind, A., Seidl, M., Schmiedl, G., Lammarsch, T., & Aigner, W. (2016). Native Cross-platform Visualization: A Proof of Concept Based on the Unity3D Game Engine. In Proceedings of International Conference on Information Visualisation (IV16) (p. forthcoming). Lisbon, Portugal: IEEE Computer Society Press.
Ceneda, D., Aigner, W., Bögl, M., Gschwandtner, T., & Miksch, S. (2016). Guiding the Visualization of Time-Oriented Data. In Poster Abstracts of IEEE Conference on Visual Analytics Science and Technology (VAST 2016). Baltimore, MD, USA: IEEE.
Stitz, H., Gratzl, S., Aigner, W., & Streit, M. (2015). ThermalPlot: Visualizing Multi-Attribute Time-Series Data Using a Thermal Metaphor. IEEE Transactions on Visualization and Computer Graphics, 22, 2594–2607. https://doi.org/10.1109/TVCG.2015.2513389
Rosenthal, P., Aigner, W., & Scheidegger, C. (Eds.). (2015). EuroRV3 2015 - EuroVis Workshop on Reproducibility, Verification, and Validation in Visualization. Goslar, Germany: Eurographics Association.
Stitz, H., Gratzl, S., Aigner, W., & Streit, M. (2015). ThermalPlot: Visualizing Multi-Attribute Time-Series Data Using a Thermal Metaphor. In Poster Abstracts of IEEE Conference on Information Visualization (InfoVis "15). Chicago, IL, USA: IEEE.

Presseberichte

Dem Workflow auf der Spur

Veröffentlichungsdatum: 01.02.2016
Medium:  Austria Innovativ

Vorbereiten auf die digitale Welt

Veröffentlichungsdatum: 16.11.2016
Medium: Der Standard

Wissenschaft und Forschung in Niederösterreich

Veröffentlichungsdatum: 01.11.2016
Medium: UNIVERSUM Magazin

Big Data – und welche Chancen Daten bieten

Veröffentlichungsdatum: 10.06.2017
Medium: Die Presse