Provenance Analytics

Technologien zur Interpretation von Herkunft, Ursache und Quellen in komplexen, datengetriebenen und vernetzten Anwendungen

Projektbeschreibung

Datenanalysetechniken im Zeitalter von Big Data werden immer komplexer und kombinieren eine Vielzahl intelligenter Technologien. Obwohl die Erfolge der Analysen beeindruckend sind, ist seitens der Nutzer viel Vertrauen in die Ergebnisse notwendig, da diese im Allgemeinen schwer nachvollziehbar und nur selten reproduzierbar sind. Visualisierung ist ein erster Schritt, um Ergebnisse verständlich zu präsentieren – allerdings bleiben dabei die zugrundeliegende Motivation, die Herkunft der Daten, die Transformationsprozesse und die währenddessen gewonnenen Einsichten im Verborgenen.

Eine umfassende, die Datenanalyse begleitende Provenance-Erhebung kann diese Defizite verringern. Dabei werden für digitale Artefakte verschiedene Aspekte der Provenance 1 betrachtet: Die Daten-Provenance beschäftigt sich mit der Historie der Datenveränderungen und Datenbewegungen. Die Prozess- oder Interaktions-Provenance fokussiert auf die Benutzereingaben und -kommandos. Besonders wichtig – und bislang wenig betrachtet – sind die Provenance von entstehenden Einsichten entlang des Datenexplorationsprozesses sowie die Provenance der Überlegungen und Gründe hinter Hypothesen und Entscheidungen im Verlauf der Datenanalyse.

Es existieren Systeme und Frameworks sowie erste Vorschläge für Standards (Open Provenance Model OPM, W3C PROV-DM) zur Modellierung, Repräsentation und Erzeugung von Provenance-Informationen. Jedoch sind diese sowohl aus Nutzer- wie aus Entwicklersicht oft nicht praktikabel und umfassend, so dass weitere Entwicklungsarbeit in Richtung einer „actionable Provenance“ nötig ist.

Ziele

Das übergreifende Ziel des Vorhabens ist es, praktikable, einfach nutzbare und umfassende Provenance-Techniken und -Methoden für spezielle Anwendungsdomänen zu entwickeln, die einen minimalen Overhead und geringe Benutzeranforderungen für die Erstellung von Provenance-Informationen aufweisen. Insbesondere sollen nicht nur unkommentierte Datentransformationsabläufe und Interaktionssequenzen aufgezeichnet, sondern Überlegungen und Argumentationen zu Hypothesen, Einsichten, Entscheidungen und Interaktionen in ihrem Kontext dokumentiert und zugänglich gemacht werden. Provenance ist eine zentrale Maßnahme zur Vertrauensbildung für digitale Informationen auf der Basis von Nachvollziehbarkeit und Reproduzierbarkeit. Unser Vorhaben „Provenance Analytics“ schafft das Bewusstsein für diesen wichtigen Aspekt des digitalen Strukturwandels, einerseits durch Ausbildung und Forschung an den beteiligten Universitäten und Fachhochschulen und andererseits durch intensiven Austausch mit lokalen KMUs im Rahmen von Workshops und Tutorials.

Ausrichtung

Da konkrete Provenance-Technologie hochgradig domänenspezifisch ist, konzentrieren wir uns in unserem Vorhaben auf wichtige Anwendungsgebiete, in denen bisher nur wenige oder gar keine Aspekte der Provenance betrachtet wurden. Insbesondere entwickeln wir Provenance-Technologie für

• Datenanalyse im Industrie 4.0 Umfeld mit Fokus auf Diagnoseanwendungen,
• 3D-Digitalisierung im Bereich Denkmalpflege und Archäologie,
• Nachrichtenflussanalyse, Reuse-Detektion und Forensik sowie
• Social Semantic Web der Dinge mit Fokus auf der Erkundung von Zusammenhängen.

    Konsortium

    Bauhaus-Universität Weimar

    Hochschule Ostwestfalen-Lippe

    Universität Passau

    ArcTron 3D Vermessungstechnik & Softwareentwicklungs GmbH, Altenthann

      Zurück