Big-Data Analytics

Erforschung von Methoden der Auswertung großer Datenmengen unter strenger Wahrung von Datenschutz-Anforderungen

Auswirkungen zunehmender Datenschutzbemühungen für die Forschung

Die fortschreitende Digitalisierung fast aller Arbeits- und Lebensbereiche eröffnet nicht nur neue Möglichkeiten in Bezug auf Produkte und Dienstleistungen, sondern wirft auch Probleme auf was den Schutz von sensiblen Informationen angeht. Speziell personalisierte Dienstleistungen und Produkte oder Dienste, die sich durch den Verkauf von personalisierter Werbung, oder gar der Kundendaten selbst finanzieren, sind dabei ins Rampenlicht gerückt. Zusätzlich wurde in den letzten Jahren der Datenschutz gestärkt, am prominentesten durch die europäische Datenschutzgrundverordnung (DSGVO), die ab Mai 2018 in Kraft trat.

Den Datenschutzbemühungen stehen eine Vielzahl von Interessen in Forschung und Wirtschaft gegenüber, die auf die Bereitstellung von oftmals sensiblen und personenbezogenen Daten angewiesen sind. Die Qualität der bereitgestellten Daten ist dabei oft wesentlich, klassische Anonymisierungsverfahren verzerren im Allgemeinen jedoch sehr stark und wirken sich damit nachteilig auf die Qualität der Informationen aus. Die bisher typischerweise als Ersatz genutzte Pseudonymisierung kann nach der DSGVO hingegen nicht mehr als Datenschutzmaßnahme eingesetzt werden.

Methoden die Datenschutzanforderungen gerecht werden

Im Rahmen dieses Projekts werden Methoden erforscht, die negative Effekte von Anonymisierungsmaßnahmen auf die Ergebnisse von Big-Data-Analysen eindämmen und abschätzbar machen.

Ein wichtiger Aspekt der DSGVO ist die informationelle Selbstbestimmung: Dazu gehören das Recht der nachträglichen Rücknahme der Zustimmung, das Recht auf Transparenz und auch das Recht auf Datenlöschung. Diese Rechte müssen berücksichtigt werden. Es werden daher Methoden entwickelt, um Transparenz zu gewährleisten, ohne dadurch neue Gefahren für den Datenschutz zu erzeugen, sowie Methoden zur Löschung von Daten aus komplexen datenverarbeitenden Systemen.

Relevanz der Ergebnisse

Der zentrale Innovationssprung liegt im Lückenschluss zwischen theoretischen Datenschutzanforderungen, bedingt durch die neuen Regelungen der DSGVO und praktischen Anforderungen in datenverarbeitenden Anwendungen, speziell wenn diese eine gewisse Qualität der Ergebnisse erfordern, wie bspw. im medizinischen Bereich.

Da das Thema der möglichst verzerrungsarmen Anonymisierung für die meisten Auswerter von personenbezogenen Daten ein wesentlicher Aspekt ist, wird eine große Zahl an Folgeprojekten speziell auch in Form von Forschungskooperationen erwartet. Beim Löschen von Daten ist der Bedarf nicht nur auf die Seite des Datenschutzes beschränkt, sondern auch die Wiederherstellung von Daten einzubeziehen: Um Löschen in seiner stärksten Form durchführen zu können ist der gleichzeitige Aufbau von Know-How im Bereich der Datenbankforensik notwendig, ein Teilbereich, der wiederum äußerst vielversprechende Anwendungsgebiete, etwa in der Bekämpfung der Wirtschaftskriminalität, aufwirft.

Die im Rahmen dieses Projektvorhabens erzielten Ergebnisse und Kompetenzen sind für alle Verarbeiter sensibler personenbezogener Daten in Österreich, eingeschränkt auch im restlichen Europa, relevant.

Projektleitung