Die intelligente Nutzung von Daten wird in verschiedenen Industriefeldern zum entscheidenden Innovationstreiber und Wettbewerbsfaktor. Für die datengetriebene Forschung und Entwicklung sind Qualität, Struktur und Menge der Daten entscheidend. Besonders in sensiblen Domänen wie der Medizin besteht eine große Spannung zwischen Datennutzung und Datenschutz. Medizin- und Gesundheitsdaten gehören zu den »besonderen Kategorien persönlicher Daten« gemäß der Datenschutz-Grundverordnung (Art. 9 DSGVO), die hohe Hürden für deren Verarbeitung vorsieht.
KI-Entwicklung und medizinische Forschung in Deutschland
Diese Daten haben jedoch einen hohen Wert, da sie zu Verbesserungen in Diagnose, Prognose, Behandlungsplan und Therapie beitragen können. Viele Organisationen, beispielsweise Krankenhäuser und Medizintechnikhersteller, erheben bereits heute Gesundheitsdaten in erheblichen Umfang. Die Anonymisierung von medizinischen Daten und die Messung dieser Anonymisierung können rechtliche Unsicherheiten verringern und ermöglichen es, KI für die medizinische Forschung auch in Deutschland gemäß den Vorgaben des AI Acts der EU zu entwickeln.
Einsatz von zwei Anonymisierungs-Methoden
Im ANONY-MED Projekt werden medizinische Daten auf zwei Arten anonymisiert: durch Privacy-bewahrende Datensynthese mit generativen Modellen und durch Homomorphic Encryption (HE). Die Privacy-bewahrende Datensynthese erstellt synthetische Datensätze, die keine Rückschlüsse auf Individuen zulassen, aber dennoch statistisch relevante Muster enthalten. Homomorphic Encryption (HE) ermöglicht es, Daten verschlüsselt zu verarbeiten, sodass sensible Informationen während der Analyse geschützt bleiben. Die Präzision der Vorhersagen der entstehenden KI-Modelle und der statistischen Analysen werden gemessen. Gleichzeitig wird mithilfe von Privacy-Metriken der Anonymisierungsgrad der Daten quantifiziert. Ein speziell für das Projekt entwickeltes Framework garantiert die Entwicklung von Methoden und Modellen, die höchsten ethischen und legalen Standards genügen.
Der ANONY-MED-Ansatz wird in drei spezifischen Use Cases angewendet und evaluiert, um die Praktikabilität und Translationsfähigkeit des Ansatzes nachzuweisen.
Das Projekt läuft von Januar 2023 bis Dezember 2025. Die Fördersumme von BMBF und EU beträgt insgesamt knapp 1,4 Millionen Euro.