Künstliche Intelligenz Wie KI-Forschung in der Medizin trotz Datenschutz gelingen kann

18. Juni 2021, 12:25 Uhr

Künstliche Intelligenz kann in der Medizin helfen, gefährliche Krankheiten frühzeitig zu erkennen. Dafür braucht ein Algorithmus aber zuvor unzähligen Patientendaten. Das ist allerdings nicht so einfach, denn der europäische Datenschutz setzt strenge Grenzen, wenn es um die Weitergabe und Verarbeitung von Patientendaten geht. Trotzdem kann künstliche Intelligenz für die medizinische Forschung trainiert werden – ohne dabei die Datensicherheit zu gefährden.

Es geht um Krankheiten wie Leukämie, Tuberkulose oder auch Covid-19. Erkrankungen, die gerade am Anfang ganz unspezifische Symptome zeigen. Etwa Müdigkeit, Fieber oder Gewichtsverlust. Künstliche Intelligenz – kurz KI – kann dabei helfen, solche Erkrankungen frühzeitig zu diagnostizieren. Dafür muss sie aber gefüttert werden, mit den Daten von Hunderttausenden an betroffenen Patienten.

Strenger Schutz von Patientendaten

Illustration
Patientendaten sind in der EU besonders gut geschützt. Bildrechte: imago images/Panthermedia

Doch hier stößt die hiesige KI-Forschung an ihre Grenzen. Denn die europäischen Datenschutz-Grundverordnung lässt die Verwendung von Patientendaten nur unter strengen Regeln zu. Etwa durch Anonymisierung, bei der alle Merkmale und Daten, die eine Person erkennbar machen, gelöscht, getrennt oder verfälscht werden. Warum das ein Problem ist, erklärt Professor Andreas Maier, Leiter des Lehrstuhls für Mustererkennung an der Friedrich-Alexander-Universität Erlangen-Nürnberg.

Stellen Sie sich vor, es ist ein Datensatz falsch annotiert: Es wird festgestellt, dass angeblich ein Lungenödem auf dem Bild ist, dabei ist tatsächlich das Herz vergrößert. Dann lernt der entsprechende Algorithmus natürlich etwas Falsches. Und gerade wenn ich nicht den Zugriff auf die Originaldaten habe, dann fällt es schwer, die Datenqualität zu wahren.

Prof. Dr. Andreas Maier, Friedrich-Alexander-Universität Erlangen-Nürnberg

Am einfachsten wäre es also, Zugriff auf die Daten zu haben und damit die komplette Sicht auf die Dinge, erläutert Maier.

Federated Learning: Dezentral zum Ziel

Um die komplette Sicht auf die Dinge zu haben und trotzdem den Datenschutz zu berücksichtigen, haben Forscher nun verschiedene Ansätze entwickelt. Federated Learning zum Beispiel – föderales Lernen. Die Grundidee dabei: Die Daten bleiben da, wo sie schon sind, zum Beispiel in den Krankenhäusern, erklärt Professor Joachim Schultze, Direktor des Forschungsbereichs Systemmedizin am Deutschen Zentrum für neurodegenerative Erkrankungen.

Federated Learning bietet eine Möglichkeit, die Daten an verschiedene Standorten zu lassen, aber letztendlich hat man immer noch eine zentrale Instanz, die das ganze orchestriert.

Prof. Dr. Joachim Schultze, Deutsches Zentrum für neurodegenerative Erkrankungen

Diese Instanz könnte also Krankenhäusern den KI-Algorithmus bereitstellen. Dieser lernt vor Ort von den Patientendaten, was bestimmte Krankheiten kennzeichnet. Und kehrt nur mit diesen Erkenntnissen und ohne jegliche Patientendaten zur Instanz zurück. Zum Beispiel zu einem Forschungsinstitut. Bei solchen Ansätzen geben die Patienten natürlich ihr Einverständnis.

Konkurrenz der Tech-Riesen

Mit diesen Modellen wollen die Wissenschaftler auch den großen Tech-Unternehmen etwas entgegensetzen. Denn diese müssen sich außerhalb der EU kaum an Datenschutzlinien halten.

Ich meine, das Bezeichnende daran ist, dass die Internetriesen mit zu den größten Investoren im Genom-Forschungsbereich gehören. Das heißt, dass diese Firmen alle verstanden haben, dass das ein Bereich ist für die Medizin, der ihnen in Zukunft Profit einbringt.

Prof. Dr. Joachim Schultze, Deutsches Zentrum für neurodegenerative Erkrankungen

Dagegen wirken Ansätze wie beim Federated Learning im Vergleich fast demokratisch. Nach Ansicht der Experten müsse sich die europäische Forschung allerdings beeilen. Denn wenn wir hier den Anschluss verlieren würden, würde der Großteil der medizinischen Daten, die entsprechende Infrastruktur und das Wissen schnell bei den großen Playern der Tech-Industrie liegen.

404 Not Found

Not Found

The requested URL /api/v1/talk/includes/html/e6c18247-e617-4a61-bbfc-085fa886b551 was not found on this server.