Künstliche Intelligenz ist dem Menschen bei der Diagnose von pigmentierten Hautveränderungen wie Muttermalen und Melanomen überlegen. Eine Studie unter Leitung der MedUni Wien ließ menschliche ExpertInnen in einem „Wettbewerb“ gegen internationale Bilderkennungsprogramme mit lernfähigen Algorithmen antreten. Die Programme erzielten klar bessere Ergebnisse, dennoch können sie mit ihren derzeitigen Fähigkeiten den Menschen nicht ersetzen. Die Ergebnisse wurden aktuell im Journal „The Lancet Oncology“ veröffentlicht.
Die MedUni Wien ließ im Rahmen der ISIC Challenge der International Skin Imaging Collaboration (ISIC) 511 menschliche MedizinerInnen beim Erkennen von Hautläsionen gegen 139 teilnehmende Bilderkennungsalgorithmen (77 verschiedene Laboratorien weltweit) antreten. Als Lerngrundlage für die Maschinen diente die Bilddatenbank HAM10.000, die von der Arbeitsgruppe von Harald Kittler an der Universitätsklinik für Dermatologie der MedUni Wien in Kooperation mit der University of Queensland (Australien) angelegt worden war. Diese umfasst mehr als 10.000 auflichtmikroskopisch angefertigte Aufnahmen mit sieben verschiedenen Klassen an pigmentierten Hautveränderungen: den harmlosen Muttermalen, Dermatofibromen, Altersflecken und Blutschwämmen sowie den bösartigen Melanomen, Basalzellkarzinomen und Morbus Bowen (weißer Hautkrebs). Die menschlichen ExpertInnen griffen allein auf ihre fachliche Erfahrung aus Forschung und Klinik zurück.
Allen TeilnehmerInnen wurden auf einer Online-Plattform je 30 Bilder aus einem Pool von neuen, nicht in der Bilddatenbank enthaltenen, Aufnahmen vorgelegt. Das Ergebnis war eindeutig. Während die besten menschlichen DiagnostikerInnen 18,8 Bilder von 30 richtig hatten, schafften die besten Maschinen 25,4 richtige Klassifizierungen. Für Erstautor Philipp Tschandl von Universitätsklinik für Dermatologie der MedUni Wien nicht überraschend: „Zwei Drittel aller teilnehmenden Maschinen waren besser als der Mensch, das Ergebnis hat sich bei ähnlichen Versuchen in den vergangenen Jahren auch schon abgezeichnet.“
Kein Ersatz für den Menschen
Zwar ist die Maschine bei der Bilderkennung in diesem Experiment klar überlegen, doch ersetzt sie den Menschen bei der Diagnose nicht. Philipp Tschandl: „Der Computer analysiert nur eine optische Momentaufnahme und ist dabei richtig gut. Zur Diagnose eines Patienten gehört aber auch die Verlaufsbeobachtung, die Einschätzung, ob der Betroffene aufgrund diverser Begleitumstände ein Risikopatient ist, wie sich eine Veränderung der Haut durch Ertasten anfühlt und der Vergleich mit anderen Muttermalen am Körper. Die Interpretation der Ergebnisse ist weiterhin dem Menschen überlassen.“
Die Künstliche Intelligenz hat noch Verbesserungspotenzial. So waren die Maschinen bei der Einschätzung von Daten aus Zentren, die keine Trainingsbilder zur Verfügung gestellt hatten, aufgrund der uneinheitlichen Bildqualitäten deutlich schwächer.
Bei den Menschen zeigte sich deutlich, dass Erfahrung ganz besonders wichtig ist. Am besten schnitten jene TeilnehmerInnen ab, die mindestens zehn Jahre an Erfahrung in der Früherkennung von Hautkrebs hatten.
Literatur
“Comparison of the accuracy of human readers versus machine-learning algorithms for pigmented skin lesion classification: an open, web-based, international, diagnostic study”
Philipp Tschandl, Noel Codella, Bengü Nisa Akay, Giuseppe Argenziano, Ralph P Braun, Horacio Cabo, David Gutman, Allan Halpern, Brian Helba, Rainer Hofmann-Wellenhof, Aimilios Lallas, Jan Lapins, Caterina Longo, Josep Malvehy, Michael A Marchetti, Ashfaq Marghoob, Scott Menzies, Amanda Oakley, John Paoli, Susana Puig, Christoph Rinner, Cliff Rosendahl, Alon Scope, Christoph Sinz, H Peter Soyer, Luc Thomas, Iris Zalaudek, Harald Kittler; http://www.thelancet.com/journals/lanonc/article/PIIS1470-2045(19)30333-X/fulltext