Guangzhou. Chinesische Forscher haben ein Programm entwickelt, dass auf Grundlage schriftsprachlicher Daten, treffendere Diagnosen erstellen konnte, als eine Vergleichsgruppe von relativ jungen Ärzten. Erfahrenen Ärzten unterlag die KI dagegen.
Die chinesisch-amerikanische Forschergruppe um Dr. Kang Zhang von der Guangzhou Medical University (Guangzhou/China) testete das KI-System durch einen Vergleich mit zwanzig Ärzten, die in fünf Gruppen aufgeteilt waren. Kriterium für die Zuordnung war die Berufserfahrung. Im Hinblick auf das F1-Maß, das Genauigkeit und Trefferquote von Daten miteinander kombiniert, lag das KI-System mit 0,885 besser als die beiden Gruppen mit unerfahrensten Medizinern, aber schlechter als die drei Gruppen mit den erfahrensten Medizinern. Die Ärztegruppe mit der höchsten durchschnittlichen Berufserfahrung erreichte einen Wert von 0,923.
Die Forscher trainierten ihr System anhand einer großen Datenmenge: 101,6 Millionen Datenpunkte von 1,362 Millionen Patienten im Alter von 0 bis 18 Jahren. Die Daten entstanden von Januar 2016 bis Juli 2017 im Guangzhou Women and Children’s Medical Center bei der Behandlung von Patienten, vorwiegend Kinder im Vorschulalter.
Krankheitssymptome und andere Angaben mit Ausnahme der Diagnose entnahm das KI-System elektronischen Gesundheitsakten. Anhand der Daten erstellte das Programm eine Diagnose, die im Nachhinein mit der Diagnose des behandelnden Arztes abgeglichen wurde.
Ärzte bleiben unersetzlich
Dr. Hermann Josef Kahl vom Berufsverband der Kinder- und Jugendärzte in Köln begrüßte den diagnostischen Erfolg, beurteilte das Modell aber mit Skepsis. Es möge sein, dass KI-Systeme viel könnten, so Kahl, „doch am Ende muss immer ein Arzt alle Befunde und Ergebnisse beurteilen und die Diagnose stellen.“ Die direkte Begegnung von Arzt und Patient sei nicht zu ersetzen.
Die Studie zeige das Potenzial von künstlicher Intelligenz zur Entscheidungsunterstützung des Arztes, sagt Prof. Thomas Neumuth von der Universität Leipzig. Im Gegensatz zur ärztlichen Diagnose seien die angewendeten Algorithmen aber nicht rückverfolgbar und es könne nicht erklärt werden, wie eine Entscheidung zustande kommt.
Kritik am Studiendesign äußerte auf Anfrage der Deutschen Presseagentur (dpa) Prof. Lorenz Grigull von der Medizinischen Hochschule Hannover. Ihn stört, dass in der Studie nur eine kleine Auswahl kindermedizinischer Diagnosen verwendet wurde. Die Frage, ob auch deutsche Patienten künftig mit vergleichbaren algorithmischen Befunden rechnen könnten, verneint er. Weder Auch lägen ausreichend Patientendaten elektronisch vor, noch seien diese vergleichbar systematisiert.
Komplementärer Charakter
Bereits im Januar war in „Nature Medicine“ ein KI-System vorgestellt worden, das seltene Erbkrankheiten anhand von Porträtbildern von Patienten erkennt. An der internationalen Studie beteiligt war auch Prof. Peter Krawitz vom Uniklinikum Bonn. Er betont den Nutzen von KI. Bei einem Anfangsverdacht könne die Software die Zahl der möglichen genetischen Ursachen eingrenzen und so die Diagnose beschleunigen, so Krawitz.
Nach Ansicht der Forscher um Kang Zhang liefert die vorliegende Studie einen weiteren Machbarkeitsnachweis, dass ein KI-System bei Daten auf der Basis natürlicher Sprache gute diagnostische Ergebnisse erzielen könne.
Das entwickelte Programm könne Ärzten helfen, große Datenmengen zu bewältigen und Entscheidungen zu treffen, welche Patienten am dringendsten behandelt werden müssten. Zudem könne es Mediziner in Situationen unterstützen, in denen sie über wenig Erfahrung verfügen. Etwa bei der Diagnose seltener oder hochkomplexer Krankheiten.
Quelle: dpa