Ärztin mit Röntgenbild Shutterstock/Cryptographer

Künstliche Intelligenz fast nutzlos bei Covid-Verdacht

2 Min. Lesezeit

Zu Beginn der Pandemie hatte man versucht, mit Hilfe neuer Softwareprogramme, eine Covid-Erkrankung schneller zu diagnostizieren. Doch kaum eine der mehrere Hundert Entwicklungen hat etwas bewirkt, und einige Diagnose-Tools sollen sogar geschadet haben. Das ist das Ergebnis mehrerer Studien

So fasst einem Artikel des "MIT Technology Reviews" zufolge der vom britischen Turing Institute kürzlich vorgestellte Bericht die Diskussionen in einer Reihe von Workshops zusammen, die Ende 2020 stattfanden. Der klare Konsens war, dass KI-Werkzeuge höchstens geringe Auswirkungen auf die Bekämpfung von Covid hatten.

Für den Einsatz im Krankenhaus nicht geeignet

Dies deckt sich mit den Ergebnissen von zwei großen Studien, in denen Hunderte Vorhersagetools bewertet wurden. Die Wissenschaftler:innen einer im "British Medical Journal" publizierten Übersichtsarbeit hatten 232 Algorithmen zur Corona-Diagnose oder zur Vorhersage des Krankheitsverlaufs von Erkrankten untersucht. Sie kamen zu dem Ergebnis, dass keines der Tools für den Einsatz in Krankenhäusern geeignet ist. Nur zwei Vorhersagetools werteten sie als vielversprechend genug für künftige Tests. "Es ist schockierend", sagt die Hauptautorin der Studie, Laure Wynants. "Ich hatte einige Bedenken, aber das Ergebnis hat meine Befürchtungen noch übertroffen".

Wynants' Studie wird durch eine Untersuchung von Derek Driggs, einem Forscher für maschinelles Lernen an der Universität Cambridge gestützt, die in Fachmagazin "Nature Machine Intelligence" veröffentlicht wurde. Sein Team hatte Deep-Learning-Modelle für die Diagnose von Husten und die Vorhersage des Patiente:innenrisikos anhand von Röntgenaufnahmen und Computertomographien (CT) des Brustkorbs untersucht. Bei den 415 veröffentlichten Tools kamen sie wie Wynants und ihre Kolleg:innen zu dem Schluss, dass keines davon für den klinischen Einsatz geeignet war.

KI hat den Test nicht bestanden

"Diese Pandemie war ein großer Test für KI und Medizin", sagte Driggs gegenüber dem MIT Technology Review. "Es hätte viel dazu beigetragen, die Öffentlichkeit auf unsere Seite zu bringen", sagt er. "Aber ich glaube nicht, dass wir diesen Test bestanden haben."

Als eine Ursache für das Versagen der KI stellten die Forscher:innen fest, dass beim Training und den Tests der Diagnose-Tools stets dieselben grundlegenden Fehler gemacht wurden. Vor allem falsche Annahmen über die Daten, die mangels Alternativen oft aus unbekannten Quellen stammten, führten häufig dazu, dass die Modelle nicht wie behauptet funktionierten. Einige KI-Tools wurden mit denselben Daten getestet werden, mit denen sie trainiert wurden, was sie genauer erscheinen lässt, als sie sind. Dass einige der Algorithmen bereits in Krankenhäusern eingesetzt und von privaten Entwicklern vermarktet werden, könne daher den Patienten geschadet haben, meint Laure Wynants.

Viel Potenzial, schlechte Daten

Trotz der vernichtenden Studienergebnisse sind Wynants und Driggs davon überzeugt, dass KI das Potenzial hat, zu helfen. Sie sind allerdings besorgt, dass KI schaden könnte, wenn sie falsch eingesetzt wird, da sie Diagnosen übersehen oder das Risiko für Patient:innen unterschätzen könnte. "Es gibt einen großen Hype um maschinelle Lernmodelle und was sie heute können", sagt Driggs. Die Studienergebnisse hätten allerdings gezeigt, dass sich die Art und Weise, wie KI-Werkzeuge entwickelt werden, ändern muss.

Newsletter Anmeldung

Jede Woche aktuelle News und Hintergründe direkt in Ihr Postfach

Anmelden