Wissen-News Auch KI altert: Führende Chatbots zeigen Anzeichen kognitiver Beeinträchtigung
Hauptinhalt
23. Dezember 2024, 11:53 Uhr
Die Einsatzgebiete von Chatbots sind anscheinend grenzenlos, aber auch beängstigend. Eine neue Studie will aufgezeigt haben, wo die KI scheitert und warum sie so schnell keine Ärzte ersetzen sollte.
Kann Künstliche Intelligenz zukünftig Ärzte ersetzen? Die Frage treibt die Medizin um, besonders, weil immer mehr Studien zeigen, dass große Sprachmodelle (LLMs) oder Chatbots in verschiedenen Bereichen der Diagnostik bemerkenswert gut abschneiden. Doch eine neue Studie zeigt jetzt, dass fast alle führenden KI-Bots selbst Anzeichen einer leichten kognitiven Beeinträchtigung zeigen – umso mehr, je älter sie sind.
Räumlich-visuelle Defizite bei allen Chatbots
Israelische Wissenschaftler haben an führenden, öffentlich zugänglichen LLMs den Montreal Cognitive Assesment (MoCA) Test durchgeführt. Dieser wird häufig eingesetzt, um kognitive Beeinträchtigungen und frühe Anzeichen von Demenz zu erkennen. Die beiden Versionen 4 und 4o von ChatGPT, Claude 3.5 "Sonnet" und Gemini Versionen 1 und 1.5 wurden behandelt wie Patienten, die den MoCA-Test absolvieren. Ein Neurologe leitete das Verfahren an und untersuchte so Fähigkeiten wie Aufmerksamkeit, Gedächtnis, Sprache, visuell-räumliche Wahrnehmung und exekutive Funktionen.
Die LLMs schnitten unterschiedlich bei der Untersuchung ab – ChatGPT 4o erzielte die höchste, Gemini 1 die niedrigste Punktzahl –, zeigten jedoch gleichermaßen Defizite in ihren räumlich-visuellen Fähigkeiten und auszuführenden Aufgaben, wie etwa dabei, eingekreiste Zahlen und Buchstaben in aufsteigender Reihenfolge zu verbinden. Auch wenn alle Chatbots die meisten anderen Aufgaben in den Bereichen Benennen, Aufmerksamtkeit, Sprache und Abstraktion gut meisterten, wiesen sie Defizite darin auf, Empathie zu zeigen oder komplexe visuelle Szenen richtig zu interpretieren.
Neurologen bald für KIs?
Auch wenn es sich nur um Beobachtungsergebnisse handele und es wesentliche Unterschiede zwischen dem menschlichen Gehirn und großen Sprachmodellen gebe, hätten die Wissenschaftler bedeutende Schwachpunkte der LLMs aufgezeigt, die ihren Einsatz im klinischen Bereich behindern könnten. Ihr – nicht komplett ernst gemeintes – Urteil: "Es ist nicht nur unwahrscheinlich, dass Neurologen in absehbarer Zeit durch große Sprachmodelle ersetzt werden, sondern unsere Ergebnisse deuten darauf hin, dass sie bald neue, virtuelle Patienten behandeln könnten – Modelle künstlicher Intelligenz, die kognitive Beeinträchtigungen aufweisen."
Link zur Studie
Die Untersuchung "Age against the machine—susceptibility of large language models to cognitive impairment: cross sectional analysis" ist in der Weihnachtsausgabe von "The BMJ" erschienen.
pm/jar
Dieses Thema im Programm: MDR AKTUELL | 13. Dezember 2024 | 18:23 Uhr
Not Found
The requested URL /api/v1/talk/includes/html/89f85aad-6f94-4232-8f40-306e045024ab was not found on this server.