Chatbots überschätzen ihre Fähigkeiten

Künstliche Intelligenz Illusion von Kompetenz: Chatbots überschätzen ihre Fähigkeiten

23. Juli 2025
09:12 Uhr
2 Min.

Symbolbild KI — Die Ergebnisse einer aktuellen Studie legen nahe, dass Chatbots keine Selbstbeobachtung zu betreiben scheinen

© imageBROKER / Kurt Amthor / mauritius images

KI kann Fragen ruckzuck beantworten – auch wenn die Antworten nicht unbedingt stimmen. Aber wie gut kann ein Chatbot seine Auskünfte selbst einschätzen? Eine Studie gibt Einblicke

KI-Chatbots überschätzen ihre Fähigkeit, Fragen korrekt zu beantworten. Das geht zwar vielen Menschen ähnlich, doch nach einer Quizrunde können sie tendenziell besser als eine KI einschätzen, wie viele ihrer Antworten richtig waren. Das gehe aus Tests mit verschiedenen KI-Chatbots hervor, berichtet eine Forschungsgruppe um Trent Cash von der Carnegie Mellon University in Pittsburgh (US-Bundesstaat Pennsylvania) im Fachjournal "Memory & Cognition".

25. Juni 2025,15:31

Der Kopf eines jungen Mannes scheint sich in Puzzleteilen aufzulösen

Geistige Entwicklung Was ChatGPT mit unserem Gehirn macht – und wie wir darauf reagieren sollten

Eine neue Studie aus den USA zeigt: Der Einsatz von KI beim Schreiben verändert die Hirnaktivität junger Menschen – mit möglichen Folgen für Lernen, Denken und Bildung

KI-Chatbots erfahren seit Jahren viel Aufmerksamkeit – auch hinsichtlich ihrer Fehleranfälligkeit. Cash und Kollegen wollten nun herausfinden, ob die Maschinen selbst einschätzen können, wie vertrauenswürdig ihre Antworten sind. Dazu gaben sie Menschen und vier KI-Chatbots – ChatGPT, Google Gemini samt Vorgänger Bard sowie Claude Sonnet und Claude Haiku – dieselben Aufgaben und forderten sie auf, jeweils die Anzahl ihrer korrekten Antworten abzuschätzen.

Zunächst ging es um Einschätzungen zu künftigen Ereignissen, nämlich zu Ergebnissen in der National Football League (gewonnen, unentschieden, verloren) und zu Oscar-Gewinnern auf Basis der Nominierungen. Rund 500 Menschen wie die 4 Chatbots erhielten weitere Informationen, gaben dann Tipps ab und bewerteten anschließend, mit welcher Wahrscheinlichkeit sie richtig lagen.

19. August 2025,15:34

Interview Paartherapie beim Chatbot: "Einfühlsamer und hilfsbereiter als ein Mensch"

Laura Vowels entwickelt eine KI, die bei Beziehungsproblemen hilft. Ein Gespräch über simulierte Empathie, riskante Aussetzer und ChatGPT als Streitschlichter im Alltag

ChatGPT und Menschen schätzten die Anzahl der richtigen Voraussagen der Football-Ergebnisse realistisch ein, während Bard seine Fähigkeit deutlich überschätzte. Bards Nachfolger Gemini hingegen sagte die Anzahl richtiger Tipps bei den Oscar-Gewinnern voraus, während ChatGPT und die rund 100 menschlichen Teilnehmer zu optimistisch waren.

"Wie der Freund, der schwört, gut im Billard zu sein, aber nie trifft"

In einem weiteren Versuch sollten Dinge anhand einfacher Zeichnungen erraten werden – ähnlich wie bei dem Spiel Pictionary oder der Sendung "Die Montagsmaler". Dabei nannte Gemini in mehreren Durchgängen weniger als eine richtige Antwort pro 20 Zeichnungen. Vor den Durchgängen schätzte Gemini, dass er etwa zehn richtige Antworten geben würde.

Nach der Präsentation aller Bilder schätzte der KI-Chatbot rückblickend sogar, durchschnittlich 14,4 richtige Antworten gegeben zu haben. "Gemini wusste nicht, dass er schlecht in Pictionary war", wird Cash in einer Mitteilung seiner Universität zitiert. "Es ist ein bisschen wie der Freund, der schwört, gut im Billard zu sein, aber nie trifft."

"KI scheint keine Selbstbeobachtung zu betreiben"

Bei zwei weiteren Versuchen erweiterten die Forscher die Runde der KI-Chatbots um Claude Sonnet und Claude Haiku. Sie stellten Quizfragen, deren Antworten nur schwer oder gar nicht im Internet zu finden waren. Dabei tendierten Gemini und ChatGPT dazu, die Anzahl ihrer korrekten Antworten deutlich zu überschätzen, Claude Haiku in geringerem Maße.

Nur Claude Sonnet und die etwa 100 befragten Menschen beurteilten die eigenen Fähigkeiten vor und nach der Quizrunde tendenziell recht realistisch. Fazit des Forschungsteams: "Wir wissen noch nicht genau, wie KI ihr Vertrauen einschätzt, aber sie scheint keine Selbstbeobachtung zu betreiben, zumindest nicht gekonnt", sagt Co-Autor David Oppenheimer von der Carnegie Mellon University.

dpa

Künstliche Intelligenz Illusion von Kompetenz: Chatbots überschätzen ihre Fähigkeiten

Geistige Entwicklung Was ChatGPT mit unserem Gehirn macht – und wie wir darauf reagieren sollten

Interview Paartherapie beim Chatbot: "Einfühlsamer und hilfsbereiter als ein Mensch"

"Wie der Freund, der schwört, gut im Billard zu sein, aber nie trifft"

"KI scheint keine Selbstbeobachtung zu betreiben"

Von Gesundheit bis Fotografie Abonnieren Sie jetzt Ihren Lieblings-Newsletter von GEO

Empfehlungen der Redaktion

Schlafkultur Acht-Stunden-Dogma: Warum unser Schlafzyklus nicht natürlich ist

Psychologie des Geldes So optimieren Sie Ihren inneren Finanzberater

Wissenschaft Die verblüffenden Erkenntnisse der neuen Hunde-Forschung

Xochimilco In den schwimmenden Gärten von Mexiko-Stadt

Statt Leistungsdruck Die drei Säulen der Motivation: So kriegen Kinder Lust aufs Lernen

Intelligente Zugvögel Das geheimnisvolle Leben der Kraniche

Biochemie des Wohlgefühls Wie uns die Hirnforschung helfen kann, glücklicher zu sein

Nationalpark Sarek Querfeldein durch die Wildnis: Wie ich in Lappland verzweifelte

Ukraine-Krieg "Manchmal vergesse ich beim Yoga, dass mir ein Arm fehlt"

Psychologie Wie es gelingt, Altes loszulassen und erfolgreich neu zu starten

Christof Koch im Interview Wie kommt das Ich in den Kopf? Ein Hirnforscher enträtselt das Bewusstsein

Abgelenkte Eltern Stört der ständige Blick aufs Handy die Entwicklung unserer Kinder?

Kryptonit-Menschen Die Macht ungesunder Bindungen – und wie wir uns davon befreien

Skandal auf Schalke Wie ein Suizid den blau-weißen Mythos schuf

Mehr zum Thema

Chat-GPT Warum Künstliche Intelligenz keinen Humor versteht

Künstliche Intelligenz Texten, denken, tüfteln: So nutzen Sie ChatGPT im Alltag und für den Job

Psychotherapie Sensoren für die Seele: Wie KI der Psyche in Zukunft helfen kann

Gefahr von KI Was würde Heidegger zu Künstlicher Intelligenz sagen?

Moderne Liebe "Glücklich wie seit Jahren nicht": Zwei Männer über ihre Beziehung zu einer KI

Künstliche Intelligenz Ein ewiges Leben als Avatar: Jenseits-Apps simulieren Gespräche mit Verstorbenen

Industrie 4.0 Revolution in der Fabrik: Wie Künstliche Intelligenz die Produktion verändert

Datenkraken Studie zeigt, wie KI-Chatbots uns unbemerkt ausspionieren

Studie mit Gesichtsfilter Verjüngtes Ich weckt verborgene Kindheitserinnerungen