Politische Einflussnahme Studie warnt: Staaten können KI-Antworten spürbar prägen

Frau vor einem Laptop
Aktuelle Forschungsergebnisse zeigen, dass staatlichverbreitete Informationen eine große Rolle für die Antworten von KI-Modellen spielen können
© Kan Kingpetcharat / Getty Images
KI-Modelle klingen oft neutral – doch die zum Training genutzten Informationen können durchaus mit einer Agenda verbunden sein. Wie Staaten Einfluss nehmen können

Staatliche Akteure können einer Studie zufolge erheblichen Einfluss darauf haben, in welcher Weise KI-Chatbots Nutzern antworten. Regierungen könnten große Sprachmodelle indirekt beeinflussen, indem sie online verfügbare Informationen gestalten, mit denen die Systeme trainiert werden, schreibt ein Team mehrerer US-Universitäten – darunter die University of Oregon, die New York University und die Princeton University – in der Fachzeitschrift "Nature". 

KI nicht unbedingt neutral

"Oft wird über KI so gesprochen, als würde sie auf neutrale Weise aus dem Internet lernen", sagte Hannah Waight, eine der Autorinnen von der University of Oregon. "Das tut sie aber nicht. Sie lernt aus Informationen, die von Institutionen und Machtverhältnissen geprägt sind – und diese Informationsumgebungen können messbare Spuren in den Aussagen der Modelle hinterlassen."

KI gegen Mensch: Spiel, Satz, Maschinen-Sieg? So gut ist Tischtennis-Roboter "Ace" wirklich
© Sony AI
Spiel, Satz, Maschinen-Sieg? So gut ist Tischtennis-Roboter "Ace" wirklich
© Sony AI

Das Forschungsteam nennt das Phänomen institutionellen Einfluss und hat diesen mit mehreren Teilstudien vor allem am Beispiel Chinas untersucht. Gefunden wurden mehrere Hinweise darauf, dass die von der Regierung verbreiteten Informationen eine große Rolle für die Antworten von KI-Modellen spielen. 

  • Bei einer Analyse offener KI-Trainingsdaten aus einem Open-Source-Datensatz gab es erhebliche Textüberschneidungen mit Formulierungen aus Staatsmedien. Besonders stark ausgeprägt war dies bei Dokumenten, in denen es um politische Institutionen oder die politische Führung ging.
  • Bei Tests mit kommerziellen Modellen wie Chat-GPT vervollständigten die Modelle charakteristische Formulierungen von Staatsmedien häufiger korrekt als Formulierungen aus allgemeinen Trainingsdaten. Dies deuten die Forscher so, dass diese Formulierungen im Training der Modelle präsent waren, mutmaßlich sogar häufiger.
  • In einem eigenen Experiment testete das Team zudem mit einem kleineren Open-Source-Sprachmodell, ob sich das Verhalten der KI veränderte, wenn sie gezielt mit geskripteten Nachrichten, wie sie in chinesischen Staatsmedien vorkommen, nachtrainiert wurden. In fast 80 Prozent der Fälle führte dies dazu, dass Modell sich positiver über die chinesische Regierung äußerte als das nicht-modifizierte Basismodell.
  • Das Team ging zudem von der Hypothese aus, dass staatliche Informationen vor allem Einfluss auf Informationen in der heimischen Sprache haben. Dies bestätigte sich in einer weiteren Teilstudie: Bei identischen Fragen mit Bezug auf China waren die auf Chinesisch generierten Antworten in rund drei Viertel der Fälle regierungsfreundlicher als Antworten auf Englisch. Bei Fragen zu anderen Themen gab es diese Unterschiede nicht.
  • Zuletzt weitete das Team seinen Blick auf weitere Länder aus und stellte dazu in 37 Ländern KI-Anfragen. In Ländern mit geringerer Pressefreiheit – nach dem World Press Freedom Index – stellten die Modelle ihre Regierungen im Schnitt demnach positiver dar als auf Englisch. Deutschland wurde nicht betrachtet.

"Bei staatlich koordinierten Inhalten geht es nicht nur darum, was in den offiziellen Medien erscheint", erklärt der beteiligte Soziologe Brandon Stewart von der Princeton University. Würden dieselben Formulierungen immer wieder verwendet, in Apps und auf Webseiten, wirkten sie irgendwann wie allgemeine Informationen. Sobald staatlich koordinierte Inhalte in Trainingsdaten von KI-Modellen enthalten seien, könnten diese sie so aufbereiten, dass sie wie neutrale, objektive Informationen aussähen und klängen.

Training von Chatbots nicht leicht überprüfbar

Es sei wichtig, dies im Hinterkopf zu haben, wenn man KI nutze, betonen die Autoren. Sie geben dabei eine Einschränkung ihrer Erkenntnisse zu bedenken: Nicht für alle verfügbaren, gängigen KI-Modelle kann der jeweilige staatliche Einfluss leicht überprüft werden, weil oft intransparent bleibt, mit welchen Informationen KI-Modelle trainiert werden.