Künstliche-Intelligenz-Modelle scheitern an einem von Menschen mühelos bestandenem Aufmerksamkeits-Test
Eine neue Studie zeigt, dass fortschrittliche KI-Modelle wie GPT-4o, Claude 3.5 Sonnet und Gemini im klassischen Stroop-Test bei langen Wortlisten massiv an Genauigkeit verlieren, während sie bei kurzen Listen noch hohe Werte erreichen. Im Gegensatz dazu können Menschen auch bei längeren Aufgaben ihre automatische Leseimpulse unterdrücken und die ursprüngliche Anweisung beibehalten, was auf einen fundamentalen Unterschied zwischen den biologischen Aufmerksamkeitsmechanismen des menschlichen Gehirns und den Transformer-basierten Systemen der künstlichen Intelligenz hinweist.

Kurzfassung
Warum das wichtig ist
- Eine neue Studie zeigt, dass fortschrittliche KI-Modelle wie GPT-4o, Claude 3.5 Sonnet und Gemini im klassischen Stroop-Test bei langen Wortlisten massiv an Genauigkeit verlieren, während sie bei kurzen Listen noch hohe Werte erreichen.
- Im Gegensatz dazu können Menschen auch bei längeren Aufgaben ihre automatische Leseimpulse unterdrücken und die ursprüngliche Anweisung beibehalten, was auf einen fundamentalen Unterschied zwischen den biologischen Aufmerksamkeitsmechanismen des menschlichen Gehirns und den Transformer-basierten Systemen der künstlichen Intelligenz hinweist.
- Obwohl die fortschrittlichsten KI-Modelle der Gegenwart in komplexen Aufgaben wie Programmierung, Analyse und Texterstellung außergewöhnliche Leistungen erbringen, weisen sie eine erhebliche Schwäche in einem grundlegenden kognitiven Prozess auf, den das menschliche Gehirn mühelos steuern kann.
SvyTech-Check
Redaktionelle Einordnung
Kernpunkt
Eine neue Studie zeigt, dass fortschrittliche KI-Modelle wie GPT-4o, Claude 3.5 Sonnet und Gemini im klassischen Stroop-Test bei langen Wortlisten massiv an Genauigkeit verlieren, während sie bei kurzen Listen...
Warum relevant
Eine neue Studie zeigt, dass riesige Sprachmodelle wie GPT-5, Claude und Gemini in einem klassischen psychologischen Test zur Messung.
Einordnung
SvyTech ordnet die Meldung aus scitechdaily.com als Teil des Themenfelds Technologie ein und verweist auf den Originalartikel, damit Leser Fakten, Quelle und Kontext nachvollziehen koennen.
Eine neue Studie zeigt, dass riesige Sprachmodelle wie GPT-5, Claude und Gemini in einem klassischen psychologischen Test zur Messung. Wissenschaftler betonen, dass die künstliche Intelligenz, selbst bei steigender Rechenleistung, im Bereich des langfristigen Aufmerksamkeitsmanagements fundamental anders funktioniert als der menschliche Geist.
Was ist der Stroop-Test? Der Stroop-Test ist ein klassisches Experiment, das seit vielen Jahren in der Psychologie verwendet wird, um Mechanismen der Aufmerksamkeit und mentaler Kontrolle zu untersuchen. In diesem Test werden den Teilnehmern Wörter mit Farbbezeichnungen angezeigt, deren Bedeutung jedoch nicht mit der Farbe der Tinte übereinstimmt.
Beispielsweise wird eine Person aufgefordert, nicht das Wort zu lesen, sondern die Farbe der Tinte anzugeben – also bei einem mit blauer Tinte geschriebenen roten Wort die Farbe Blau zu nennen. Da Menschen daran gewhnt sind, Wrter automatisch zu lesen, erfordert das Unterdrcken dieser automatischen Reaktion geistige Anstrengung und exekutive Kontrolle.
Technik und Auswirkungen
Quellenprofil
Quelle und redaktionelle Angaben
- Quelle
- scitechdaily.com
- Canonical
- https://svytech.de/artikel/kunstliche-intelligenz-modelle-scheitern-an-einem-von-menschen-muhelos-bestandenem-aufmerk
- Quell-URL
- https://scitechdaily.com/even-gpt-5-failed-this-human-attention-test/
Aehnliche Inhalte
Verwandte Themen und interne Verlinkung
Weitere Artikel aus aehnlichen Themenfeldern, damit Leser direkt im selben Kontext weiterlesen koennen.

KI-Mythos im Krypto-Mining: Verschwendet Pearl Network Energie sinnlos?
Eine neue akademische Studie wirft dem Layer-1-Blockchain-Projekt Pearl vor, unter dem Vorwand der Künstlichen Intelligenz enorme Mengen an Energie und Rechenleistung zu verschwenden, da das Netzwerk lediglich zufällige Matrixmultiplikationen validiert, ohne echte KI-Berechnungen durchzuführen. Die Untersuchung belegt, dass Miner Belohnungen für sinnlose Daten erhalten können, was zu einem Anstieg der Hardware-Vermietungskosten für KI-Forscher und zu Vorwürfen finanzieller Arbitrage bei der Partnerschaft mit Together AI führt.
14.06.2026
Live Redaktion

