Wie intelligent sind Intelligenztests?

Salveschild, Foto: Stefan Groß

Um IQ-Tests wird gerne ein enormes Aufsehen gemacht und Leute, die sie hinterfragen, werden regelmäßig so hingestellt, als ob sie keine Ahnung hätten. Doch eine scharfe Kritik ist eigentlich angebracht.

Ursprünglich hat der französische Psychologe Alfred Binet im Auftrag des Bildungsministeriums den ersten solchen Test entwickelt, um zu bestimmen, welche Schulkinder mit dem normalen Unterricht überfordert sind. Der Binet-Simon-Intelligenztest wurde 1905 veröffentlicht. Kurioserweise wurde Henri Poincaré, damals schon als einer der größten Mathematiker aller Zeiten gefeiert, von Binet mit diesem Test untersucht und er versagte völlig. Ob nun der Test oder der geniale Mathematiker versagte ist nicht ganz klar. Binet jedenfalls ließ sich offensichtlich nicht von diesem Vorfall entmutigen und der Siegeszug des IQs begann.

Die Aufgaben in einem solchen Test sollen die Fähigkeit erfassen Regelmäßigkeiten zu entdecken und abstrakt zu denken. Man muss Gemeinsamkeiten und Gegensätze finden, Zahlenreihen müssen fortgeführt und Rechenaufgaben gelöst werden, Puzzle sollen zusammengesetzt und Figuren im Kopf gedreht werden. Die symmetrische IQ-Skala ist so aufgebaut, dass 50 Prozent der Bevölkerung zwischen 90 und 110 liegen. 10 Prozent liegen über 120 oder unter 80 und zwei Prozent haben einen IQ von über 130 bzw. unter 70. Die zwei Prozent, die bei über 130 angesiedelt werden, nennt man „hochbegabt“, diejenigen unter der Grenze von 70 werden als „minderbegabt“ bezeichnet.

Schon in der Schule zeigt sich, dass diese Werte nur begrenzte Aussagekraft besitzen. Die Korrelation zwischen IQ und Schulleistung liegt bei ca. 0,5. Dass Kinder unterschiedliche Leistungen erbringen, lässt sich also zu ungefähr 25 Prozent durch den IQ erklären und zu ungefähr 75 Prozent durch andere Faktoren.

In einer Studie von Angela Duckworth aus dem Jahr 2005 wurde beobachtet, dass Selbstdisziplin mehr als doppelt so viel Einfluss auf den Notendurchschnitt hat wie der Intelligenzquotient. Andere Aspekte, von denen wir wissen, dass sie eine bedeutende Rolle für das Abschneiden in der Schule spielen, sind die Erwartungshaltung der Eltern und zu einem gewissen Grad auch die soziale Schichtzugehörigkeit. Wahrscheinlich haben zusätzlich noch einige geistige Fähigkeiten, die unabhängig vom sogenannten „allgemeinen Intelligenzfaktor“ sind, Einfluss. Wenn man die Diskrepanz von IQ und Schulerfolg der mangelhaften Ausschöpfung des IQ-Potentials zuschreibt, zäumt man das Pferd von hinten auf: Kinder die in der einschlägigen Literatur als „schulische Minderleister“ bezeichnet werden, könnte man ja, wenn man statt ihres IQs beispielsweise ihren Ehrgeiz oder andere Parameter als Referenz nimmt, als „schulische Überleister“ bezeichnen. Der Zusammenhang zwischen IQ und Schulleistung ist nun mal relativ gering. Diese Tatsache „nur“ den Umständen zuzuschreiben ist irreführend, da es den Eindruck erweckt als ob der IQ eigentlich vorgibt wie gut jemand in der Schule sein kann und die anderen Faktoren lediglich Stellschrauben sind. Dabei ist der IQ selbst eine Stellschraube.

Auch im Berufsleben sind die Zusammenhänge von IQ und Leistung eher bescheiden. In den meisten Untersuchungen hat man eine Korrelation von etwa 0,2 zwischen dem Erfolg im Arbeitsleben und den gemessenen kognitiven Fähigkeiten ermittelt. Zum Vergleich: der IQ korreliert 0,25 mit Kurzsichtigkeit, rund 0,2 mit der Körpergröße und ebenfalls 0,2 mit der Fähigkeit seine Zunge rollen zu können.

Bei der Voraussage von wissenschaftlichen Leistungen unter Akademikern versagt das IQ-Konzept schließlich völlig. Studien, die den IQ von Wissenschaftlern mit der Menge an Publikationen oder der Zahl an Zitierungen in Beziehung setzen, kommen zu dem Schluss, dass die Korrelation bei null liegt, oder sogar leicht negativ ist.

In einer 1921 von dem Psychologen Lewis Terman initiierten Langzeitstudie mit über 1.500 Hochbegabten, musste man zudem feststellen, dass die Teilnehmer sowohl akademisch als auch gesellschaftlich hinter den hohen Erwartungen zurückblieben. Bezeichnenderweise wurden ausgerechnet zwei spätere Nobelpreisträger in Physik, William Shockley und Luis Álvarez, aufgrund zu niedriger IQs nicht für das Projekt zugelassen. Keiner der aufgenommenen Überflieger erhielt eine Auszeichnung, die nur annähernd so prestigeträchtig ist. Auch andere Koryphäen der Wissenschaft, wie Richard Feynman, James Watson und E. O. Wilson, wären nicht in diese Studie aufgenommen worden.

Detlef Rost, der Leiter des Marburger Hochbegabtenprojekts, der größten Studie über Hochbegabung, die in Deutschland je durchgeführt wurde, definiert Hochbegabung als die Fähigkeit, sich schnell Wissen anzueignen und dieses in vielen verschiedenen Situationen zu nutzen. Als Instrument zur Diagnose der Hochbegabung verwendet er wie üblich IQ-Tests. Doch die Frage ist: Messen diese tatsächlich die generelle Anpassungsfähigkeit, die er beschreibt?

„Zentrale Aspekte adaptiver Intelligenz wie Kreativität, Phantasie und Sinngebung können nur schlecht von IQ-Tests abgebildet werden“, sagt Joachim Funke, Professor für Allgemeine und Theoretische Psychologie an der Universität Heidelberg und Experte auf dem Gebiet des Problemlösens, auf meine Anfrage. Er hält die Tests für eine altertümliche Methode zur Erfassung der Intelligenz und verweist in diesem Zusammenhang auf den amerikanischen Intelligenzforscher Robert Sternberg.

„Sternberg sagt, seit der erste IQ-Test vor rund 100 Jahren eingeführt wurde, haben wir nichts dazu gelernt“, erklärt Funke. „Nach dem Motto ‚Und täglich grüßt das Murmeltier‘ kommen in schöner Regelmäßigkeit alte Intelligenzkonzeptionen in neuen Schläuchen auf den Tisch der Forschung.“

Der Aufbau von IQ-Tests hat sich in einem Jahrhundert nicht wesentlich verändert. Es scheint fast so, als ob man sich mit der erstbesten Idee zufriedengegeben hätte und die ganze Testkonstruktion seitdem nach dieser Blaupause ausrichtet.

Tatsächlich gibt es noch nicht einmal eine allgemein akzeptierte Definition von Intelligenz. Das Mantra „Intelligenz ist, was Intelligenztests messen“ ist populär, aber letztlich ein Zirkelschluss. Um Validität zu gewährleisten muss man eine externe Größe als Maßstab einfügen. Was eine angemessene Vergleichsgrundlage sein könnte ist allerdings umstritten.

Es hat sich außerdem gezeigt, dass innerhalb des vergangenen Jahrhunderts der IQ unserer Gesellschaft um 30 Punkte gestiegen ist. Damit der Durchschnitt weiterhin einem Wert von 100 entspricht, werden die Tests regelmäßig angepasst. Dieses immer noch ungeklärte Phänomen nennt sich Flynn-Effekt und hat zur Konsequenz, dass die Generation unserer Ururgroßeltern nach heutigem Standard als geistig zurückgeblieben eingestuft werden würde. Warum das so ist, darüber wird unter den Wissenschaftlern nur spekuliert. Meist werden gesundheitliche Gründe verantwortlich gemacht: bessere Ernährung und eine effektivere Behandlung von Krankheiten die das Gehirn schädigen können. Andererseits würde das aber bedeuten, dass unsere Vorfahren tatsächlich im Durchschnitt auf dem Niveau heutiger geistig behinderter Personen lagen. Eine andere Theorie besagt, dass es ganz einfach ein Trainingseffekt ist. Also dass sich die Fertigkeit im Umgang mit IQ-Testaufgaben verbessert hat, ohne die wirkliche Intelligenz zu beeinflussen. Was allerdings wiederum ein Armutszeugnis für die Tests wäre.

Solche gewaltigen IQ-Schwankungen treten heute auch bei den Ergebnissen auf, je nachdem ob die Testpersonen während der Arbeitszeit oder im Urlaub getestet werden. Unterschiede von 20 IQ-Punkten sind dabei keine Seltenheit. Zudem haben mehrere Studien gezeigt, dass Teilnehmer, denen Geld für ein gutes Ergebnis in einem Intelligenztest versprochen wurde, signifikant bessere Resultate liefern (durchschnittlich fast 10 IQ-Punkte, bei höheren Summen wurde ein Zuwachs von 25 IQ-Punkten festgestellt). In Bezugnahme auf diese Erkenntnis hat eine Untersuchung, die 2011 an der University of Pennsylvania durchgeführt wurde, ergeben, dass Intelligenztests zu einem großen Teil die Testmotivation messen.

Bildet der IQ also eher so etwas wie eine gewisse Geisteshaltung ab? Und falls er das tut, macht es überhaupt einen Unterschied? Der Hang der Wissenschaft zur Systematisierung treibt bisweilen seltsame Blüten. Man entwickelt ein Testwerkzeug, das einem eine Zahl liefert, aber was diese Zahl aussagt, außer, dass jemand in diesem Test genau so abgeschnitten hat, das ist sehr unklar. Noch unklarer ist der Nutzen, den das Wissen über diese Zahl überhaupt haben soll. Manchmal funktioniert ein Instrument eben nur gut, weil das Problem, das es lösen soll, gleich miterfunden wird. Da kann man leicht vergessen, dass es gar keinen tieferen Zweck erfüllt.

Finanzen

Über Zimmerschied Patrick 5 Artikel
Patrick Zimmerschied hat Philosophie und Politikwissenschaft an der TU Darmstadt studiert und war dort von 2008 bis 2013 Hilfskraft am Lehrstuhl für Wissenschaftsphilosophie. Sein Artikel „Grüne Gentechnik: Die Argumente der Gegner“, der 2012 bei NovoArgumente erschien, wurde von dem weltweit führenden Pflanzengenetiker Detlef Weigel als einer der besten Artikel über Grüne Gentechnik der neueren Zeit bezeichnet. Weitere veröffentlichte Artikel sind „Grexit: Euroland ist ausgebrannt“, ebenfalls bei NovoArgumente, und „Über Filmzensur, Moral und Freiheit in Deutschland“ bei artechock.