Können Raben und Affen wie Menschen planen?

von B. Scholl

Studium Integrale Journal
26. Jahrgang / Heft 2 - Oktober 2019
Seite 95 - 98

Zusammenfassung: Können Affen ähnlich wie Menschen denken? Einige Studien konnten scheinbar zeigen, dass Affen für die Zukunft planen. Eine Untersuchung von Johan Lind aus dem Jahr 2018 ergab jedoch, dass Menschenaffen und sogar Raben nur Aufgaben lösen konnten, die keine menschlichen Denkprozesse benötigen. Menschenaffen entwickeln keine Gedankenszenarien über zukünftige Ereignisse wie der Mensch. Das müssen sie auch nicht, da einfache Verhaltensbefehle mit Gewinnmaximierung zu den gleichen Lernleistungen führen, wie mittels eines Computerprogramms nachgewiesen werden konnte. Mit diesem Ergebnis erscheinen bisherige Verhaltensstudien in einem ganz anderen Licht: Affen planen wohl, ohne dabei menschlich über die Zukunft nachzudenken.

Johan Lind, Außerordentlicher Professor für Verhaltensbiologie am Zentrum für Kulturelle Evolution in Stockholm, hat eine bahnbrechende Studie zu der Frage, wie Affen eigentlich denken, herausgebracht (Lind 2018). Die Fragestellung war, herauszufinden, ob die Art und Weise, mit der Menschenaffen Handlungen planen, der von Menschen ähnelt. Davon wurde bisher in vielen Studien ausgegangen: „Es wurde [bisher] geschlussfolgert, dass mehrere Arten ähnlich wie der Mensch flexibel für die Zukunft planen. Die Idee ist, dass diese Art der Planung das Ergebnis eines flexiblen mentalen Mechanismus ist, der verschiedene zukünftige Zustände aus aktuellen Informationen simulieren kann.“¹

Abb. 1: Die Grafik symbolisiert die Überschätzung von kognitiven Fähigkeiten von Schimpansen sehr anschaulich. (Thomas Skirde, Pixabay.com)

Doch Lind (2018) hat eine mögliche alternative Erklärung für das, was in Verhaltensstudien bei Tieren bisher nach menschlicher Intelligenz aussah: „Es wird der Schluss gezogen, dass man nicht ausschließen kann, dass diese Studien der flexiblen Planung bei Menschenaffen und Raben vollständig durch assoziatives Lernen erklärt werden können.“ Damit unterscheidet Lind (2018) zwischen höheren kognitiven Fähigkeiten, wie sie ein Mensch nutzt, und der einfachen Form des assoziativen Lernens durch Konditionierung (Training, welches Reiz und Reaktion verknüpft), wie man es beispielsweise für die Gesichtserkennung bei Computerprogrammen einsetzt. „Denken und Planen“ bei diesen Tieren ist also etwas anderes, als wenn Menschen denken und planen.

Abb. 2: Lind (2018) konnte mit einem Computerprogramm das Verhalten von Schimpansen und Rabenvögeln mit simplen Reiz-Reaktionsketten simulieren. (Free-Photos, Pixabay.com)

Die Verhaltensforschung unterscheidet zwischen zwei Konditionierungen. Nach der klassischen Konditionierung (nach Pavlov) wird ein erlernter Reiz-Reaktions-Zusammenhang mit einem neuen Reiz verknüpft. Beispielsweise sabbert der Hund, wenn er gefüttert wird. Läutet man währenddessen eine Glocke, sabbert er irgendwann auch nur beim Glockengeläut, weil er den neuen Reiz mit der alten Reaktion verknüpft hat. Nach der instrumentellen Konditionierung werden neue Handlungsweisen mit Belohnungen verbunden und dadurch erlernt.

Lind (2018) äußert darüber hinaus die Vermutung, dass bei der Verhaltensbeobachtung von Tieren die bisherigen „Ergebnisse durch spezialisierte Speicherrepertoires verursacht werden“ könnten, also auf dem Abspeichern von Erfahrungen (dem Anlegen einfacher Erfahrungsdatenbanken) im Gehirn beruhen. Außerdem vermutet er „methodologische Mängel“ bei bisherigen Studien. Sein Team verglich zur Überprüfung der Art von tierischer Intelligenz die Aufgaben, die Raben und Affen in zwei bisherigen Verhaltensstudien (Mulcahy & Call 2006 und Kabadayi & Osvath 2017) lösen sollten, mit den Lösungen, die ein lernfähiges Computerprogramm ergab. Das Programm sollte bei jeder Aufgabe stets die Handlungsalternative auswählen, die die meisten Belohnungspunkte ergab, da auch in der Natur die effizienteste Verhaltensweise (z. B. bei der Futtersuche von Raben oder auch Affen) die höchsten Überlebens- und Fortpflanzungschancen ermöglicht.

So lernten in einem Versuch Orang-Utans und Bonobos, eine Röhre in eine Vorrichtung einzuführen, wofür sie eine Belohnung bekamen. Bei einem anderen Versuch sollten sie mithilfe eines Hakens Futter aus einer Flasche herausangeln. Das Futter diente als Belohnung, welche die Affen motivierte, dieses Verhalten zu wiederholen. Jede Aufgabe war nur mit einem bestimmten Werkzeug lösbar. Um beim nächsten Mal wieder eine Belohnung zu erhalten, mussten die Affen nach dem Training das richtige Werkzeug unter mehreren Alternativen aussuchen. Die Zeit zwischen der Auswahl und der späteren Verwendung des Werkzeuges für die Erlangung des Futters wurde immer weiter verlängert. Schließlich erlernten die Affen das richtige Werkzeug bis zu 14 Stunden vor der erlaubten Benutzung für das Erlangen des Futters auszusuchen.

Abb. 3: Rabenvögel verfügen über die gleiche Planungskompetenz wie die Schimpansen. (Adobe Stock, junya.k )

In der Studie lernten die Tiere so folgende zunehmend anspruchsvollere Verhaltenssequenz:

1. Nimm das Werkzeug A → geh zum Gerät → verwende es am Gerät → nimm die Belohnung

2. Nimm das Werkzeug A aus einer größeren Auswahl → geh zum Gerät → verwende es am Gerät → nimm die Belohnung

3. Nimm Werkzeug A aus einer größeren Auswahl → warte → geh zum Gerät → verwende es am Gerät → nimm die Belohnung

Ein ähnliches Experiment wurde mit Raben durchgeführt. Auch sie erhielten eine Belohnung, wenn sie vorher ein Werkzeug in einen Apparat gesteckt hatten. Zuerst wurde mit einem Werkzeug geübt, das auch in die Apparatur passte. Danach wurden den Raben zusätzlich zu dem richtigen Werkzeug drei nicht in die Apparatur passende Werkzeuge zur Auswahl gestellt. Anschließend wurde auch in diesem Experiment eine (bis zu 17 Stunden dauernde) Wartezeit eingeführt. Die auf eine entsprechende Belohnung trainierten Raben wählten das korrekte Werkzeug, obwohl sie viele Stunden bis zum Einsatz für die Futtergewinnung warten mussten. Schließlich lernten sie sogar, das richtige Werkzeug zu wählen und dann lange auf dessen Einsatz zu warten, obwohl sie stattdessen eine kleine Belohnung sofort hätten bekommen können.

Abb. 4: Selbst Meisen können auf eine kleine Belohnung verzichten, um später eine größere zu bekommen. (Gerhard Gellinger, Pixabay.com)

Aus Verhaltensstudien dieser Art war bisher geschlossen worden, dass manche Tiere die Zukunft planen können. Doch Lind (2018) modellierte diese Experimente nun auch am Computer. In seinem Computerprogramm wurden analog zum Tierversuch die Verstärkerwerte der jeweiligen Reize (also die Belohnungen in Form von Futter) einbezogen und aus der bisherigen Erfahrung wurde die Verhaltensweise ausgewählt, die den höchsten Erwartungswert hatte. So lernte das Programm Versuch für Versuch, welche Handlungsweisen vom Trainer mit der höchsten Belohnung versehen wurden, und wählte diese Handlungen dann von alleine. Zusätzlich kann nun noch durch die Verlängerung der Frist zwischen Reiz und Belohnung das Programm dazu trainiert werden, auch eine Auswahl zu treffen, wenn erst später eine Belohnung folgt und eine schnelle Belohnung dafür vernachlässigt werden muss. Somit kann also auch die Wahl zwischen kleinen sofortigen Belohnungen und späteren großen Belohnungen durch festgesetzte Verstärkerwerte im Computerprogramm nachempfunden werden.²

Das Computerprogramm löste die Aufgaben genauso wie die Raben oder Affen, ohne dabei eine Prognose über zukünftige Szenarien zu erstellen.

Letztlich löste das Computerprogramm die Aufgaben genauso wie die Raben oder Affen, ohne dabei eine Prognose über zukünftige Szenarien zu erstellen. Die Tiere „simulieren unterschiedliche Ergebnisse nicht mental“, „reorganisieren Informationen nicht“ und bleiben gedanklich „in der Zeit stecken“, obwohl sie ja durch Konditionierung Planungs-analoges Verhalten zeigen (Lind 2018). Tritt dieses Verhalten einmal nicht auf, muss dies umgekehrt auch nicht an mangelnder Intelligenz liegen, sondern kann an fehlender gespeicherter Vorerfahrung der mentalen Datenbank beziehungsweise an einer für das Tier nicht ganz ersichtlichen Kombination von Handlung und Belohnung liegen.

Die Versuche und Computersimulationen zeigen, dass Tiere es gar nicht nötig haben, für eine Planungsaufgabe auch zu denken. Sie assoziieren verschiedene bekannte Möglichkeiten mit dem Problem und treffen so eine Entscheidung, die auf Erfahrung und wohl nicht auf kognitiven Szenarien basiert, wie bisher von Wissenschaftlern angenommen wurde. Lind (2018) erwähnt, warum dieser Zusammenhang bisher nicht so gesehen wurde: „Dass Tiere sich sehr lange an Reiz-Antwort-Assoziationen und Reizwerte erinnern, wurde in keiner der simulierten Studien erwähnt.“ Tiere speichern im Langzeitgedächtnis die zu erwartenden Ergebnisse von Handlungen sehr lange ab. Sie greifen auch in Experimenten auf Erfahrungen zurück – eine Tatsache, die den bisherigen Experimentatoren gar nicht bewusst war. Tiere treffen Entscheidungen damit erfahrungsbasiert und nicht planungsbasiert wie der Mensch.

Abb. 5: Einfache Verhaltensregeln können Intelligenz imitieren. Dies gilt für Computer wie auch für Raben und Menschenaffen. (Gert Altmann, Pixabay.com)

Interessant sind diese Vergleiche zwischen Computer und Tier auch hinsichtlich des Konzeptes der Selbstkontrolle (definiert von Kabadayi & Osvath nach Lind 2018): „die Unterdrückung von Sofortanstrengungen zugunsten verspäteter Belohnungen“, welche von Autoren vorheriger Studien als Intelligenzindikator gesehen wurde. Lind (2018) schreibt „Die Ergebnisse unterstützen die Idee, dass Selbstkontrolle durch assoziatives Lernen entstand. Wir haben bereits gezeigt, wie Tiere durch assoziatives Lernen Selbstbeherrschung erlangen können, wenn ihnen ausreichend Informationen und Erfahrungen zur Verfügung stehen.“ Damit hat Lind (2018) nun ein Erklärungsmuster für vielfältige Beobachtungen von scheinbar intelligenter Selbstkontrolle, die in der Verhaltensforschung beobachtet wurden. „Beobachtungen, bei denen Tiere lernen, kleine Belohnungen abzulehnen, wenn sie große Belohnungen erwarten, oder, mit anderen Worten, unrentable Beute abzulehnen, wenn profitable Beute im Überfluss vorhanden ist, stammen beispielsweise von Fischen (Bluegill Sunfish, Lepomis macrochirus), Krebstieren (Uferkrebse, Carcinus maenas), Vögeln (Kohlmeisen, Parus major, und Rotschenkel, Tringa totanus) […].“ Lind beschreibt nun aber das Deutungsproblem dieser Studien so: In diesen Studien „wurde Selbstkontrolle oft als separate Art von mentalen Mechanismen und nicht als etwas, das lernfähig ist, untersucht“. Dabei kann das hier beschriebene Verhalten von Affen und Raben nach Lind (2018) „am besten“ durch „Lernen mit konditionierter Verstärkung“ erklärt werden.

Um die Problematik etwas deutlicher zu machen, zog Lind den Vergleich mit Schachspielen heran: Mittlerweile kann künstliche Intelligenz bei Schachprogrammen mithilfe von großen Datenmengen erfolgreicher Schachzüge und enormer Rechenleistung menschliche Schachspieler schlagen.

Damit wird menschenähnliches Denken von Tieren und Computerprogrammen zwar imitiert, aber nicht nachvollzogen. Genauso wäre es also denkbar, dass Tiere sehr effizient von ihren Erfahrungen lernen können, ohne dabei menschliche flexible Kognitionsprozesse verwenden zu müssen (vgl. Berblinger (2018) und Lind (2018)).

Die Studie von Lind zeigt, dass menschliche Denkprozesse in ihrer Qualität einmalig sind. Das bisher bei Tieren untersuchte Verhalten weist nicht auf eine menschliche Planungsfähigkeit hin. Die häufig aufgestellte Behauptung, nach der zwischen Mensch und Tier eine enge evolutionäre kognitive Verwandtschaft besteht, ist nicht durch die Faktenlage abgedeckt.

Anmerkungen

¹ Dieser Artikel basiert auf der Studie von Lind (2018) und wird beim Zitieren übersetzt. Vgl. Berblinger (2018).

² Angemerkt sei hierzu, dass die Fähigkeit, solche Entscheidungsprozesse durchzuführen, natürlich von einem intelligenten Programmierer programmiert wurde. Dies bedeutet, dass das Programm dabei weder evolvierte (sich in seinem Quellcode weiterentwickelte), noch dass der Computer in irgendeiner Weise versteht, welche Rechenschritte er ausführt. Es erweitern sich bei diesem Programm lediglich die Datenbanken der bisherigen Erfahrungen, die nach einem fest programmierten Vorgehen ausgewählt werden.

Literatur

Berblinger S (2018): Affen planen ohne zu denken. https://www.wissenschaft.de/bildervideos/bild-der-woche/affen-planen-ohne-zu-denken/ (Zugriff 4. 5. 2019)
Kabadayi C & Osvath M (2017): Ravens parallel great apes in flexible planning for tool-use and bartering. Science 357, 202–204.
Lind J (2018): What can associative learning do for planning? Royal Society Open Science. doi: 10.1098/rsos.180778
Mulcahy NJ & Call J (2006): Apes save tools for future use. Science 312, 1038–1040.

Themen | Kurzbeiträge | Streiflichter

Studiengemeinschaft WORT und WISSEN e.V.

Letzte Änderung: 6/21/21
Webmaster