Neue Dinge entdecken und lernen zu wollen, funktioniert auch bei Künstlicher Intelligenz (KI), wie Forscher von OpenAI, der University of Edinburgh und der University of California, Berkeley http://berkeley.edu zeigen. Ihre KI hat eine einfache Form von Neugierde entwickelt, diverse Games zu spielen. Fesselnd war für die KI ein virtuelles TV-Gerät: Ständig veränderliches Rauschen ist für eine Maschine eben immer wieder eine neue Erfahrung.

Lernen ohne klares Ziel

Die Forschern wollten eine KI aus eigenem Antrieb statt aufgrund von Menschen einprogrammierter Belohnungen zum Lernen bringen. Dazu haben sie ihr eine einfache Form von Neugier mitgegeben, bei der sich das System quasi über unerwartete, neue Erfahrungen freut. Das hat auch tatsächlich gereicht, damit die KI Games wie 48 Atari-Klassiker oder "Super Mario Bros." mit beachtlicher Begeisterung spielt. Beispielsweise hat das System rein aus Neugier auf neue Erfahrungen gelernt, elf Level von "Super Maro Bros." zu meistern.

Für die Forscher kommt das nicht überraschend - immerhin ist Neugier entwicklungspsychologisch eine der wichtigsten Triebfedern für das Lernen. "Babys scheinen zielloses Erkunden zu nutzen, um Fähigkeiten zu erwerben, die im späteren Leben nützlich sind", schreiben die Forscher. Sie verweisen zudem auf den Erfolg von "Minecraft", bei dem letztlich das Erkunden der pixeligen Spielwelt und die dabei gemachten Erfahrungen die einzige Belohnung für Gamer sind. Auch, dass die KI in Games manchmal absichtlich stirbt, nur um zu sehen, was dann passiert, wirkt so gesehen ziemlich menschlich.

Fesselnder TV-Schnee

Die einfache maschinelle Neugier ist freilich nicht ganz ohne Eigenheiten. Bei einem "Pong"-Match haben zwei KI-Agenten offenbar beschlossen auszuprobieren, wie lange sie sich den Ball volley zuspielen können. Das läuft nicht nur dem eigentlichen Ziel des Spiels entgegen. Die KIs haben letztlich auch so lange Ballwechsel hinbekommen, dass der genutzte Atari-Emulator irgendwann abgestürzt ist, so die Forscher.

Das Team hat zudem für einen Versuch in einem virtuellen Labyrinth ein TV-Gerät versteckt. Darauf war zwar nur Rauschen in Form von TV-Schnee zu sehen. Doch da sich damit ständig ändert, was genau auf dem virtuellen Fernseher zu sehen ist, hat der Schnee die neugierige KI ziemlich gefesselt - dass dieses Programm eigentlich noch langweiliger ist als sommerliche Serien-Reruns in Endlosschleife versteht das Computersystem wohl nicht.

Zum Paper "Large-Scale Study of Curiosity-Driven Learning": http://pathak22.github.io/large-scale-curiosity/resources/largeScaleCuriosity2018.pdf

Quelle: www.pressetext.com/Thomas Pichler