Direkt zum Inhalt Direkt zur Navigation
Sie sind hier: Startseite Nachrichten IT/Computer KI-System lernt durch Bestrafung und Belohnung

KI-System lernt durch Bestrafung und Belohnung

Archivmeldung vom 04.04.2017

Bitte beachten Sie, dass die Meldung den Stand der Dinge zum Zeitpunkt ihrer Veröffentlichung am 04.04.2017 wiedergibt. Eventuelle in der Zwischenzeit veränderte Sachverhalte bleiben daher unberücksichtigt.

Freigeschaltet durch Thorsten Schmitt
Bild: pixelio.de/A.Rausch
Bild: pixelio.de/A.Rausch

Forscher des chinesischen Suchmaschinenriesen Baidu nutzen Modelle der Belohnungen und Bestrafungen, um KI-Systeme zu trainieren. Jedes Mal, wenn eine Künstliche Intelligenz (KI) im virtuellen 2D-Labyrinth an einer Wand anstieß, wurde das System bestraft. Konnte ein Objekt hingegen erfolgreich lokalisiert werden, folgte eine Belohnung. Der virtuelle Agent hat nicht nur mit einem Begriff verknüpfte Gegenstände erkannt, sondern entwickelte auch ein grundlegendes Verständnis für Grammatik.

"Bei diesem Ansatz handelt es sich um ein behavioristisches Lernmodell, wie es in den 1950er-Jahren noch üblich war. Vor allem im menschlichen Kontext könnte man daher anmerken, dass diese Vorgehensweise etwas überholt erscheint", erläutert Peter Purgathofer vom Institut für Gestaltungs- und Wirkungsforschung der TU Wien gegenüber pressetext.

Den Forschern zufolge ist die Durchführung einer neuen Aufgabe für Menschen leicht, während KI-Systeme noch Probleme damit haben. Obwohl diese beispielsweise wissen, wie eine Drachenfrucht aussieht, können sie den Befehl "Schneide die Drachenfrucht mit einem Messer!" erst ausführen, wenn sie mit einem Datensatz trainiert worden sind, der exakt diese Anweisung enthält. Im Gegensatz dazu hat der virtuelle Agent in den Versuchen demonstriert, dass er das Wissen um die Erscheinung einer Drachenfrucht sowie die Aufgabe "Schneide X mit einem Messer!" erfolgreich miteinander verbunden hat, ohne explizit mit diesem Befehl trainiert worden zu sein.

3D-Umgebung geplant

Die Forschungsergebnisse zeigen, dass Algorithmen Sprache und Navigation zeitgleich lernen und dieses Wissen in ähnlicher Weise wie Menschen anwenden können. Die Wissenschaftler hoffen, dass sie ihre Studie schon bald auf eine 3D-Umgebung übertragen können. Obwohl es sich hierbei um einen simplen Forschungsansatz handelt, stellt er unter Beweis, dass KI-Systeme ihr Wissen ähnlich wie Menschen für verschiedene Tätigkeiten einsetzen können, ohne im Vorfeld mit der spezifischen Aufgabenstellung konfrontiert worden zu sein.

Quelle: www.pressetext.com/Carolina Schmolmüller

Videos
Daniel Mantey Bild: Hertwelle432
"MANTEY halb 8" deckt auf - Wer steuert den öffentlich-rechtlichen Rundfunk?
Mantey halb 8 - Logo des Sendeformates
"MANTEY halb 8": Enthüllungen zu Medienverantwortung und Turcks Überraschungen bei und Energiewende-Renditen!
Termine
Newsletter
Wollen Sie unsere Nachrichten täglich kompakt und kostenlos per Mail? Dann tragen Sie sich hier ein:
Schreiben Sie bitte tabak in folgendes Feld um den Spam-Filter zu umgehen

Anzeige