Rhetorik.ch

Knill+Knill Kommunikationsberatung

Knill.com
Aktuell Artikel Artikel Inhaltsverzeichnis Suche in Rhetorik.ch:

www.rhetorik.ch aktuell: (23. Dez, 2023)

ETH Roboter spielt BRIO Labyrinth Spiel

Rhetorik.ch Artikel zum Thema:
Es ist ein klassisches Puzzle "BRIO Labyrinth", bei dem man durch Änderung der horizontalen und vertikalen Neigungen einen Ball auf einem mit Löchern gespicktem Weg zu navigieren. Das Spiel wurde vor 80 Jahren erfunden und verkaufte sich Millionenfach. KI kann das Labyrinth Spiel nun auch lösen. In nur 6 Studen Lernzeit, kann der Roboter das Spiel dann in Rekord Zeit lösen (14.5 Sekunden, schneller als der beste Mensch). Das Magazin Heise berichtet über diese Arbeit, die von Thomas Bi und Raffaello D'Andrea am Institut für Dynamische Systeme und Kontrolle an der ETHZ gemacht worden ist:
Wissenschaftler der Eidgenössisch Technischen Hochschule Zürich (ETH Zürich) haben mit CyberRunner einen Roboter entwickelt, der mittels Künstlicher Intelligenz (KI) ein Labyrinth-Geschicklichkeitsspiel lösen kann. Dabei schafft er es, wie ein Mensch auch, Wege zu finden, um ein wenig zu schummeln. So stellte der CyberRunner einen Rekord für den Spieler auf, der das Spiel am schnellsten bewältigte. Das Labyrinth-Spiel ist recht einfach. Ein Brett mit einem Labyrinth mit Löchern wird in seiner Neigung über zwei Knöpfe reguliert. Eine Kugel muss so durch das Labyrinth bugsiert werden, dass sie nicht unterwegs in Löcher fällt, denn dann ist das Spiel beendet. Ein KI-Roboter steuert zwei Motoren an, die mit den Knöpfen des Holzspiels verbunden sind. Sie werden von einer intelligenten Elektronik angesteuert, wie der Forschenden in "Sample-Efficient Learning to Solve a Real-World Labyrinth Game Using Data-Augmented Model-Based Reinforcement Learning" schreiben, der auf Arxiv im Preprint erschienen ist. Das Spielbrett beobachtet der Roboter mit einer Kamera.
Die Methode kommt aus der Psychologie, wurde schon von Minsky vor 70 Jahren beschrieben und heisst Bestärkendes Lernen ("Reinforced learning RL"), eine der Methoden des Mschinellen Lernens ("Machine learning ML"). Der Roboter sucht wie ein Kind durch Spielen selbständig eine Lösungsstrategie. Im Falle des Labyrinths ist die Belohnung die Länge des schon absolvierten Weges sowie die Zeit die gebraucht wird. Wenn der Ball ins Loch fällt, oder gemogelt wird, indem ein Teil des Labyrinths übersprungen wird, dann gibt es keine Belohnung. Um das Problem besser zu lösen wurde allerdings etwas geholfen. Der Ball ist nicht silbrig, sondern wurde blau gefärbt (um ihn besser zu finden). Die Ecken des Puzzles wurden mit roten Punkten versehen um die Neigungswinkel schneller zu finden. Drei Illustrationen aus dem Paper.

Rhetorik.ch 1998-2023 © K-K Kommunikationsberatung Knill.com