Введите Ваш номер

Роборука собирает кубик Рубика

Команда OpenAI научила роборуку на весу собирать кубик Рубика.




Система обучалась на своих ошибках. За каждое успешное действие она получала бал и задачей было максимизировать их количество. Таким образом система научилась собирать кубик за 3 минуты, если сравнивать с рекордом человека, то он составляет 3, 47 секунд. 


Эксперты использовали для обучения системы виртуальную среду с копиями рук. Благодаря этому удалось ускорить процедуру обучения и улучшить качество алгоритмов, меняя при этом параметры среды. По ходу учения механизмы совершали ошибки, но со временем достигали необходимого уровня успеха, после которого среда в автоматическом режиме изменяла параметры, например, вес и габариты кубика Рубика. Принимая это во внимание, система была вынуждена вновь адаптироваться к условиям, но только так удалось подготовить механизмы к переносу на настоящую роборуку без симулирования всех тонкостей взаимодействия руки и кубика. Важно отметить, что наличие искусственного интеллекта не позволило конструкции с легкостью собрать инструмент, многое зависело и от того, как кубик был первоначально запутан.