DeepMind разработала RoboCat, чтобы он гулял сам по себе
Deepmind разработала самообучающегося робота. Но пока ему все равно нужен человек, который покажет ему первоначальные движения. А вот дальше Robocan уже сможет гулять сам по себе.
Команда Google DeepMind соединила искусственный интеллект с роботом по имени RoboCat. Ученые надеются, что он сделает шаг в будущее — в мир самообучающихся автоматов. Команда использовала ту же технологию, что лежит в основе больших языковых моделей. Robocat не только быстро обучается новым задачам, но и может улучшать свои показатели, анализируя данные о своей работе.
«RoboCat имеет ускоряющийся цикл обучения: чем больше задач он решает, тем лучше он обучается новым задачам», — говорится в статье DeepMind.
С появлением больших языковых моделей наборы навыков роботов стали расширяться, хотя обучение на огромных объемах данных требовало много времени.
DeepMind заявила, что Robocat может быстро обучаться новым задачам, таким как установка кусочков головоломки различной формы в нужные отверстия или укладка фруктов в миску. Затем он смог продвинуться и стал выполнять более сложные задачи «на основе набора данных, состоящего из миллионов траекторий», полученных в ходе выполнения предыдущих задач и новых данных, созданных самостоятельно.
«Эти улучшения были обусловлены растущей широтой опыта RoboCat, подобно тому, как люди развивают более разнообразные навыки по мере углубления обучения в определенной области», — пишут исследователи.
По мере того, как RoboCat совершенствовал свою технику, его навыки передавались другим роботам, которые, в свою очередь, развивали эти навыки.
Робот оттачивал свою работу на 100-1000 демонстрациях с помощью роботизированной руки, управляемой человеком. Затем отдельные модели обучались выполнению конкретных задач, и эти данные вносились в общий пул инструкций.
Хотя вначале RoboCat добивался 36% успеха при решении задач, которые он ранее не изучал, со временем он улучшил свои показатели. Благодаря самообучению его успешность удвоилась.
«RoboCat учится гораздо быстрее, чем другие современные модели», — говорят исследователи DeepMind. — «Он уже может освоить новую задачу всего за 100 демонстраций, так как использует большой и разнообразный набор собранных данных».
Разработка рассматривается как важный шаг к ускорению исследований в области робототехники, «поскольку она уменьшает необходимость в обучении под руководством человека и является важным шагом на пути к созданию робота общего назначения».