Пинг-понг-бот: Прилежный ученик

Робот осваивает навыки обращения с шариком и ракеткой. Для этого «учителю» необходимо лишь показать ему пример – и после нескольких пробных попыток ученик начинает весьма успешно справляться с поставленной задачей.
Редакция сайта
Редакция сайта
Пинг-понг-бот: Прилежный ученик

Программирование роботов для выполнения определенных задач остается непростым делом, несмотря на впечатляющие успехи робототехники. А в непромышленных условиях (в домах, больницах, офисах) ситуация осложняется еще и необходимостью действовать более безопасно в условиях большей неопределенности. Поэтому инженеры стремятся создать роботов, поведение которых будет гибким и адаптивным — роботов, которые, подобно людям, будут учиться на собственном опыте.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Именно эту задачу и решает команда исследователей из Robot Learning Lab (лаборатории, входящей в состав Института Макса Планка, Германия) во главе с Яном Питерсом (Jan Peters). Питерс ставит перед собой цель превратить программирование роботов в обучение. Другими словами, он хочет разработать роботов, каждое движение которых не придется точно просчитывать.

На видео Катарина Мулинг (Katharina Muelling), аспирант Питерса, показывает роботу, как «вести» шарик для пинг-понга, закрепленный на резинке. Робот представляет движения в виде набора базовых «моторных навыков» — и быстро «учится» этому нехитрому трюку. Для сравнения, ученые попытались составить программу для выполнения той же задачи. На это ушло целых три месяца, и результат был не столь хорош, как после «обучения», которое заняло менее часа.

Продолжение ниже Продолжение

Во второй части видео Мулинг учит робота ловить шарик при помощи чашки. Это гораздо более сложный навык, и роботу для достижения положительного результата недостаточно просто подражать движениям человека. Разница в скорости перемещения руки и манипулятора не позволяет роботу поймать шарик при попытке воспроизвести действия «учителя». И тут, по словам Питерса, на первый план выходит процесс «самосовершенствования». «Каждый раз, когда роботу удается подвести мяч ближе к чашке, он получает "награду", — рассказывает Питерс. В результате "самосовершенствования" на протяжении многих попыток робот осваивает необходимые навыки. Так, первые удачные броски приходятся на 40−45 попытки, а после 90−95 попыток робот добивается стабильного положительного результата.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Какова способность робота к обучению по сравнению с человеком? Этим вопросом задался Йенс Кобер (Jens Kober), один из аспирантов Питерса. В качестве объектов небольшого эксперимента он выбрал своих многочисленных родственников. Оказалось, самые младшие из них (в возрасте до 6 лет) вообще не способны поймать шарик в чашку, те, что чуть постарше (10−12 лет), научились этому за 30−35 попыток, а взрослые справились гораздо быстрее. «Руководитель проекта — пожалуй, единственный человек в лаборатории, кто так и не освоил эту игру», — усмехается д-р Питерс.

В заключительной части видео робот учится игре в пинг-понг. Основная задача здесь состоит в модификации ранее изученных движений в зависимости от визуальной информации (направления полета мяча, выпущенного из подающей машины). Д-р Питерс рассчитывает, что однажды «пинг-понг-бот» если и не станет чемпионом, то, по крайней мере, сможет обыграть всех сотрудников лаборатории.