Робот, который играет в Дженгу

Дженга («строить» на языке суахили) – настольная игра, смысл которой заключается в выстраивании башни из 54 деревянных брусков и поочерёдном перемещении игроками блоков с нижних ярусов на верхние. Задача игроков состоит в том, чтобы как можно аккуратнее извлечь блок и не дать башне упасть. Исследователи из Массачусетского технологического института разработали робота, который может играть в Дженгу не хуже человека.

Команда учёных усовершенствовала стандартного промышленного робота ABB IRB 120 с помощью мягкого и плавного захвата, манжеты, которая регистрирует силу давления, и камеры. Всё это позволяет роботу не только видеть башню, но также ощущать её и каждый отдельный блок. Исследователи заявляют, что их робот способен выполнять задачи, которые были не по зубам старым алгоритмам или требовали гораздо больше времени и усилий. Чтобы научить робота играть в логические игры, например, в шахматы или го, ему нужно «сообщить» данные о существующих тактиках и моделях игры. В случае с Дженгой опыт поколений профессиональных игроков роботу не поможет, так как в этой игре очень много зависит от ловкости и сноровки конкретного индивидуума, а на демонстрацию всех возможных вариаций происходящего с каждым из 54 блоков потребуются тысячи или даже десятки тысяч ходов.

Члены команды построили башню в зоне досягаемости робота, а тот всего за 300 ходов овладел мастерством игры в Дженгу. Это стало возможным благодаря кластерному механизму обучения: каждое движение робота регистрировалось программой, учитывалась как визуальная, так и физическая составляющая. Компьютер также отмечал, какие движения были успешными и не привели к падению башни.

В отдельных кластерах робот запоминал показания с камеры и манжеты в различных ситуациях: когда его захвату удалось без проблем подвинуть нужный блок, когда выбранный деревянный брусок не поддавался давлению или когда неловкое движение и вовсе приводило к падению башни. Таким образом, обучаясь в процессе игры, робот сформулировал собственную модель игры. На основе визуальных и тактильных данных он научился предсказывать, как его движение повлияет на отдельный блок или на всю башню. Благодаря кластерной системе обучения поведение робота напоминает то, как методом проб и ошибок учится человек.

Учёные Массачусетского технологического института не заинтересованы в создании робота-чемпиона, который со 100% вероятностью будет побеждать своих противников. В игре против нескольких волонтёров процент выигрышей робота практически не отличался от результатов реальных людей. Следующим шагом для команды будет обучение своего подопечного разнообразным стратегиям и уловкам, например, как извлечь блок из башни таким образом, чтобы следующему игроку было сложнее сделать ход.

Исследователи утверждают, что перспективы применения кластерной и тактильной системы обучения выходят далеко за пределы игры в Дженгу. Подобные программы и роботов можно использовать в любой сфере, где важную роль играют не только визуальные данные, но и аккуратное физическое взаимодействие с объектом: от сортировки продуктов или бытовых отходов до конвейеров для сборки мобильных телефонов.