ИИ Cicero обыграл людей в «Дипломатии»

С тех пор как шахматный суперкомпьютер IBM Deep Blue обыграл чемпиона мира по шахматам Гарри Каспарова в 1997 году, человечеству только и оставалось, что беспомощно наблюдать, как год за годом искусственный интеллект осваивает всё более сложные игры. Тем не менее, хотя ИИ безошибочно поддаются состязательные настольные и видеоигры, подобные системы не демонстрировали особых успехов в играх, требующих сотрудничества игроков во имя достижения общей цели. Однако разработчики Meta заявляют, что их Cicero может справиться и с этой задачей. В частности, данный ИИ-агент впервые продемонстрировал навыки человеческого мышления в онлайн-версии настольной игры-стратегии «Дипломатия».

ИИ Cicero обыграл людей в «Дипломатии»
Shutterstock

На протяжении последних десятилетий искусственный интеллект неустанно поражает нас своей возможностью обыгрывать людей в максимально логических антагонистических играх, начиная от шахмат и Го и заканчивая значительно более современным Starcraft. Несмотря на различия жанров и геймлпеев, все эти игры объединяет некооперативное взаимодействие игроков, которое исключает возможность и / или необходимость формирования коалиций. «Дипломатия» же наоборот подразумевает совместную работу игроков, которая заключается в переговорах и соревнованиях за право управления ресурсами. При этом они могут как образовывать коалиции, так и организовывать заговоры против всех или одного из противников. Таким образом, чтобы Cicero мог обыграть людей в «Дипломатии», ему нужно было не просто знать правила игры, но понимать тонкости межчеловеческих коммуникаций, распознавать искренние намерения игроков, обман и при этом составлять предложения, которые не выдали бы его сущность.

ИИ Cicero обыграл людей в «Дипломатии»
Team Toyboxes

Cicero получил своё имя в честь государственного деятеля и философа Марка Туллия Цицерона, ставшего свидетелем падения Римской республики. Исследователи Meta научили ИИ подражать человеку в «Дипломатии». Другими словами, его алгоритм смог поддерживать диалог с другими игроками-людьми, развивать общие стратегии и планировать свои действия для победы. По итогам 40 раундов игры Cicero показал более чем достойные результаты: он увеличил средний балл среди игроков более чем вдвое, а также вошёл в топ 10% лучших «дипломатов». Кроме того, в 8-этапном турнире он опередил 20 участников и занял первое место.

Human-level play in the game of Diplomacy by combining language models with strategic reasoning / Anton Bakhtin, Noam Brown, Emily Dinan, Gabriele Farina, Colin Flaherty, Daniel Fried, Andrew Goff, Jonathan Gray, Hengyan Hu, Athul Paul Jacob, Mojtaba Komeili, Karthik Konath, Minae Kwon, Adam Lerer, Mike Lewis, Alexander H. Miller, Sash Mitts, Aditya Renduchintala, Stephen Roller, Dirk Rowe, Weiyan Shi, Joe Spisak, Alexander Wei, David Wu, Hugh Zhang, Markus Zijlstra
ИИ Cicero обыграл людей в «Дипломатии»
Human-level play in the game of Diplomacy by combining language models with strategic reasoning / Anton Bakhtin, Noam Brown, Emily Dinan, Gabriele Farina, Colin Flaherty, Daniel Fried, Andrew Goff, Jonathan Gray, Hengyan Hu, Athul Paul Jacob, Mojtaba Komeili, Karthik Konath, Minae Kwon, Adam Lerer, Mike Lewis, Alexander H. Miller, Sash Mitts, Aditya Renduchintala, Stephen Roller, Dirk Rowe, Weiyan Shi, Joe Spisak, Alexander Wei, David Wu, Hugh Zhang, Markus Zijlstra

Общая продолжительность эксперимента из 40 анонимных игр против 82 реальных игроков на сайте weDiplomacy.net составила 72 часа. По словам исследователей, как минимум в общих чатах ни у кого не возникало подозрений о том, что Cicero не является человеком. Более того, однажды ИИ даже удалось переубедить скептически настроенного игрока объединить усилия для достижения общей цели. Основой для тренировки алгоритма стала обширная база данных с записями действий реальных игроков в «Дипломатию». В общей сложности ИИ проштудировал 125261 игру: примерно 40 тысяч из них содержали диалоги. Таким образом, Cicero обработал более 12 миллионов сообщений между игроками. Всё это было необходимо, чтобы ИИ научился моделировать каждый ход противников, руководствуясь историей их действий и диалогов.

Human-level play in the game of Diplomacy by combining language models with strategic reasoning / Anton Bakhtin, Noam Brown, Emily Dinan, Gabriele Farina, Colin Flaherty, Daniel Fried, Andrew Goff, Jonathan Gray, Hengyan Hu, Athul Paul Jacob, Mojtaba Komeili, Karthik Konath, Minae Kwon, Adam Lerer, Mike Lewis, Alexander H. Miller, Sash Mitts, Aditya Renduchintala, Stephen Roller, Dirk Rowe, Weiyan Shi, Joe Spisak, Alexander Wei, David Wu, Hugh Zhang, Markus Zijlstra
Shutterstock

Стоит отметить, что Cicero не безупречен. Его диалоги преимущественно ограничены обсуждением действий в рамках текущего хода. Кроме того, ИИ было трудно просчитывать, как его взаимодействие с одним игроком отразится на взаимоотношениях с другими в долгосрочной перспективе. К тому же время от времени алгоритм начинал действовать вразрез с основной линией собственных планов. Впрочем, подобные ошибки свойственны и людям. Хотя пока что Cicero испытали только в одной игре, в Meta считают, что данный ИИ заслуживает места в «зале игровой славы» благодаря его уникальной способности к коммуникации и сотрудничеству с людьми. Более того, разработчики уверены, что успех искусственного интеллекта в кооперативных играх открывает новые перспективы его взаимодействия с человеком в реальной жизни. Дальнейшее развитие в этом направлении позволит учёным создать не просто разумную систему, но партнёра или хотя бы собеседника, способного предложить действенные пути решения насущных проблем.

Поділитися в соцмережах

Залишити відповідь