Dr Fill: ИИ одержал победу в турнире по кроссвордам

Мэтт Гинсберг – далеко не новичок во многих отраслях, он давно зарекомендовал себя как специалист в сфере ИИ, астрофизик, писатель, драматург, фокусник и пилот спортивного самолёта. Однако по какой-то причине столь всесторонне развитому человеку никак не поддавались кроссворды. Потерпев поражение в очередном турнире по кроссвордам, Гинсберг решил подойти к вопросу с другой стороны и разработал программу машинного обучения Dr Fill, способную обойти в решении кроссвордов даже самых непревзойдённых знатоков.

С 23 по 25 апреля 2021 года около 1300 человек соревновались между собой в решении головоломок в рамках виртуального Всеамериканского турнира по кроссвордам. Впервые в истории состязания всех людей – новичков, любителей и профессионалов – обошёл искусственный интеллект. Мэтт Гинсберг инициировал проект Dr Fill 10 лет назад. Мужчину настолько раздражала собственная некомпетентность в скоростном решении кроссвордов, что он взялся за создание программы, которая превзойдёт в этом деле всех его соперников.

Всеамериканский турнир по кроссвордам (American Crossword Puzzle Tournament или ACPT) учредил редактор издания New York Times Уильям Шортц в 1978 году. ACPT состоит из серии кроссвордов, представленных широким разнообразием размеров и уровней сложности, включая дьявольски-хитрые головоломки, на решение которых уходит два дня. В финале турнира тройка лидеров в звукоизолирующих наушниках сходится в очном поединке у расчерченных маркерных досок.

На протяжении всего состязания успехи участников оценивают по специальной формуле, которая взвешивает соотношение точности и скорости решения кроссвордов. Победители турнира, как правило, могут решить любой очень сложный кроссворд из сборников New York Times примерно за три минуты, не сделав ни одной ошибки. В 2021 году программа Dr Fill не была безупречной и пришла к финалу с тремя ошибками. Однако способность решать любой кроссворд за считанные секунды позволила искусственному интеллекту компенсировать ошибки и обойти ближайшего соперника на 15 баллов.

Всевозможные игры и головоломки всегда были важной частью исследований в области компьютерных наук. Программы искусственного интеллекта уже не раз демонстрировали своё превосходство в шахматах, шашках, нардах, Го, покере и дюжине других игр. Чтобы покорить мир кроссвордов, Dr Fill «поглотил» тонны информации, включая полное содержание Википедии и базы данных определений и ответов к кроссвордам из сети. Его дебют на турнире состоялся в 2012 году: тогда искусственный интеллект занял скромное 141 место, а все, кто обошёл его по баллам, получили значки «I Beat Dr. Fill». Программа постепенно развивалась, и в 2017 году алгоритм вышел на 11 место.

В 2021 году Dr Fill получил масштабный апгрейд. Прежде всего, воспользовавшись виртуальным форматом мероприятия, Гинсберг перевёл программу с компактного ноутбука на собранный по спецзаказу ПК с 64-ядерным процессором и двумя GPU. Впрочем, большая часть обновления состояла в совершенствовании самого алгоритма. Незадолго до турнира Гинсбергу написал Дэн Кляйн – профессор информатики в Калифорнийском университете в Беркли – и предложил свою помощь в улучшении программы. В рамках проекта Berkeley Natural Language Processing Group Кляйн и его студенты разработали своего рода «решатель кроссвордов», действующий в формате «вопрос – ответ» подобно платформам Siri и Alexa.

Dr Fill был представителем эры «старомодного ИИ» с оценочной функцией, довольно близко отражающей человеческую логику. Образцом такого ИИ можно считать суперкомпьютер Deep Blue родом из 1990-х годов, который искал и просчитывал миллионы шахматных ходов в секунду. В свою очередь «решатель кроссвордов» профессора Кляйна построен на базе современной нейронной сети, которая работает не по логике, но по принципу организации и функционирования биологических нейронных сетей. Достоинством старомодного ИИ является способность молниеносно продумывать бесконечные возможности решения головоломки. Такой алгоритм прорабатывает все возможные варианты ответа и выбирает наиболее подходящий. Тем временем нейросеть, натренированная на 6 миллионах определений и ответов, выбирает решения, сужая область поиска в соответствии с условиями головоломки. По словам Кляйна, его нейросеть освоила методы обобщения и абстракции, которые позволяют людям и машинам понимать язык.

Профессор Кляйн пояснил, что человеческое понимание и знание языка формируется через слушание, чтение и речь. Подобные контакты с языком оставляют в нашей памяти след: подобный след остаётся и при тренировке искусственного интеллекта, базирующегося на нейросети. «Решатель кроссвордов» Кляйна можно сравнить с Маугли, которого вырастили не волки, а разумные кроссворды. Новый Dr Fill стал гибридом двух систем: основа из «старомодного ИИ» взяла на себя холодный расчёт выбора и размещения ответов, а нейросеть разгадывала задачи, требующие более тонкого чувства языка. Таким образом искусственный интеллект не раздумывая понял, что ответом для «Trip to watch the big game?» (Путешествие, в котором можно посмотреть на большую игру / дичь) было «сафари», а разгадкой для «Pasta dish at the center of a murder mystery?» (Макароны в центре таинственного убийства) служила «отравленная паста пенне».

По словам Гинсберга, комбинация старомодного ИИ и современного машинного обучения превзошла все его ожидания. Мэтт считает, что победа программы Dr Fill в турнире по кроссвордам – это прежде всего победа человека, ведь за сложнейшим алгоритмом стоит изобретательность и упорный труд команды учёных. Как же на успех компьютера отреагировали другие участники турнира? В прошедшие годы зал, в котором проходило состязание, закономерно наполнялся одобрительным гулом, когда Dr Fill делал очередную ошибку. Многие конкурсанты с раздражением выслушивали речь Гинсберга о новых свершениях его детища, считая участие машины в интеллектуальном соревновании бессмыслицей и оскорблением их стараниям. В этот раз не самую позитивную реакцию на победу программы, вероятно, смягчил виртуальный формат турнира. Впрочем, некоторые участники всё же признали изобретательность Мэтта и важность его достижений в области развития искусственного интеллекта.

В финале турнира с алгоритмом сошёлся Тайлер Хинмэн: искусственный интеллект решил кроссворд за 49 секунд, а его конкурент уложился в 3 минуты. Поскольку ни Dr Fill, ни Мэтт Гинсберг не имели права получить главный приз в 3000 долларов, его обладателем стал Хинмэн. Основатель турнира Уильям Шортц надеется, что Гинсберг вернётся и в следующем году. Он не исключает, что те самые нововведения, которые усложнят задачу для искусственного интеллекта, сделают процесс составления и решения кроссвордов более захватывающим и оригинальным для людей.