Американский стартап Figure впервые показал плод своего сотрудничества с компанией OpenAI в виде умного робота-гуманоида, способного выполнять задачи и общаться в режиме реального времени благодаря «мозгу», работающему на основе ИИ-модели, подобной GPT.
Стоит отметить невероятные темпы развития продукции компании Figure. Предприниматель Бретт Эдкок презентовал миру свой стартап лишь в прошлом году. В его команду вошли крупнейшие игроки индустрии робототехники и искусственного интеллекта из Boston Dynamics, Tesla Google DeepMind и Archer Aviation, объединённые целью создать первого в мире коммерчески доступного универсального робота-гуманоида «общего назначения». В октябре Figure 01 уже стал на ноги и смог выполнять базовые задачи автономно. К концу 2023 года робот освоил навык обучения через наблюдение, научившись, например, готовить кофе при помощи кофемашины, а к середине января он уже был готов приступить к работе в рядах сотрудников BMW. Так, в конце февраля Figure показала, что первенец компании неплохо справляется с автономной работой на складе.
Вскоре после этого Эдкок объявил об успешном завершении раунда финансирования B, а также сообщил о соглашении о сотрудничестве с OpenAI. Совместной целью этих передовых в собственных сферах предприятий было заявлено развитие ИИ-модели нового поколения для её внедрения в роботов-гуманоидов. Теперь же компании впервые продемонстрировали своё видение этого сценария. В частности, на своей страничке в X (Twitter) Бретт подтвердил, что его команда связала интегрированные в голову Figure 01 камер с большой зрительно-языковой моделью (LVLM), за тренировку которой отвечала OpenAI. Её инженеры также научили гуманоида понимать устную речь. Данная модель работает параллельно собственной нейросети Figure, которая позволяет роботу ориентироваться в пространстве при помощи других бортовых камер, ведущих съёмку с частотой 10 Гц. И наконец, именно она «переводит» весь объём обрабатываемых ИИ данных в простые, но быстрые и аккуратные действия.