В преддверье выставки Computex 2023 CEO NVIDIA Дженсен Хуанг сделал несколько важных анонсов. В частности, в этом году компания готова представить свой новый серийный суперкомпьютер – DGX GH200, предназначенный преимущественно для решения ИИ-задач.
DGX GH200 базируется на новой платформе, известной как NVLink Switch System. Она объединяет в единое целое 256 суперчипов Grace Hopper, которые действуют как один CPU. Каждый суперчип представляет собой комплекс из 72-ядерного Grace CPU, базирующихся на архитектуре Arm, и GPU H100 с тензорными ядрами. Оперативная память каждого суперчипа представлена 96 ГБ HBM3 и 512 ГБ LPDDR5X. Таким образом, платформа NVLink Switch System позволяет DGX GH200 использовать 144 терабайта общей памяти GPU для развития производительности до 1 эксафлопса, почти в 500 раз превосходя своего предшественника – систему DGX A100. Кроме того, по данным NVIDIA, новое поколение фирменного серийного суперкомпьютера имеет в 10 раз более высокую пропускную способность.
Таким образом, GH200 становится вторым эксафлопсным суперкомпьютером в истории. Первым в Top500 (по версии бенчмарка High Performance Linpack) остаётся Frontier из Ок-Риджской национальной лаборатории, производительность которого в 2022 году составляла 1,102 эксафлопса (1,102 квинтиллиона операций в секунду). К слову, следующим в рейтинге идёт японский Fugaku – в 2022 году он выдавал производительность до 442 петафлопсов – более чем двое меньше лидера индустрии.
В NVIDIA отмечают, что быстродействие DGX GH200 делает его идеальной машиной для реализации самых продвинутых ИИ-задач. По предварительным данным, несколько крупных игроков на рынке информационных технологий уже выразили интерес в тестировании и, возможно, приобретении подобных систем для работы с ИИ-проектами. Среди них Google Cloud, Meta, Microsoft и др. GH200 выйдут на рынок к концу 2023 года, и компания уже приступила к производству суперчипов Grace Hopper. Стоит отметить, что NVIDIA параллельно работает над созданием собственного «домашнего» суперкомпьютера Helios, который будет состоять из 4 серийных суперкомпьютеров компании: он также должен войти в эксплуатацию до конца этого года. К слову, один GH200 занимает 24 серверные стойки, а также использует более 240 км оптоволокна и 2112 60-мм вентиляторов для охлаждения.
Помимо DGX GH200, Дженсен Хуанг также озвучил несколько ИИ-инноваций на дорожной карте компании, включая NVIDIA Avatar Cloud Engine (ACE) для более тщательной и эффективной проработки неигровых персонажей в видеоиграх, а также Isaac AMR – платформу для ускоренной разработки автономных мобильных роботов.