Чипы H100, разработанные NVIDIA, являются одним из самых популярных решений в мире технологий искусственного интеллекта. Большинство специализированных компаний, включая OpenAI, Microsoft, Alphabet, Meta, Google DeepMind, Oracle, Dell, Amazon, Tesla и др., используют их для тренировки своих ИИ-моделей. Теперь же NVIDIA анонсировала платформу нового поколения Blackwell B200, которая заставит старые добрые H100 выглядеть детскими игрушками. Компания позиционирует новую платформу как мощнейший чип GPU, который позволит совершить прорыв в сфере нейросетей.
В рамках ежегодной конференции GTC в Сан-Хозе главный исполнительный директор NVIDIA Дженсен Хуанг объявил, что чипы Blackwell B200 станут движителем новой промышленной революции. Генеративные ИИ – одна из самых востребованных и активно развивающихся технологий современности. Чип H100 всего за пару лет позволил создать монструозные ИИ-модели вроде ChatGPT. Однако по мере совершенствования отрасли растут и её потребности, а задача NVIDIA заключается в поиске решений, способных их удовлетворить в полной мере.
Платформа Blackwell B200 получила своё наименование в честь Дэвида Гарольда Блэквелла – американского математика, эксперта в отраслях динамического программирования, теории игр и математической статистики. Она предлагает ИИ-компаниям существенный прирост производительности для развития нейросетей. В частности, заявленная производительность новинки составляет 20 петафлопсов – впятеро больше, чем предлагал легендарный H100. Согласно официальным данным, львиная доля прироста обусловлена рекордным увеличением числа транзисторов – 208 миллиардов против 80 миллиардов.
Для достижения такого показателя NVIDIA пришлось связать воедино два кристалла, выполненные по специальной версии 4-нм техпроцесса TSMC 4NP. Объединённые 2,5D-упаковкой CoWoS-L, они сообщаются между собой посредством шины NV-HBI со скоростью до 10 ТБ в секунду. Это первый GPU компании с чиплетной компоновкой. Кристаллы окружены восемью стеками памяти HBM3E на 192 Гб с пропускной способностью до 8 ТБ в секунду. Учитывая раздутые аппетиты ИИ-индустрии, NVIDIA предусмотрела возможность комбинации ускорителей Blackwell B200 в одной системе при помощи «моста» NVLink пятого поколения. Данный интерфейс предлагает возможность объединения до 576 чипов посредством коммутатора NVSwitch 7.2T, обеспечивая обмен данных со скоростью до 1,8 ТБ в секунду.
Предполагается, что новая платформа ляжет в основу ускорителя Nvidia Grace Blackwell Superchip, в котором в качестве центрального процессора выступит Arm-чип Nvidia Grace с 72 ядрами Neoverse V2. TDP такой махины оценивается в 2,7 кВт, а займёт она около половины стека серверной стойки. По данным NVIDIA, в сравнении с архитектурой Hopper и чипом H100, B200 обеспечит 30-кратный прирост производительности в задачах, связанных с тренировкой больших языковых моделей. При этом новая платформа является более энергоэффективной и экономичной. К слову, ни в презентации Хуанга, ни в официальном пресс-релизе не была озвучена стоимость чипов Blackwell. Пока можно лишь предположить, что новинка обойдётся не дешевле предшественницы, стоимость которой на рынке варьируется от $25 000 до $40 000. Тем временем полноценные системы на базе H100 обходятся покупателям в ~$200 000. Несмотря на высокую стоимость, NVIDIA не испытывает недостатка в клиентах: в прошлом году из-за большого спроса время ожидания доставки могло достигать 11 месяцев.