Революция в вычислениях с использованием искусственного интеллекта: NVIDIA HGX H200


В области производства чипов и технологий искусственного интеллекта компания NVIDIA совершила колоссальный шаг вперед, представив графический процессор NVIDIA HGX H200. Этот продукт следующего поколения, пришедший на смену графическому процессору NVIDIA H100, является свидетельством быстрого развития искусственного интеллекта и вычислительных технологий. H200, разработанный на архитектуре Hopper и интегрированный с памятью HBM3e, может похвастаться впечатляющей пропускной способностью 4,8 ТБ в секунду.

Удвоение производительности ИИ

Самая яркая особенность HGX H200 — возможности обработки искусственного интеллекта. NVIDIA сообщает, что по сравнению со своим предшественником H100, H200 удваивает скорость вывода в Llama 2, модели с открытым исходным кодом от Meta AI с 70 миллиардами параметров. Такое значительное улучшение скорости указывает на существенный скачок в обработке и эффективности искусственного интеллекта.

Непревзойденная память и пропускная способность

Благодаря памяти HBM3e H200 предлагает огромные 141 ГБ памяти, удовлетворяя растущие потребности больших языковых моделей (LLM), которым требуется больше и более быстрая память. Увеличение объема памяти и пропускной способности имеет решающее значение для сложных задач искусственного интеллекта и крупномасштабной обработки данных.

Универсальные и масштабируемые конфигурации

H200 доступен как в 4, так и в 8-канальной конфигурации, обеспечивая совместимость с программными и аппаратными системами H100. Эта универсальность делает его подходящим для широкого спектра центров обработки данных, включая локальные, облачные, гибридные облака и периферийные вычисления. Кроме того, его можно развернуть через основные облачные сервисы, такие как AWS, Google Cloud, Microsoft Azure и Oracle Cloud, что подчеркивает его адаптивность и простоту интеграции в существующие системы.

Доступность рынка и глобальное влияние

Выпуск HGX H200, запланированный на второй квартал 2024 года, может оказать значительное влияние на рынок. Это часть более широкой стратегии NVIDIA по развитию искусственного интеллекта и вычислительных технологий.

Суперчип Grace Hopper GH200: аналог HGX H200

Наряду с H200 NVIDIA представила суперчип GH200 Grace Hopper. Этот продукт сам по себе является чудом, созданным специально для суперкомпьютеров. Это позволяет ученым и исследователям решать самые сложные мировые проблемы за счет ускорения обработки данных терабайтного уровня и сложных вычислений искусственного интеллекта. GH200 призван произвести революцию в исследовательских центрах, производителях систем и поставщиках облачных услуг по всему миру: более 40 суперкомпьютеров искусственного интеллекта, в том числе от Dell, HPE, Lenovo, Eviden, QCT и Supermicro, используют эту технологию.

JUPITER: эталон суперкомпьютеров с искусственным интеллектом

Среди суперкомпьютеров, использующих GH200, выделяется JUPITER в Германии. Ожидается, что после завершения строительства в 2024 году JUPITER станет самой мощной в мире системой искусственного интеллекта. Он будет использовать архитектуру с жидкостным охлаждением и 24 000 чипов GH200. Он будет связан с сетевой платформой NVIDIA Quantum-2 InfiniBand, демонстрируя вершину суперкомпьютеров с искусственным интеллектом.

Технические характеристики H200: взгляд в будущее

Техническое мастерство H200 очевидно в его характеристиках:

FP64: 34 TFLOPS
FP64 Tensor Core: 67 TFLOPS
FP32: 67 TFLOPS
TF32 Tensor Core: 989 TFLOPS
BFLOAT16 Tensor Core: 1,979 TFLOPS
FP16 Tensor Core: 1,979 TFLOPS
FP8 Tensor Core: 3,958 TFLOPS
INT8 Tensor Core: 3,958 TFLOPS
GPU Memory: 141GB
GPU Memory Bandwidth: 4.8TB/s
Decoders: 7 NVDEC/JPEG
Max Thermal Design Power (TDP): Up to 700W (configurable)
Multi-Instance GPUs: Up to 7 MIGs @16.5GB each
Interconnect: NVIDIA NVLink® at 900GB/s, PCIe Gen5 at 128GB/s
Server Options: NVIDIA HGX™ H200 partner and NVIDIA-Certified Systems™ with 4 or 8 GPUs
NVIDIA AI Enterprise Add-on


Стоит помнить, что NVIDIA HGX H200 AI Accelerator Card знаменует собой важную веху в развитии искусственного интеллекта и вычислительных технологий. Его расширенные возможности скорости, памяти и пропускной способности, а также универсальные конфигурации и глобальное влияние подчеркивают его потенциал для преобразования приложений искусственного интеллекта и суперкомпьютеров. Мы ожидаем, что H200 будет выпущен в 2024 году и станет маяком инноваций, расширяющим возможности искусственного интеллекта.

Автор: RuFull