Новейшие GPU NVIDIA Blackwell B200 столкнулись с серьезными проблемами перегрева в серверных стойках, что приводит к задержкам поставок и необходимости переработки конструкции системы охлаждения.
G. Ostrov
Компания NVIDIA столкнулась с неожиданными техническими проблемами при развертывании своих новейших GPU Blackwell B200. Согласно последним сообщениям, чипы испытывают серьезные проблемы с перегревом при установке в серверные стойки, что вынуждает компанию пересматривать архитектуру системы охлаждения.
Суть проблемы
Основная проблема заключается в том, что GPU Blackwell B200 генерируют значительно больше тепла, чем ожидалось, особенно при работе в плотно упакованных серверных конфигурациях. Это приводит к критическому перегреву, который может повредить не только сами чипы, но и соседние компоненты системы.
Влияние на поставки
Проблемы с охлаждением привели к задержкам в поставках GPU крупным клиентам, включая дата-центры и исследовательские организации. NVIDIA вынуждена переработать систему охлаждения и провести дополнительные тесты перед массовым производством.
Технические детали
Blackwell B200 представляет собой революционную архитектуру, предназначенную для обработки искусственного интеллекта и высокопроизводительных вычислений. Однако высокая производительность достигается за счет значительного энергопотребления и, соответственно, тепловыделения.
Реакция NVIDIA
Компания NVIDIA официально признала существование проблемы и заявила о работе над улучшенными решениями для охлаждения. Инженеры работают над оптимизацией как аппаратной части, так и программного обеспечения для управления тепловыделением.
Последствия для индустрии
Задержки с Blackwell B200 могут повлиять на планы развертывания AI-систем в крупных технологических компаниях. Это также подчеркивает растущие вызовы в области охлаждения высокопроизводительных вычислительных систем.
Дополнительную информацию можно найти на официальном сайте NVIDIA.
В случае каких-либо проблем напишите нам, мы поможем быстро и качественно!