+7 (495) 544-43-04

Ускоренный износ графических процессоров в ЦОД: миф или реальность?

07.11.2024

Недавняя дискуссия на платформе X поднимает вопрос о потенциально сокращённом сроке службы графических процессоров (GPU)

В центрах обработки данных (ЦОД) при их интенсивном использовании. В частности, предполагается, что высокая нагрузка на уровне 60-70%, которую можно наблюдать у таких операторов, как CoreWeave и Lambda Labs, может сократить срок службы этих устройств с ожидаемых пяти лет до трёх. Этот вывод был озвучен от лица анонимного источника, якобы представителя Alphabet Inc. Однако пока эти предположения не имеют достаточных доказательств.

Условия эксплуатации GPU: перегрев и охлаждение

Графические процессоры, действительно, подвергаются серьезным нагрузкам и высоким температурам. Современные модели, такие как NVIDIA Hopper, потребляют более 700 Вт, а следующее поколение Blackwell может потреблять до 1000 Вт, что вынуждает операторов ЦОД отказываться от воздушного охлаждения и переходить на водяное. Температурные нагрузки, как правило, могут сокращать срок службы техники — это подтверждается опытом владельцев подержанных видеокарт, которые использовались для майнинга, и часто выходили из строя спустя несколько месяцев работы в режиме 24/7.

Влияние циклов включения/выключения на износ

Однако президент Jon Peddie Research, Джон Педди, отмечает, что постоянная работа даже при высокой нагрузке может оказывать меньшее воздействие на износ GPU, чем частые циклы включения и выключения. Стабильная работа снижает количество термических циклов, которые могут негативно повлиять на соединения и компоненты видеокарты. Основная проблема, по мнению эксперта, заключается именно в уровне тепла, создаваемого соседними графическими платами в условиях ЦОД.

Позиция Google и подтверждённые данные

Google, один из крупнейших пользователей GPU, официально опроверг подобные заявления, утверждая, что срок службы и надежность графических процессоров NVIDIA в их инфраструктуре соответствуют отраслевым стандартам. GPU остаются основным компонентом облачных решений компании, и пока ни один из крупных пользователей GPU в ЦОД не сообщил о повышенной частоте отказов.

На данном этапе заявления о сокращённом сроке службы GPU при высокой нагрузке остаются предположениями, не подтвержденными фактами.

MIRA достижения:

10 лет отличной работы на
рынке ИТ

100+ ключевых клиентов

Высококвалифицированные ИТ
специалисты

Лучшее в России оборудование

    Оставьте заявку на бесплатную консультацию!






    MIRA доверяют: