+7 (495) 544-43-04

AWS обновляет сетевую инфраструктуру для поддержки массивных кластеров ИИ

04.12.2024

«Мы называем это 10p10u, потому что это позволяет нам предоставить десять петабайт сетевой мощности тысячам серверов с задержкой менее десяти микросекунд», — сказал Питер ДеСантис на AWS re:Invent 2024.

На конференции AWS re:Invent 2024 компания Amazon Web Services представила обновления своей сети, чтобы удовлетворить растущие требования современных рабочих нагрузок в области искусственного интеллекта (ИИ). Ключевая инновация — сеть 10p10u, которая способна обеспечить пропускную способность 10 петабайт с задержкой менее 10 микросекунд для тысяч серверов.

10p10u: Новый стандарт для высоконагруженных сетей ИИ

Сеть 10p10u стала центральным элементом инфраструктурных обновлений AWS. По словам старшего вице-президента AWS по утилитарным вычислениям Питера ДеСантиса, эта структура разработана для поддержания массивных кластеров ИИ, таких как грядущий Project Rainier.

Ключевые характеристики сети:

  • Масштабируемость: Сеть может быть адаптирована под кластеры любого размера — от нескольких стоек до огромных кампусов.
  • Плотная взаимосвязь: Каждый сервер в сети способен одновременно взаимодействовать со всеми остальными, обеспечивая непрерывность вычислений.
  • Эластичность: Архитектура сети позволяет эффективно справляться с нагрузками, возникающими при обучении ИИ-моделей нового поколения.

Инновации для оптимизации сети

  1. Магистральные разъемы и оптические заглушки Firefly
    AWS разработала уникальные разъемы, объединяющие 16 оптических кабелей в один. Этот подход упрощает установку, снижает риск ошибок подключения и ускоряет монтаж на 54%.
    Оптические заглушки Firefly обеспечивают:
    — Защиту от пыли, минимизируя потери производительности.
    — Ускоренную проверку сетевых соединений до установки серверов.
  2. Протокол SIDR
    Для управления сложной структурой 10p10u разработан Scalable Intent Driven Routing (SIDR), протокол, который:
    — Реагирует на сбои менее чем за секунду.
    — Комбинирует централизованное планирование с локальным выполнением для оперативного восстановления сети.

NeuronLink: связь между чипами для ультрасерверов

Для повышения производительности кластеров AWS представила технологию NeuronLink, которая обеспечивает пропускную способность 2 терабайта в секунду с задержкой всего в одну микросекунду. Эта технология объединяет чипы Trainium2 в единый логический сервер — UltraServer, способный обрабатывать рабочие нагрузки ИИ в несколько раз быстрее существующих решений.

Влияние на рынок IT и кибербезопасности

Обновления AWS подчеркивают тенденцию к увеличению роли высокопроизводительных сетей в инфраструктуре будущего. Для компаний, работающих в сфере IT-аутсорсинга, безопасности и аудита, такие изменения открывают новые возможности для интеграции мощных облачных решений и разработки кастомных сервисов для клиентов.

Развитие технологий, подобных 10p10u и Trainium2, способствует ускорению инноваций в ИТ-отрасли, позволяя компаниям, таким как Mira-comp, использовать современные подходы для повышения эффективности и обеспечения безопасности ИТ-инфраструктуры.

MIRA достижения:

10 лет отличной работы на
рынке ИТ

100+ ключевых клиентов

Высококвалифицированные ИТ
специалисты

Лучшее в России оборудование

    Оставьте заявку на бесплатную консультацию!






    MIRA доверяют: