エヌビディア(NVIDIA)は2025年8月22日、分散型データセンターを統合し、ギガスケールのAIスーパーファクトリーを実現するスケーラブル技術「NVIDIA Spectrum-XGS Ethernet」を発表した。日本法人のNVIDIA Japanが8月26日、同社ブログに解説記事を掲載した。
分散データセンターの接続イメージ
Spectrum-XGS Ethernetは、同社のイーサネットプラットフォームであるNVIDIA Spectrum-X Ethernetに追加された技術だ。
AI の需要が急増する中、個々のデータセンターは単一の施設内での電力と容量の限界に直面している。これを拡張するには単一の施設を超えるスケールアウトが必要だが、既存のイーサネットインフラでは遅延とジッターが高く、パフォーマンスが予測不可能という制約を受けてしまう。Spectrum-XGS Ethernetは、スケールアップとスケールアウトを組み合わせた「スケール アクロス インフラ」を導入することで、これらの制約を解消するという。
具体的には、Spectrum-XGS Ethernetは距離に応じて高度に自動調整される輻輳制御、精密な遅延管理、エンドツーエンドのテレメトリを搭載。AIファクトリーのネットワークインフラで使われるNVIDIA Collective Communications Library(NCCL)の性能を約2倍に向上させる。
マルチGPUとマルチノード通信を高速化することで、地理的に分散したAIクラスター全体で予測可能なパフォーマンスを実現する。その結果、長距離接続に対して完全に最適化され、複数のデータセンターを単一のAIファクトリーとして運用することが可能になるとしている。
AIクラウドコンピューティング企業の米CoreWeaveが、Spectrum-XGS Ethernetでデータセンターを接続する最初の企業の1つとなる。