NTTコミュニケーションズ(NTT Com)は2025年3月19日、IOWN APN(オールフォトニクス・ネットワーク)を用い、3拠点分散データセンター(DC)の構築に成功したと発表した。
NTT Comでは、三鷹と秋葉原の2拠点のDC間をAPNで接続し、GPUクラスターの実効性・効果性を検証してきた。今回の実証では、川崎を加えた3拠点へと拡張。これにより、例えばA拠点・B拠点に加え、C拠点を活用することで、その土地の電力供給量や値段に応じ、顧客の要望に合わせた複数の運用パターンを選択可能になる。
また、ネットワークの観点からも、距離の近い拠点同士でのより低遅延なワークロードや、遠距離の拠点同士での電力効率を意識したワークロードなど、ユーザーの特性に応じた分散学習や推論などのスケジューリングの可能性を実感できる構成になるという。
同実証では、NVIDIAアクセラレーテッドサーバーを川崎・三鷹・秋葉原の3拠点のDCに分散配置し、100Gbps回線のAPNで接続した。NVIDIA NeM0(生成AIモデルを構築・カスタマイズ・デプロイするための開発プラットフォーム)を使用して、3拠点のGPUサーバーを連携させ、NTT版独自LLM「tsuzumiモデル 7B」の分散学習を実施した。
結果、tsuzumi 7Bの事前学習を動作させることに成功。単一DCで学習させる場合の所要時間と比較して、インターネットを想定し帯域制限を実施したTCP通信の分散DCでは9.187倍の時間を要しましたが、APN経由の分散DCでは1.105倍と、単一DCとほぼ同等の性能を発揮できることを確認したとしている。