NTT Com、IOWN APNを用いた3拠点の分散GPUクラスターで生成AI学習に成功

NTTコミュニケーションズ(NTT Com)は2025年3月19日、IOWN APN(オールフォトニクス・ネットワーク)を用い、3拠点分散データセンター(DC)の構築に成功したと発表した。

NTT Comでは、三鷹と秋葉原の2拠点のDC間をAPNで接続し、GPUクラスターの実効性・効果性を検証してきた。今回の実証では、川崎を加えた3拠点へと拡張。これにより、例えばA拠点・B拠点に加え、C拠点を活用することで、その土地の電力供給量や値段に応じ、顧客の要望に合わせた複数の運用パターンを選択可能になる。

また、ネットワークの観点からも、距離の近い拠点同士でのより低遅延なワークロードや、遠距離の拠点同士での電力効率を意識したワークロードなど、ユーザーの特性に応じた分散学習や推論などのスケジューリングの可能性を実感できる構成になるという。

同実証では、NVIDIAアクセラレーテッドサーバーを川崎・三鷹・秋葉原の3拠点のDCに分散配置し、100Gbps回線のAPNで接続した。NVIDIA NeM0(生成AIモデルを構築・カスタマイズ・デプロイするための開発プラットフォーム)を使用して、3拠点のGPUサーバーを連携させ、NTT版独自LLM「tsuzumiモデル 7B」の分散学習を実施した。

結果、tsuzumi 7Bの事前学習を動作させることに成功。単一DCで学習させる場合の所要時間と比較して、インターネットを想定し帯域制限を実施したTCP通信の分散DCでは9.187倍の時間を要しましたが、APN経由の分散DCでは1.105倍と、単一DCとほぼ同等の性能を発揮できることを確認したとしている。

関連リンク

RELATED ARTICLE関連記事

SPECIAL TOPICスペシャルトピック

スペシャルトピック一覧

NEW ARTICLES新着記事

記事一覧

FEATURE特集

WHITE PAPERホワイトペーパー

ホワイトペーパー一覧
×
無料会員登録

無料会員登録をすると、本サイトのすべての記事を閲覧いただけます。
また、最新記事やイベント・セミナーの情報など、ビジネスに役立つ情報を掲載したメールマガジンをお届けいたします。