顧客DCで動く「AI Factory」
AI Continuum実現の一環として、新たなインフラの提供形態も登場している。「AWS AI Factory(以下、AI Factory)」だ。
一般にAIファクトリーという言葉は、大量のデータを用いたAIモデルの学習・開発から運用までを担う基盤を広く指すことが多い。AWSがいうAI Factoryは、顧客のデータセンター内にAWSが構築・運用するフルマネージド型のAIインフラを意味する。最新のAIチップや専用ネットワーク、高性能ストレージ、各種AIサービスをAWSが提供する仕組みである。
顧客環境でAWSインフラを利用できるという点において、AI Factoryは「AWS Outposts」と類似点があるが、両者の性格は異なる。Outpostsがラックやサーバー単位のソリューションで、利用可能なサービスが比較的限定されるのに対し、AI Factoryは大規模なAIワークロードを想定している。顧客がデータセンターと電力を用意し、その上で最新のAIチップや専用ネットワーク、高性能ストレージ、各種AWSサービスをAWSが提供する構成を取る。「Amazon Bedrock」や「Amazon SageMaker」といったAI向けサービスに加え、幅広いAWSのサービスが利用可能だ。
AWSのインフラストラクチャソリューションにおける考え方にも違いがある。Outpostsが顧客環境でAWSを利用するためのオンプレミス拡張の仕組みであるのに対し、AI Factoryは顧客の専用環境として動作し、より広範なAWSサービスと統合しながらも、完全な分離と運用上の独立性を確保するソリューションとして位置づけられている。
AI Factoryの構成イメージを図表4に示す。顧客データセンター内にAWSマネージドのセキュリティペリメーター(境界)を設け、その内部にAI基盤を配置する。顧客側が担うのは、データセンター、冷却設備、電力、入館・アクセス制御などであり、AWS側はその内側のインフラを管理する。AWSは、AI Factoryでも自社リージョンと同じ高いインフラ基準に基づく評価を行い、各サービスには通常と同様のSLAを適用する。アーキテクチャ上、AI Factoryはリージョンと接続して利用する形になる。
図表4 顧客データセンター内におけるAWS AI Factoryの構成

また、顧客はAWSが派遣する運用担当者の国籍やセキュリティクリアランスの要件を共同で定義できるため、立地に加え人員の面でも主権要件や機密データの取り扱いに関する各種規制に対応しやすくなる。
最新のGPUやネットワーク、さらにAIモデルはAWS側が一体的に提供・管理するため、ユーザー企業が個別のベンダーと調達や更新の交渉を重ねる必要がないことも長所だ。
すでに導入事例もある。アンソロピックは大規模なモデル開発基盤としてAI Factoryを活用しており、サウジアラビアのAI企業・HUMAINも国家的なAI基盤の構築にAI Factoryを採用したという。
瀧澤氏は、「AWSのトラフィック量は毎日増えており、どれだけ迅速に顧客の要望に応えられるかが肝心だ」と話す。AI需要の拡大と多様化が進むなか、問われているのは単なる計算資源の増強ではない。リアルタイム性やセキュリティの強化を含め、AIインフラ全体を一貫して革新していくことが不可欠だ。AWSは常に顧客の声に耳を傾け、自らも手を動かしながら、その実装を加速させている。










