ハイレゾが語る、フィジカルAIの発展に「国産GPUクラウドが不可欠な理由」

2026.06.23

ページタイトルとURLがコピーされました

「考える」「想像する」「経験から学ぶ」の3つの能力を獲得することで格段の進化を遂げようとしている「フィジカルAI」。ただし、その発展を下支えしてきた計算基盤には今、問題が噴出している。GPUクラウドを展開するハイレゾはメディア向けセミナーで、「国産インフラの整備」が必要な理由を解説した。

「世界モデル」の中でAIが想像・予測

川本氏によれば、この数年で「動きの作り方」にも世代交代が見られるという。「考える脳と動く脳を分ける設計が主流になってきている」とし、これによって人間に近い、滑らかかつ正確な動作が可能になってきている。

二脳アーキテクチャ

二脳アーキテクチャによる分業のイメージ

これを含め、最新のAI研究では「考える」「経験から学ぶ」「想像する」という3能力の統合が進んでいると川本氏は解説した。

「考える」能力は、計画を立てる脳と素早く体を動かす脳の二段構えにより、複雑なタスクを実行する。そして、「経験から学ぶ」能力によって、人の手本を真似るだけでなく、自ら試行錯誤して上達することができるようになる。

さらに、「想像する」能力によって、AIは「世界モデル」と呼ばれるシミュレーターを持ち、“こう動いたら、こうなるはずだ”と行動前に結果を予測することが可能になる。これら3能力の統合によって、AIは人間の認知を一通り獲得する。これが、未知の環境やタスクで使えるフィジカルAIに現実味が出てきた理由だ。

世界モデルに「考える」「経験から学ぶ」能力を統合

巨大化する「作るGPU」

しかし、その代償として、AIを作るのにも動かすのにも膨大なGPUが必要になった。

川本氏は、フィジカルAIに必要なGPUは、現場のデバイスで即座に判断を下す「動かすGPU（推論用）」と、クラウド上で膨大なデータから知能を作り出す「作るGPU（学習用）」の2種類に分かれると説明。そのうえで、後者は桁違いの規模へと巨大化している現状を紹介した。

実例として、オープンソースのVLAモデルである「OpenVLA」の学習には「人がロボットを操作して集めた約97万件の動作データを、64台のGPUで15日間連続稼働させる必要がある」。これでも中規模レベルであり、最新の大規模モデルでは、さらに1～2桁多くのGPUが必要になっているという。

フィジカルAIには2種類のGPUが必要

また、GPUの高密度化によりデータセンターの消費電力は1ラックあたり100kW超に到達。次世代では200kW超に達し、液体冷却が不可欠となっている。

なぜ、国内でなければならないのか

こうした状況の中、「作るGPU」の置き場所をめぐって様々な問題が浮上している。

1つは、もはや個社では持てないレベルにまで巨大化していること。数百から数千のGPUを数週～数カ月フル稼働させるためには、巨額の投資と年単位の準備期間がかかる。さらに、AI学習の需要は変動するため、どうしても遊休期間が増える。そのため、川本氏は「所有するのではなく、必要な時に必要なだけ使う」のが現実解だと強調した。