「AIが物理世界を認識し、理解し、自律的に判断・行動するための技術」と定義されるフィジカルAIへの期待が高まっている。
フィジカルAIを導入し、発展させるための基盤をどう作ればいいのか――。そんな悩みを抱える企業が増えるなか、ソフトウェア開発のアステリアと、GPUクラウドサービスを提供するハイレゾの2社は2026年6月17日にメディア向けセミナー「今さら聞けない『フィジカルAI』」を開催した。
→ アステリアのセミナーについてはこちら(フィジカルAI時代に「何が競争力を左右するのか」、アステリアが語る実装の4ステップ)
ハイレゾ アライアンス本部 プロダクト・技術戦略担当の川本信博氏は、フィジカルAIの発展を支えるGPUインフラの現状と課題について解説。「AIを学習させるデータは、その企業の競争力そのものになる。それを海外資本のクラウドに預けてしまっていいのか」と、国産による計算基盤整備の必要性を強調した。

ハイレゾ アライアンス本部 プロダクト・技術戦略担当の川本信博氏
ロボットの知能獲得は第3世代に
川本氏はまず、ロボットが現実世界を扱うための知能が進化してきた歴史から説明した。
第1世代はすべての動作を人間がプログラムで記述する時代であり、工場のような定型的な環境には適する一方、家庭や道路といった予測不能な環境には対応できないという限界があった。
2012年頃から始まる第2世代は、ディープラーニングと強化学習の登場により自律学習が可能となった。大量の画像データから「見る(認識する)」ことを自ら学習し、強化学習によって試行錯誤しながら上達する能力を獲得。しかし、「世界を本質的に理解していない」ため、膨大な試行回数が必要だった。

VLAの統合イメージ
そして、現在の第3世代では、トランスフォーマー技術の導入によって視覚・言語・行動を統合するVLA(Vision-Language-Action)モデルが実現した。「コップを取って」という言葉を理解し、「インターネット上の常識を活用して『初めて見たもの』も扱えるフェーズへ移行しつつある」(川本氏)。








