NTTは2025年4月11日、4K解像度の超高精細映像に対応したリアルタイムAI推論処理を、電力制約の厳しいエッジや端末環境でも実行可能とする新たなAI推論用LSIを開発したと発表した。
超高精細映像AI推論用LSIの概要と想定ユースケース
この技術は、映像解析を伴う業務や生産活動の効率化ニーズが高まるなか、ドローンや公共空間での利用を視野に入れて開発された。従来のAI推論モデルは、演算負荷や学習効率の観点から入力画像サイズに制限があり、一例としてリアルタイム物体検出の代表的なディープラーニングモデルである「YOLOv3」では最大サイズが608×608ピクセルだ。これに対し、今回開発したLSIは、4K(3840×2160)解像度、30fpsの画像をリアルタイムで処理しながらも、消費電力を20W以下に抑える性能を実現した。
技術のポイントは、「AI推論高精細化技術」と「独自の映像AI推論エンジン」の2つ。前者では、画像を縮小せずに分割し、それぞれを並列処理することで小さな物体まで検出可能にするとともに、全体を縮小した推論結果と統合することで大きな物体も捉えることができる。後者では、映像フレーム間の相関性を活用し、必要な演算量を低減することで、並列処理によるリアルタイム性と低消費電力を両立した。
技術のポイント
このLSIを搭載したドローンは、地上150メートルからの広域映像において人や物体を正確に検出できるようになるという。従来は検出可能な高度は約30メートルだったが、この性能を活かし目視外航行中の安全性向上や設備点検の自動化・省力化にもつながるとしている。また、公共空間での人流・交通分析、自動被写体追跡などのユースケースにも展開が期待される。
同LSIはNTTイノベーティブデバイスが2025年度内の製品化を目指しており、今後は対応AIモデルやユースケースの拡張を通じた実用化が進められる見通し。