GNC letter
GNCレター
NTTは2025年4月11日、4Kなどの超高精細映像からのリアルタイムでのAI推論を低電力で処理できる「AI推論LSI」を開発したと発表した。エッジ端末などへの搭載が可能で、ドローンや監視カメラへの搭載が期待される。2025年度中に製品化する予定。
深層学習技術の進展により、映像AI技術の活用が進んでいる。具体的な領域としては、ドローンの目視外飛行、ドローンや監視カメラによる人流分析および交通分析、自動被写体追跡などのアプリケーションへの活用がある。これらには4Kなどの高精細カメラ1台で広範囲の物体をリアルタイムかつ低電力で検出する技術が求められていたが、現状のAI推論モデルYOLO v3公式モデルは最大サイズが608×608ピクセルで4Kサイズ(3,840×2,160ピクセル)の映像を縮小して推論を行っていたため、低解像度となり、小さな被写体が潰れてしまい、AIによる検出が困難になるという課題があった。
同社が今回開発したAI推論LSIでは、入力画像サイズ(3,840×2,160ピクセル)を制約サイズ(608×608ピクセル)にまで分割し、分割画像毎に推論を実施することで小さな物体を検出可能にした。また、分割画像をまたがる大きな物体を検出するため、画像全体を縮小しての推論も実施し、分割画像毎の推論結果と合わせて最終的な検出結果を得る。これにより、4Kにおいても大小両方の物体の検出を可能にした。なお、分割処理と全体処理は独立して実行が可能なため、ハードウェアによる並列実行も可能であるという。
加えて同社は独自のAI推論エンジンも開発。フレーム間相関を利用した演算効率化や動的ビット精度制御などの独自技術を導入し、検出精度を確保しつつも計算量を削減した。これにより、低解像度に縮小した際の消費電力と同等以下の20W以下の電力で、分割量が多い4K解像度でのリアルタイム物体検出処理(30fps)が可能となった。
新たなAI推論LSIは特にドローンへの搭載が想定されており、同LSIの搭載により、最大150mの高度から物体検出が可能となり、目視外での安全航行が可能になるとともに、人流分析や交通量分析サービスでは、より広範囲での検出が可能となる。
今回の研究開発成果は4月9日~10日に米サンフランシスコで開催された「Upgrade2025」で展示された。
半導体/MEMS/ディスプレイのWEBEXHIBITION(WEB展示会)による製品・サービスのマッチングサービス SEMI-NET(セミネット)