Science/Research 詳細

画像を認識するAIをコンパクトに実装できる新手法開発

May, 27, 2024, 筑波--画像認識に使われる人工知能(AI)技術は人間の視覚と脳ニューロンを模倣した構造をしている。視覚及び脳ニューロン部分の計算と計算に使われるデータを削減する三つの手法の最適な適用割合を自動的に発見するアルゴリズムを開発した。
AIの消費電力削減や半導体の小型化につながる。
空港での入国審査における顔認証や自動運転における物体認識などでは、人間の視覚をモデルにした「畳み込みニューラルネットワーク」(CNN)と呼ばれる人工知能(AI)の計算手法が用いられている。CNNは畳み込み演算部分と全結合演算部分から構成され、前者が人間の視覚に、後者が視覚情報から画像の種類を推論する脳の働きに相当する。CNNについては、視覚の部分、脳ニューロンの部分の計算をバランス良く削減してより小さな構成とし、計算に使われるデータの精度(ビット数)も限界まで削減することで、元のCNNと同一の認識率を実現できることが知られている。これにより、計算量を減らし、それを実現するハードウェアをコンパクトにできる。

このような削減手法として、視覚部分を削減するNetwork Slimming(NS)、脳ニューロンの部分を削減するDeep Compression(DC)、ビット数を削減するInteger Quantization(IQ)の三つのが知られているが、それらの手法の適用順序や適用の程度については明確な指標がなかった。

研究では、これら三種類の手法を適用する最適な順序はIQ→NS→DCであることを解明し、各適用割合を自動的に決定できるアルゴリズムを開発した。これまでは総当たりの試行錯誤で最適解を探していたが、このアルゴリズムを使えば、CNNを28倍も小さく圧縮できる三つの手法の削減割合を、従来よりも76倍も速く発見することが可能。

研究成果は、広く普及していく画像認識のAI技術において、計算量を劇的に下げ、消費電力量の減少やAI向け半導体デバイスの小型化を実現する新技術となることが期待される。
(詳細は、https://www.tsukuba.ac.jp/journal/technology-materials/20240522140000.html