July, 16, 2019, Madison--多くの新しいスマートフォンで顔認証機能を提供している高度な技術は、いずれ、驚くほどローテクに聞こえるが、ハイテクアップグレードを採用することになる。
未来へのこの窓は、単なるガラスに過ぎない。ウイスコンシン・メディソン大学(UW-Madison)エンジニアは、センサ、回路、電源不要で、画像を認識できる「スマート」グラスを作製する方法を開発した。
「われわれは、オプティクスを使って、カメラ、センサ、ディープニューラルネットワークの通常セットアップを1枚の薄いガラスに圧縮するオプティクスを使用している」とUW-Madison電気・コンピュータ工学教授、Zongfu Yuは説明している。
研究成果は、Photonics Researrchに発表された。
人工知能を不活性な物に埋め込むことは、一見、サイエンスフィクションに見えるコンセプトである。しかし、それは低消費電力エレクトロニクスの新開地を開く前進である。
現在、電話を見て顔IDでそれを開くたびに人工知能は、膨大な計算リソース(とバッテリ寿命)を消費する。将来的には、1枚のガラスが、全くパワーを使わずに顔を認識できるようになる。
「これは、一般的なマシンビジョンへのルートとは全く異なるものである」とYuはいう。
同氏は、透明な方形に見える1枚のガラスを想定している。戦略的に配置された小さな気泡とガラス内の不純物が特定の方向に光を曲げ、様々な画像間に差をつける。それが人工知能動作である。
概念実証のために研究チームは、手書きの数字を判別するガラスピースを作る方法を考案した。数字の画像から出る光がガラスの一端に入り、次に各々が個別のデジットに対応した、他端の9個の特定点の一つに集光する。
手書きの3が8に変わったとき、そのガラスはリアルタイムで検出できるほどに動的であった。
「そのような簡素な構造でこの複雑挙動が得れるのは素晴らしいことであった」とYu研究室の院生、Erfan Khoramは話している。
数字を認識できるようにガラスを設計することは、マシンラーニングのトレーニングプロセスに似ていた。ただし、エンジニアは、デジタルコードの代わりにアナログ材料を「訓練」した。特に、エンジニアは、様々なサイズと形状の気泡、グラフェンのような光吸収材料を少量、ガラス内部の特定箇所に配置した。
「われわれはデジタルコンピューティングに慣れているが、これはわれわれの見方を広げる。光伝搬の波動力学により,アナログニューラルコンピューティングの新たな方法が可能になる」とYuはいう。
そのような利点の一つは、コンピュテーションが完全パッシブで、材料固有であること。つまり一つの画像認識ガラスは、数十万回使える。
「われわれは、このガラスを生体識別ロックとして使える可能性があり、たった一人の人の顔を認識できるようにできる。1度作製すると、パワーもインターネットも不要で、永遠に続く、つまり数千年後でも、その人のために何かを安全に保つことができる」とYuは説明している。
さらに、それは文字通り光の速度で動作する。ガラスが光波を変形させることにより様々な画像を区別するからである。
先行的なトレーニングプロセスは時間の消費と計算要求が厳しいが、ガラスそのものは造りやすく、安価である。
将来的に、研究チームは、このアプローチが、顔認証のようなもっと複雑なタスクで機能するかどうかを決定する計画である。
「この技術の真の力は、エネルギー消費なく、はるかに複雑な分類作業に、瞬時に対処できることである。こうしたタスクは、人工知能を作るカギになる。無人走行車に交通信号を認識させ、コンシューマ機器の音声制御を可能にするなどだ」とコロンビア大学統計学教授、Ming Yuanはコメントしている。
無数の多様な対象物を区別する能力を驚くほど一般化できる人の視覚と違い、そのスマートグラスは、特殊アプリケーションで卓越している。例えば、一つは数字認識、異なる一つは文字同定、別のものは顔認識などだ。
「われわれは、将来的にマシンビジョンにどのように視覚を与えるかについて常に考えている。また、特殊な、ミッションドリブン技術のイメージングアプリケーションを考えている。これは、マシンビジョンの設計法についてほぼすべてを変えることになる」とYuは言う。
(詳細は、https://news.wisc.edu)