Science/Research 詳細

EPFL、カメレオンAIプログラム、衛星画像の物体分類高速化

July, 23, 2024, Lausanne--AIプログラムは、ほんの一握りの画像を使用してニューラルネットワークをトレーニングし、衛星やドローンのデータから、海洋ゴミ、森林伐採地帯、都市部などの新しい物体を迅速に特徴付けることができる。

科学者は、ドローンや人工衛星が撮影した画像から豊富な情報を得ることができる。これらのスナップショットは、動物の個体数、植生、海面に浮かぶ破片、氷河の被覆など、地球の表面で起こっている変化に関する重要な洞察を提供する。さらに、専門家はニューラルネットワークをトレーニングして、目まぐるしい速度で画像を分類し、個々のオブジェクトを見つけて分類することができる。「しかし、現在利用可能なAIプログラムはどれも、ガレキから木や建物など、ある種類の物体の認識から別の種類の物体への認識をすぐに切り替えることはできない」と、EPFLの環境計算科学および地球観測研究所の所長、Devis Tuia教授はコメントしている。「今日、プログラマーは、膨大な量のフィールドデータを提供することで、新しいオブジェクトタイプごとにアルゴリズムをトレーニングする必要がある。」
Tuiaとチームは、Wageningen University (NL), MIT, Yale and the Jülich Research Center (D)の科学者とともに、ほんの一握りの画像を見せられただけで新しい物体を認識するようにアルゴリズムを訓練できるカメレオンアプリケーションMETEORで、この状況を変えようとしている。

「われわれは、ニューラルネットワークが以前の展開の結果を一般化し、その適応戦略を新しい状況に適用できるようにするアルゴリズムと方法を開発した」(Marc Rußwurm)。

わずか4 つか 5 つの高画質画像があれば、新しいタスクのためにシステムを再トレーニングできる。

画像の分類に関しては、ニューラルネットワークは、人間が何時間もかけて達成できることを瞬く間に行うことができる。これらのネットワークは、手動でアノテーション(注釈)されたデータでトレーニングされるため、ニューラルネットワークに供給されるデータが多いほど、結果はより正確になる。たとえば、樹木や建物は、それらが見られる地域によって大きく異なって見えることがある。つまり、ニューラルネットワークのアルゴリズムは、これらのオブジェクトを確実に認識するために、様々な条件下で撮影されたこれらのオブジェクトの多様な画像を表示する必要がある。「環境科学における問題は、研究ニーズに合わせてAIプログラムをトレーニングするのに十分な大きさのデータセットを得ることが不可能な場合が多いことだ」と、EPFLの元ポスドクで、現在はオランダのWageningen University助教授、Marc Rußwurmは話している。「これは、在来種の樹木の絶滅など、特定の地域に特有の現象を研究したい場合や、海洋ゴミのように統計的には数は少ないが広く分散している物体を特定したい場合に特に当てはまる。」

航空画像や衛星画像でニューラルネットワークをトレーニングする際のもう一つの課題は、可能な幅広い画像解像度とスペクトルバンド、および使用されるデバイスの種類(ドローンや衛星など)に関連している。この問題を回避するために、METEORは適応性があり、メタ学習ができるように設計されており、基本的には、以前に正常に解決されたタスクに基づいてショートカットを取るが、他のコンテキストでも同様である。「われわれは、ニューラルネットワークが以前の展開の結果を一般化し、その適応戦略を新しい状況に適用できるようにするアルゴリズムと手法を開発した」(Rußwurm)。斬新なアプローチのおかげで、METEORは物体の4〜5枚の良い画像を必要とするだけで、十分に信頼性の高い結果を得ることができる。

解像度の違いを活かす
アプリケーションをテストするために、開発者は、異なる地域の画像に基づいて世界中の様々なタイプの土地占有を分類するようにトレーニングされたニューラルネットワークを変更した。その結果、オーストラリアの植生被覆率の測定、ブラジルの熱帯林の森林伐採区域の特定、2020年の爆発後のベイルートの変化の特定、海洋ゴミの発見、都市部の土地利用の種類(工業地区、商業地区、高密度、中密度、低密度の住宅地)への分類の5つの認識タスクを、その都度、少数の高解像度ドローン画像とRGB衛星画像を使用して実行できるようにした、問題によって異なる。「これらのタスクについて、小さなデータセットのみを使用してMETEORに適応した場合、長期間、はるかに多くのデータを使用してトレーニングされたAIプログラムの結果に匹敵することがわかった」(Rußwurm)。
研究チームは今後、基本的なAIを様々なタスクで訓練し、カメレオンの力をさらに完成させる予定である。これにより、無数の認識タスクにさらに簡単に適応できるようになる。また、アプリケーションをユーザインタフェースと組み合わせて、ニューラルネットワークプログラムによって提案された高品質の画像を人間のユーザがクリックできるようにしたいと考えている。
「プログラムには数枚の画像しか表示されないため、それらの画像の関連性が非常に重要だ」とRußwurmは話している。