October, 11, 2022, Freiburg--フライブルク(Albert-Ludwigs-Universität Freiburg)のコンピュータサイエンティストは、複雑な都市環境における知覚進歩への重要な一歩を踏み出す。
移動ロボットは、例え環境の一部が他の物体で遮られていても、環境をいかにして正しく知覚し、理解できるか。これは、自動運転車が大混雑の都市を安全にナビゲートするために解決しなければならない重要な問題である。人間は、物体が部分的に覆われていても物体の完全な物理的構造を想像することができるが、現在のAIはすでに、ロボットや自動運転車が環境を知覚できるようにするとは言え、この能力を持たない。AI搭載ロボットは、環境がどう見えるかを学習すると、迂回路を見つけてナビゲートできる。しかし、群衆の中の人々、交通混雑のなかの車輌など、部分的に隠された物体の構造全体を知覚することは、大きな課題である。この問題を解決するために、フライブルクロボット工学研究者、Dr. Abhinav Valada教授とPhD学生Rohit Mohanは、大きな一歩を踏み出し、共同で2本の論文を発表した。
さらなる安全性を約束する解決策
フライブルクの両研究者は、非形式的パノラマセグメンテーションタスクを開発し、新しいAIアプローチを使って、その実行可能性を実証した。これまで、自動運転車は、パノラマセグメンテーションを利用して周囲環境を理解してきた。つまり、これまでロボットは、画像のどのピクセルが、人や自動車など物体のどの「見える」領域に属するかを予測するだけである。また、そのような物体の事例を特定できるだけである。これまで、欠如していたのは、物体が他の物体によって部分的に遮られていても、物体の形状全体を予測もできることである。非形式的パノラマセグメンテーションの新しい知覚タスクは、環境のこの全体的な理解を可能にする。
非形式的とは、いかなる物体の部分遮蔽も抽象化されなければならないと言うケースである、それらを断片として見るのではない。それらを全体として見るという一般的な解釈がなければならない。したがって、視覚認識のこのような改善された能力は、自動運転車の安全性の改善で大きな前進につながる。
都市の情景理解変革の可能性
IEEE/CVF Computer Vision and Pattern Recognition Conference (CVPR)で発表された新しい論文で研究チームは、確立されたベンチマークデータセットにその新しいタスクを加え、一般に利用できるようにした。研究チームは現在、そのAIアルゴリズムによるベンチマーキングへの研究者の参加を呼びかけている。このタスクの目標は、アモルファス背景クラスの可視領域ピクセル的、意味論的セグメンテーションである。道路、植生、空、カウントできるクラス、車輌、トラック、歩行者などの可視および隠れた物体領域双方の瞬時のセグメンテーション。,
ベンチマークとデータセットは、ウエブサイトで一般に利用可能になっている。これには提案された新しい学習アルゴリズムが含まれる。「このタスクのための新しいAIアルゴリズムで、物体の完全な物理的構造を知覚することにより人がもつ視覚的経験をロボットはエミュレートできるとわれわれは考えている。アモダルなパノラマ的セグメンテーションは、遮蔽が主要な課題となっている後段の自動運転タスクに大いに役立つ。例えば、奥行き推定、オプティカルフロー、対象追跡、姿勢推定、動作予測など。このタスクのためのより進んだAIアルゴリズムで、自動運転車の視覚的認識能力は、革命的にできる。例えば、道路ユーザの全体構造が、常に知覚されるなら、部分的遮蔽に関わりなく、事故のリスクは、大幅に最小化できる」(Valada)。
加えて、シーンにおける相対的奥行き順序を推定することにより、自動運転車は、物体がもっとよく見えようにするにはどの方向へ動くかなど、複雑な決定を実行できる。これらの視覚を現実にするために、そのタスクと利点をAutoSensで主要自動車産業のプロに提案した。
(詳細は、https://kommunikation.uni-freiburg.de)