May, 12, 2021, Munich--Technical University of Munich (TUM) およびFritz Haber Instituteの研究チームは、新しい有機半導体、有機FETs(OFETs)、OLEDs、有機太陽光発電(OPVs)向け最適分子材料の探求でアクティブマシンラーニングを利用する。候補分子の多数の可能性に効率的に取り組むために、マシンは、どのデータが必要であるかを自分で決定する。
学習は、以前の経験に基づいた新たな決定を引き出すだけである。この方法で新しい状況に取り組むためには、前にほぼ同じ状況に取り組んだことがなければならない。マシンラーニングでは同様に、これは学習アルゴリズムが、ほぼ同じデータに触れたことがある必要がある。
しかし、ほぼ無限の可能性があるなら、われわれは何ができるか。全ての状況をカバーするデータを生成することは、単純に不可能ではないか。この問題は、無限数の可能な候補分子を取り扱う際には大きな課題となる。
ポータブル太陽電池、巻き取れるディスプレイ
有機半導体は、ポータブル太陽電池、巻き取り可能なディスプレイなど重要な未来技術を実現する。そのようなアプリケーションでは、改善された有機分子、これらの材料で構成される分子を発見する必要がある。この自然のタスクでは、マシンラーニング法の利用が多くなる。これは、コンピュータシミュレーションあるいは実験からのデータに基づいてトレーニングする。
しかし、潜在的に可能な有機分子の数は、推定で10^33となる。この圧倒的な可能性の数により、そのような材料の多様性を反映するだけのデータの生成は実際的に不可能になる。加えて、これらの分子の多くは、有機半導体に適してない。つまり、探すことは無駄骨になる。
アクティブマシンラーニングは、どのデータが必要であるかを自律的に決定
研究チームは、この問題に、いわゆるアクティブラーニングを利用して対処した。既存データからの学習の代わりに、そのマシンラーニングアルゴリズムは、その問題について実際にどのデータが学習する必要のあるかをそれ自身で、反復的に決定する。
研究チームはまず、数個の小さな分子でシミュレーションを実行し、分子の電気伝導性に関連するデータを得る。これは可能な太陽電池材料に注目する際に役立つ手段である。
このデータに基づいて、そのアルゴリズムは、これらの分子に対するわずかな変更が有用な特性につながるかどうか、似たデータが欠如しているために、不確定かどうかを決める。両方のケースで、それは自律的に新しいシミュレーションをリクエストし、新たに生成されたデータで自己改善し、新たな分子を考察し、この手順を反復する。
研究では、チームはこのアプローチが代替探索アルゴリズムよりも著しく効率的であることを示し、新しい有望な分子がこのようにして同定できることを示している。同時に、そのアルゴリズムは、その探索を広範な分子空間に継続して展開している。毎週、それは、次世代太陽電池に導く新たな分子を提案している。また、そのアルゴリズムは、改善を続けている。
(詳細は、https://www.tum.de)