August, 29, 2024, Lausanne--EPFLの科学者たちは、ナノマテリアルの化学分析を改善するためのAIベースの技術を開発し、ノイズの多いデータや混合信号の課題を克服した。
「ナノマテリアル」とは、1つの単位が1nmから100nm(ナノメートルは10億分の1メートル)のサイズの化学物質または材料を指す広義の用語。それらには、カーボンナノチューブ、銀ナノ粒子(抗菌剤として使用)、ナノ多孔性材料、および化学反応を効率的に駆動するために使用される多くの種類の触媒などの珍しい材料が含まれる。
ナノ材料は現在、医療からエレクトロニクスまで幅広い分野で使用されており、その正確な化学組成を決定する能力が不可欠。それにもかかわらず、ナノ材料を分析するための従来の方法は、低い信号対雑音比(SNR)の影響を受けやすい傾向があるため、これは困難であることが証明されている。
例えば、広く使用されている方法の1つは、走査型透過電子顕微鏡と組み合わせたエネルギー分散型X線分光法(EDX)。この手法では、サンプル内の様々な元素がどこにあるかを詳細にマップできるが、特にそのような小さな物体ではノイズの多いデータが生成され、異なる材料が重なると信号が混在するため、正確な化学分析が困難になる。
ノイズの多いデータは通常、単純な空間フィルタリングから主成分分析などのより高度な機械学習アプローチまで、様々な手法で「クリーンアップ」され、信号とノイズを分離するが、それらにも欠点がある。たとえば、エラーが発生したり、化学信号が非常に似ている場合に区別に困難になることがある。
今回、EPFLの3人の科学者、Hui Chen、Duncan Alexander、Cécile Hébertは、EDXデータの明瞭度と精度を向上させ、ナノマテリアルの様々な化学元素の同定と定量を容易にするPSNMF(Non-negative matrix factorization-based pan-sharpening非負行列因数分解ベースパンシャープニング)と呼ばれる機械学習ベースの方法を開発した。
チームは、「ポアソンノイズ」と呼ばれるデータの特別な特性を活用することから始めた。このタイプのノイズは、X線光子の検出がランダムであるために発生する。電子ビームがサンプルに当たると、X線光子が生成されるが、検出される数は毎回ランダムに変化し、ポアソンノイズと呼ばれるノイズの多い粒子の粗いパターンが作成される。
データの明瞭度を向上させるために、研究チームは近くのピクセルからのデータを結合し、空間分解能を犠牲にしてスペクトルのSNRを向上させた。
次に、このより明確なデータセットに「非負行列因数分解」(NMF)と呼ばれる機械学習手法を適用した。NMFは、大規模なデータセットをより単純で小さな部分に分割し、すべての部分が負でないことを確認する数学的手法であり、データのパターンを特定するのに有用である。このアプローチにより、優れたスペクトルデータが得られたが、大きなピクセルで画像がぼやけていた。
次に、詳細な空間情報を保持するために、元の高解像度データセットでNMFプロセスを繰り返したが、以前に特定されたスペクトル成分で因数分解を初期化した。最後に、両方のステップの結果を組み合わせて、高いスペクトル忠実度と高い空間分解能の両方を備えた高品質のデータセットを作成した。
チームは、研究室で開発されたモデリングアルゴリズムにより計算された合成データを使用してPSNMFを検証した。これらのデータは、極限条件下で形成された鉱物サンプルの分析など、現実世界の課題を模倣していた。この方法は非常に効果的であることが証明され、様々な材料を、たとえ少量であっても正確に識別して分離することができた。
ナノ鉱物やナノ触媒などの実際の試料に適用したところ、PSNMFは重なり合う物質の分離と定量に成功した。この正確な分析は、これらの複雑なナノ構造に依存する新しい技術を理解し、開発するために重要である。
PSNMFは、ナノスケールの化学分析における大幅な改善である。この手法は、ノイズの多いデータや信号の重なりにもかかわらず正確な結果を提供することで、高度なエレクトロニクスから医療機器まで、様々な分野でナノ材料を研究し活用する能力を高める。