Science/Research 詳細

KIT、AIがタンパク質の構造を予測

August, 23, 2019, Karlsruhe--タンパク質の構造の確定は難しく、これまでは高価であった。KITの研究チームは、より効率的な方法を開発した。
 タンパク質は、生物学的な高性能マシーンである。あらゆる細胞に見つかり、人の血液凝固で、また髪や筋肉の主成分として重要な役割を担っている。これら分子ツールの機能はその構造から明らかである、カールスルーエ工科大学(KIT)の研究チームは最近、人工知能の助けを借りてこのタンパク質の構造を予測する新しい方法を開発した。
 その構造に応じて、タンパク質は、浸透したり囲い込んだりして、他の分子と相互作用できる。これは発見が非常に難しい。この目的のために必要な実験は高価であり複雑である。KITのコンピューティングセンタ、Steinbuch Centre for Computing (SCC)の研究者は、タンパク質配列のデータベースを探し、様々な種の同じタンパク質を比較した。「身体で酸素輸送に関わるヘモグロビンは、昆虫、野ねずみ、チンパンジーにも見つけることができる」とSCCのデータアナリスト、Markus Götzは言う。タンパク質構造は、真珠の数珠に似ている、そのストリングはタンパク質成分、アミノ酸でできている。その3D構造と関連する特性は、ペアを形成する。これは、ある程度離れた「真珠」の結果であり、このようにしてタンパク質を折り畳む。これらのペアは、生命体が違えば違う可能性がある。しかし、タンパク質の特性は同じままである。「有害変異は、進化の過程で取捨選択される」とGötzは言う。
 最近、Götzのチームは、進化中に既知のタンパク質配列でどのペアが成功したかを人工知能(AI)に教えた。「既知のタンパク質配列に関してもシステムが結論を出してくれると考えている」とGötzは話している。利点は、「タンパク質鎖を形成するアミノ酸を確認することは容易である。しかし、実験でタンパク質構造を直接決めるのは非常に複雑で、コストは数百万だ」とAlexander Schug, SCCは付け加えている。
 タンパク質の接触を予測するためにAIを使うことは新しくない。「現在、画像処理法をこの目的に適用している」(Götz)。そのようなニューラルネットワークは、パターン認識が得意である。しかし、タンパク質構造の決定では、互いに離れているタンパク質成分の接触が特に重要である。折り畳み中に、その構造に対する影響が、互いに密接しているタンパク質成分と比較して、大きいからである。「このため、われわれは自動言語翻訳からのアプローチを利用する。別の言語に翻訳されなければならないアミノ酸鎖センテンスを考えている」。いわゆる「自己注目ニューラルネットワーク」が、普及版の翻訳プログラムに適用されている。そのようなプログラムは、センテンスのどの部分がリンクするか、つまりタンパク質のコンテクストで、どのアミノ酸がペアを形成するかと言うことである。
(詳細は、https://www.kit.edu)