April, 22, 2021, Cambridge--研究者によると、Netflix、Amazon、Facebookが利用する強力なアルゴリズムは、ガンやアルツハイマー病などの神経変性疾患の生物学的言語を「予測」できる。
数十年の研究で生み出されたビッグデータをコンピュータ言語モデルに供給して、人工知能が、人よりも進んだ発見ができるかどうかを見た。
St John’s College、University of Cambridgeの学者は、マシンラーニング技術が、ガン、アルツハイマー病および他の神経変性疾患の「生物学的言語」を区別できることを確認した。
その画期的な研究は、PNASに発表され、将来的には、病気の原因となる細胞内の文法的誤りを修正するために利用できる。
論文の主筆、Tuomas Knowles教授は「マシンラーニング技術を神経変性疾患やガンの研究に持ち込むことは、絶対的なゲームチェンジャーだ。究極的には、兆候を劇的に緩和したり、ディメンシアを完全に阻止するような薬剤の開発が目的である」とコメントしている。
Dr Kadi Liis Saarは、同様のマシンラーニング技術を使って膨大な言語モデルを訓練し、体内のタンパク質に問題が発生して病気を起こす時に、何が起こるかに注目した。
「人の身体には、数百万のタンパク質が存在するが、研究者は、その多くの機能をまだ認識していない。われわれは、言語モデルベースの神経ネットワークにタンパク質の言語を学ばせた」。
「特に、そのプログラムには、細胞内にあるタンパク質の液滴、形を変える生体分子凝縮体の言語を学ばせた。これは、研究者が生物学的機能やガンやアルツハイマー病などの神経変性疾患を起こす機能不全の言語を解明するために必要である。われわれは、数十年にわたってタンパク質の言語について研究者がすでに発見したことを、それが外的に指示することなく、学習できることを確認した」(Dr Kadi Liis Saar)。
タンパク質は大きくて複雑な分子であり、体内で多くの重要な役割を担う。細胞内のほとんどの仕事を実行する。また、それは、身体の組織、臓器の構造、機能、規則にとって必要とされている。例えば、抗体は、身体を保護する機能をもつタンパク質である。
アルツハイマー、パーキンソン、ハンチングトン病は、最も一般的な3つの神経変性疾患であるが、研究者は、数百あると考えている。
世界中で5000万人に影響が出ているアルツハイマー病では、タンパク質は勝手な振る舞いをし、クランプを形成して健康な神経細胞を殺す。健康な脳は、品質制御システムを持っていて、効果的にこうして潜在的に危険なタンパク質の塊、つまり凝集を廃棄する。
科学者は現在、変性タンパク質の中には、凝縮体と言われる、液体のようなタンパク質の液滴を形成するものがあると考えている。これらは、膜がなく他のものと自由に結合する。不可逆性のタンパク質凝集と違い、タンパク質凝縮体は形成、再形成でき、ラバライトの中の形状が変わるワックスの斑点に例えられることがよくある。
Knowles教授は、「タンパク質凝縮体は最近、科学界で多くの注目を集めている。それらが、遺伝子発現(われわれのDNAがタンパク質にどのように変換されるか)やタンパク質の合成(細胞がどのようにタンパク質を作るか)など、細胞における重要な出来事を制御するからである」。
「これらタンパク質液滴に関係するいかなる欠陥でもガンなどの病気につながる可能性がある。これが、タンパク質の機能不全の分子起源の研究に自然言語処理技術を持ち込むことが重要な理由である。もしわれわれが、病気の原因となる細胞内部の文法的誤りを修正できるようになりたいなら、である」。
Dr Saarは、「われわれは、そのアルゴリズムに、既知のタンパク質についてもっている全てのデータを供給した、これらのモデルが人の言語について、またWhatsAppが、言葉の使い方を指示する仕方をどのように知るかを学習するのと同じように、それが学習し、タンパク質の言語を予測できるようにするためである」と説明している。
「するとわれわれは、あるタンパク質だけが細胞内に凝縮物を形成する特殊な文法について、それに問うことができた。それは、極めて困難な問題であり、それを解明することは、病気の言語のルールを学習する際に役立つ」。
マシンラーニング技術は、急速に発展している。これは、利用できるデータ量が増加しており、DraBotコンピューティングパワーが増加し、より強力なアルゴリズムを作る技術が進歩しているからである。
マシンラーニングをさらに利用すると、未来のガンや神経変性疾患研究は変貌する。
発見は、科学者が病気について現在すでにしていることを超えており、可能性としては、人間の脳が、マシンラーニングの助けなしに理解できることを超えることさえある。
Dr Saarは、「マシンラーニングは、研究者が、科学的探求にとっての目標と考える限界から自由である。つまり、これまで思い及ばなかった新たな接続である。それは実に素晴らしいことだ」とコメントしている。
(詳細は、https://www.joh.cam.ac.uk)