August, 4, 2023, Eindhoven--データをDNAに蓄積することは、サイエンスフィクションのように聞こえるが、それは近い将来にはある。
Tom de Greef教授は、5~10年で初のDNAデータセンタが設立され、稼働すると予想している。データは、ハードディスクに0sと1sとして蓄積されるのではなく、DNA: AT and CGを構成する塩基対に蓄積される。そのようなデータセンタは、ラボの形式となり、今日のものよりも何倍も小さい。De Greefは、すでに、その全てをイメージできる。ビルの一角に新しいファイルがDNA構成によりエンコードされる。他の部分は、広大なカプセルフィールドを含み、各カプセルにファイルが格納されている。ロボットアームが、あるカプセルを取り出し、その内容を読み、それを元に戻す。
われわれは合成DNAについて話している。ラボでは、合成的に作られたDNAストランドを形成するように特定の順序にスタックされている。現在データセンタに蓄積されているファイルや写真は、今度は、DNAに蓄積できるようになる。当面、その技術はアーカイブストレージにのみ適している。これは、蓄積データの読取りが非常に高価だからである。したがって、DNAファイルの参照は、可能な限り少なくしなければならない。
大規模、エネルギーを大量消費するデータセンタは時代遅れになる
DNAにおけるデータストレージには、多くの利点がある。DNAファイルは、例えば、遙かにコンパクトに蓄積できる、またデータの寿命も何倍も長い。しかし、おそらく最も重要な点は、この新技術が、大規模でエネルギーを大量消費するデータセンタを時代遅れにすることだ。また、これは切実に求められている、とDe Greefは警告している。「3年でわれわれは、その半分を蓄積できなくなるほどのデータを世界中で生み出すからである」。
Ph.D学生、Bas BögelsMicrosoftおよび大学のグループとともにDe Greefは、合成DNAでデータストレージのイノベーションをスケーラブルにする新技術を開発した。成果は、Nature Nanotechnology誌に発表された。De Greefは、TU/e、Department of Biomedical EngineeringおよびInstitute for Complex Molecular Systems (ICMS)で研究しており、またRadboud University.の客員教授でもある。
拡張性
データストレージにDNAストランドを使うというアイデアは、1980年代に現れたが、当時はあまりに難しく、高価だった。30年後、DNA合成が軌道に乗り始めたとき、それが技術的に可能になった。Harvard医科大学、遺伝学者、George Churchが、2011年に、そのアイデアについて詳説している。それ以来、合成とデータ読取りが著しく安価になり、ついにその技術が市場に出た。
近年、De Greefと同氏のグループは、主に蓄積データを研究している。差しあたり、これは、この新技術が直面している最大の問題である。現在、このために使われるPCR法、「ランダムアクセス」は、非常にエラーが起こりやすい。したがって、一度に一つのファイルしか読めない、さらに、そのデータ品質は、ファイルを読む毎に非常に劣化する。必ずしもスケーラブルとは言えない。
それがどう働くか。PCR (Polymerase Chain Reaction)は、所望のDNAコードをもつプライマーを加えることで必要なDNAピースのコピーを数100万作る。例えば、ラボでのコロナテストは、これに基づいている。鼻からの微量のコロナウイルス物質でも何度もコピーすると検出できる。しかし、多数のファイルを同時に読もうとすると、その働きをする多数のプライマーペアが同時に必要になる。これは、コピーの過程で多くのエラーとなる。
全てのカプセルが1つのファイルを収容
これが、カプセルが機能するところである。De Greefのグループは、タンパク質のマイクロカプセルとポリマを開発し、次にカプセル毎に1つのファイルを固定した。「これらのカプセルは、われわれが利点として利用できる熱特性がある(De Greef)。50℃以上でカプセルは、閉じる、各カプセルでPCRプロセスが個別に起こる。エラーが起こる余地はない。De Greefは、これを「熱閉じ込めPCR」と言う。ラボでは、これまでは、大きなエラーなしで、同時に25ファイル読むことができた。
再び温度を下げると、コピーはカプセルから取り出され、固定されたオリジナルが残る、つまり元のファイルの品質は劣化しない。「現在、われわれは、3回読み取った後、0.3%の損失であるが、既存の方法では35%の損失だ」(De Greef)。
蛍光で検索可能
それが全てではない。De Greefは、データライブラリの検索を一段と簡単にした。各ファイルは、蛍光ラベルで与えられ、各々が、それ独自の色をカプセル化している。デバイスは、すると、その色を認識し、それらを相互に分離する。これによりわれわれは、話の最初、架空のロボットアームに戻る。それは、将来的には、カプセルプールから所望のファイルを巧妙に選択する。
これは、データ読取り問題を解決する。「今では、DNA合成のコストがさらに下がるまで待つという問題に過ぎない。同技術は、次にアプリケーションの準備をする」(De Greef)。結果的、オランダは、世界初のDNAデータセンタを間もなく開設できる。