Science/Research 詳細

NICT、暗号化したままデータを分類できるビッグデータ向け解析技術を開発

January, 19, 2016, 東京--NICT セキュリティ基盤研究室は、大量のデータを暗号化したまま複数のグループに分類できるビッグデータ向け解析技術を開発した。
 この技術は、NICTが開発していた準同型暗号技術SPHERE(スフィア)とロジスティック回帰分析技術を組み合わせることで実現した。暗号化した状態でデータを分類できるので、個人情報などの機微な情報を安全に効率よく分類することが可能になる。応用例の一つとして、この技術を用いて健康診断等のデータから病気の判定を行う際に、データ処理を行う第三者にデータの内容を開示せずに済み、プライバシーを保護できるようになると期待される。
 高速化の要となる技術は、関数の近似とデータ処理の分割の2点。
 NICTはまず、ロジスティック回帰分析中に含まれる複雑な関数を単純な多項式で近似し、準同型暗号と組み合わせることで、現実的な時間で動作する方式を考案した。
 次に、ロジスティック回帰分析に含まれる計算をデータ加工処理と集計処理の2つの部分に分割し、データ加工をあらかじめデータ提供者側で行うことで高速化を推し進めた。
 これら2点の改良と、NICT開発の準同型暗号SPHEREを組み合わせることで、大量のデータを暗号化したままでロジスティック回帰分析を行うことが可能になった。シミュレーションによって、サーバ上で1億件のデータを30分以内で分析可能であることが確認できた。
 また、UCI機械学習リポジトリにて公開されている実験用データを用い、今回開発した技術により、データを暗号化したままロジスティック回帰分析を行った結果と、SPHEREを用いずに分析した結果がほぼ一致することを確認した。
 開発した技術を用いることで、クラウドサーバ等を用いてデータの分類を行う際、データに含まれるプライバシー情報がサーバ管理者に漏えいすることを防ぐことができる。
 今回開発した技術により、例えば、医療分野において、世界中の被験者から収集したデータを、プライバシーを保護したまま解析することが可能になる。これにより、新たな診断方法や治療法の早期かつ効率的な発見に繋がることが期待される。
 研究成果は、2016年1月19日~ 22日に熊本県熊本市で開催される「2016年暗号と情報セキュリティシンポジウム(SCIS2016)」で発表する。