July, 15, 2015, 東京--理化学研究所(理研)と東京工業大学、アイルランドのユニバーシティ・カレッジ・ダブリン、九州大学、富士通による国際共同研究グループは、ビッグデータ処理(大規模グラフ解析)に関するスーパーコンピュータの国際的な性能ランキングであるGraph500において、スーパーコンピュータ「京」による解析結果で、2014年6月以来、再び第1位を獲得した。これは、東京工業大学博士課程(理研研修生)上野晃司氏らによる成果。
大規模グラフ解析の性能は、大規模かつ複雑なデータ処理が求められるビッグデータの解析において重要となるもので、今回のランキング結果は、「京」がビッグデータ解析に関する高い能力を有することを実証するものである。
近年活発に行われるようになってきた実社会における複雑な現象の分析では、多くの場合、分析対象は大規模なグラフ(節と枝によるデータ間の関連性を示したもの)として表現され、それに対するコンピュータによる高速な解析(グラフ解析)が必要とされている。例えば、インターネット上のソーシャルサービスなどでは、「誰が誰とつながっているか」といった関連性のある大量のデータを解析するときにグラフ解析が使われる。また、サイバーセキュリティや金融取引の安全性担保のような社会的課題に加えて、脳神経科学における神経機能の解析やタンパク質の相互作用分析などの科学分野においてもグラフ解析は用いられ、応用範囲が大きく広がっている。こうしたグラフ解析の性能を競うのが、2010年から開始されたスパコンランキング「Graph500」。
規則的な行列演算である連立一次方程式を解く計算速度(LINPACK、注2)でスーパーコンピュータを評価するTOP500においては、「京」は2011年(6月、11月)に第1位、その後、2014年11月は第4位になった。2015年7月13日に公表された最新のランキングでも引き続き第4位につけている。一方、Graph500ではグラフの幅優先探索(1秒間にグラフのたどった枝の数(Traversed Edges Per Second;TEPS))という複雑な計算を行う速度で評価されており、計算速度だけでなく、アルゴリズムやプログラムを含めた総合的な能力が求められる。
今回Graph500の測定に使われたのは、「京」が持つ88,128台のノードの内の82,944台で、約1兆個の頂点を持ち16兆個の枝から成るプログラムスケールの大規模グラフに対する幅優先探索問題を0.45秒で解くことに成功した。ベンチマークのスコアは38,621GTEPS(ギガテップス)。Graph500第1位獲得は、「京」が科学技術計算でよく使われる規則的な行列演算によるだけでなく、不規則な計算が大半を占めるグラフ解析においても高い能力を有していることを実証したものであり、幅広い分野のアプリケーションに対応できる「京」の汎用性の高さを示している。また、それと同時に、高いハードウェアの性能を最大限に活用できる研究チームの高度なソフトウェア技術を示すものと言える。「京」は、国際共同研究グループによる「ポストペタスケールシステムにおける超大規模グラフ最適化基盤プロジェクト」および「EBD:次世代の年ヨッタバイト処理に向けたエクストリームビッグデータの基盤技術」の2つの研究プロジェクトによってアルゴリズムおよびプログラムの開発が行われ、2014年6月に17,977GTEPSの性能を達成し第1位、2014年11月に19,582GTEPSを達成し第2位。今回、国際共同研究グループによって「京」のシステム全体を効率良く利用可能にするアルゴリズムの改良が行われ、2倍近くの性能向上を達成し、世界第1位を再度獲得した。