コヒレント特設ページはこちら

Science/Research 詳細

RapidIOベースクラスタでコンピューティングのブレイクスルーを加速

November, 26, 2014, San Jose-- IDT(Integrated Device Technology, Inc)は、モバイルプロセッサを接続した高密度・低遅延クラスタにより、オンラインゲームやハイパフォーマンス・コンピューティング(HPC)や分析学で必要とされる大量データを処理できるよう設計された画期的な計算アーキテクチャを開発した。
 IDTはOrange Silicon Valleyと協力し、最大16 Gbpsで複数ノードを接続するIDTのRapidIOインターコネクト技術を用いて、低電力のNVIDIA Tegra K1モバイルプロセッサによる高スケーラビリティ・低遅延大型クラスタを共同開発した。このアーキテクチャは1ラックあたり2,000ノード以上に拡張でき、PCI ExpressやEthernet技術では達成できない極めて高いGflop密度とエネルギー効率を実現する。
 その結果得られるのが、非常に小さな基板面積に組み込まれた、前例のない強力な計算能力。1Uサーバあたり最大23 Tflops、ラックあたり800 Tflops超の計算能力を持つこのクラスタアーキテクチャは、世界最高のスーパーコンピュータである中国のTianhe-2のおよそ2倍の計算密度を実現する。モバイルグレードGPU技術に加えて分散スイッチングとインターコネクトを利用し、クラス最小の設置面積でノードあたりのI/Oとコンピュートのバランスを取ることで、この密度を達成している。
 この新しいアーキテクチャは、データレート16 Gbpsのコンピューティングコアを各ノードに合わせて搭載し、業界における現在の主な限界の一つであるコンピューティングとスループットのバランスを改善している。40 GbpsのIDT RapidIO 10×N技術により、今後もコンピュート対I/O比率は改善し続けるとIDTは見ている。
 このアーキテクチャでは19インチの1U基板に60基のノード、ラック1台に2,000基以上のノードを搭載することができる。いずれのノードもファブリック遅延時間はわずか400nsで他のノードと通信できる。メモリ間の遅延は2µsを下回る。各ノードは、RapidIO NICへのTsi721 PCIeと、データレート16Gbpsで384 Gflops(I/Oビットあたり24回の浮動小数点数演算)のTegra K1モバイルプロセッサから構成される。これは、データセンタのラックレベルや、無線アクセスネットワークの個々のアナリティクスサーバレベルで有益となる。
 このクラスタはNVIDIAのJetson TK1開発キットによって実現した。このキットは画期的なNVIDIA Tegra K1モバイルプロセッサを原動力としている。世界最速のスーパーコンピュータに搭載されているのと同じNVIDIA Kepler GPUアーキテクチャをベースとしたTegra K1は、完全にプログラマブルなCUDAコア192基により、高度なグラフィックス性能と計算性能を持つ。