次世代超並列計算機開発

多粒子系むけ超並列計算機の開発

多粒子系の場合は、粒子間相互の計算に専用化したプロセッサを作ることでコ スト・パフォーマンスを大幅に向上させることができることが分かってきた。 我々が1995年に完成させた GRAPE-4 は、世界で初めてテラフロップスの速度 を達成した計算機となった。

本研究では、専用計算機でサブペタフロップスの計算速度が達成可能であるこ とを実証する。さらにその専用計算機と、汎用の超並列計算機、さらにこの二 つの中間に位置するFPGAを用いた再構成可能論理を使った多目的計算機を組み 合わせたヘテロジニアス・マルチコンピュータを構築し、分子動力学計算、粒 子的アプローチでの流体計算など広い応用範囲に対して高い実効性能を得るこ とができることを示す。

専用計算機の部分は重力・クーロン力等の長距離力に特化したパイプラインプ ロセッサを2万台(演算器の数でほぼ 100万個)並列に動作させ、現在 の汎用並列計算機の 100倍程度の並列度を実現することにより高いパフォーマ ンスを得る。このような高い並列度が実現可能であるのは、長距離相互作用の 計算ではデータ量に対する計算量の比率が本質的に高いためである。

粒子系のシミュレーションにおいて長距離力の計算が十分に高速化されると、 次に問題になるのは比較的到達距離の短い短距離相互作用である。時間積分、 結果の解析、入出力等は相互作用計算に比べてさらに計算量が小さく、汎用計 算機で十分賄うことができる。

しかしながら、短距離相互作用は問題に応じて多種多様であり、そのそれぞれ に対して専用プロセッサを開発するのは開発コストからみて現実的とはいい難 い。そこで、この部分の高速化のためにはFPGAを使った再構成可能計算機を開 発する。FPGAのコストパフォーマンスは単純比較では専用プロセッサに比べて 2桁近く劣るが、汎用プロセッサに比べれば桁違いに高い性能が達成できる。

概念図
解説図
GRAPE-5 ボード写真
研究風景 1
研究風景 2