【レポート】
SC14でのGreen500の1位に輝いたのは、ドイツのダルムシュタットにあるヘルムホルツセンターの「Lattice-CSC」というスパコンである。スコアは、5271.87MFlops/Wで初めて5GFlops/Wを超えた。2位は高エネルギー加速器研究機構(KEK)のSuiren(睡蓮)の4945.63MFlops/W、3位は東工大のTSUBAME-KFCの4447.58MFlops/Wで、4GFlops/Wを超えたのはこの3システムだけである。
恒例であるが、1位から3位には表彰状が手渡され、その後、1位のチームは、どのようにして高スコアを実現したかなどについて発表を行うことになっている。
|
|
|
|
Green500 1位の受賞発表を行うDavid Rohr氏 |
発表のタイトルスライド。L-CSCは量子色力学の計算のためのシステムとして設置されるAMDのGPUをアクセラレータとして使うシステムである |
L-CSCは量子色力学の計算を行うために設置されるシステムで、計算ノードは、ASUSの2ソケットサーバで、CPUは10コアのIvy-Bridgeを2個使用し、それに4台のAMDのFirePro S9150 GPUを接続している。最終的には160ノードのシステムになる計画であるが、まだ、システム構築中で、今回の結果は56ノードで測定されている。
ソフトはGPLライセンスで入手できるオープンソースのCALDGEMMとHPL-GPUをカスタマイズして使っているという。次の図に示すように4GPUまでは完璧に性能がスケールしている。
次の図に示すように、実線のCPU処理時間が破線のGPU処理時間を下回っていれば、パイプライン処理がうまく働き、全体の95%以上でこの条件が成立している。そして、DGEMMはGPUだけでやらせる方法とCPUとGPUで処理分担する方法を実装しており、両者を使うと2-5%性能が高くなるが、GPUオンリーの方が3-4%エネルギー効率が高い。このため、両者をダイナミックに使い分けているという。なお、このグラフで、GPUオンリーの処理の場合、CPU時間は非常に短く、GPU処理時間が長くなっている。一方、両者を使った場合は、GPU処理時間は多少減り、CPU処理時間は長くなっているが、それでも、概ね、GPU処理時間を下回っている。
また、DTRSMについてもGPUに一部オフロードすると、残った行列のサイズが大きい場合は性能上有利であるが、行列サイズが小さくなると逆転するので、これもダイナミックに切り替えてその時点で最良のものを使っている。
|
|
|
縦軸はDGEMの1回のループの時間。横軸は残っている行列のサイズ。実線のCPU処理時間が破線のGPU処理]時間を下回っていれば、パイプラインがうまく動く。2本の実線と破線はDGEMMをGPUだけでやらせた場合と、CPUも使った場合 |
また、CPUはDVFSを使って最良の条件で動かしている。一般的には低いクロックの方が効率が高いが逆転する場合もあるので、それぞれの時点で最適のクロックを選んでいる。
これらの動作条件のダイナミックなチューニングに加えて、GPUにもDVFSを適用し、処理の初期のCPU負荷の小さいときや処理の終盤のGPU負荷の小さいときは、不要なCPUやGPUは低電力状態にしてしまってエネルギーを節約している。
そしてハードウェアとしては、HDDを使わない、温度にあわせてファンの速度を調節して電力消費を減らしている。
Level 1ではルール上は、コアフェーズの最初と最後の10%の期間を除いた、20%の期間の消費電力を測れば良いことになっているが、70%-90%の期間をとると最後に消費電力が減っているので、この登録ではコアフェーズ全体の消費電力を計測した。結果として56ノードで5295MFlops/Wとなったが、これにInfiniBandスイッチの消費電力257Wを追加して、5271MFlops/Wの値をGreen500に登録したという。
これを電力が減少する70%-90%の区間で測定すると、InfiniBandスイッチの電力を含まない値であるが、6010MFlops/Wとなり、問題の規模を小さくして測定すると、6900GFlops/Wまでスコアを上げられるという。
このため、電力測定は20%の区間でなく、コアフェーズ全体とすべきと主張している。
Level 1ではシステムの1/64を測定すれば良いという点では、一部の良いノードだけが選択的に測定されてしまう恐れがあるので、全体を測定すべきという意見と、100kW以上の大電力を高精度で測るのは難しいので、部分的な測定を認めるべきという両方の意見を併記している。
ITセミナー
一覧大企業のための情報漏洩対策セミナー。情報漏洩が起こる事を想定した対策を講じる
【基調講演】弁護士 辺氏
経営に活かす! 戦略的なITコストマネジメントとは!? 【基調講演】日本スポーツアナリスト協会 千葉氏
| 【レポート】SC14 - Student Cluster Competitionはテキサス大が3連覇を達成 [2014/12/8] |
| 【レポート】SC14 - 富士通の新スパコン「FX100」 [2014/12/5] |
| 【レポート】SC14 - 今年のGordon Bell賞はD.E.Shawリサーチが獲得 [2014/12/2] |
| 【レポート】SC14 - Gordon Bell氏による半世紀におよぶスパコンの歴史の回想 [2014/12/1] |
| 【レポート】SC14 - 日本人初、東工大の松岡教授が「Sidney Fernbach賞」を受賞 [2014/12/1] |
| 【レポート】SC14 - 参加者全員が出席する全体会議「プレナリー(Plenary)」 [2014/11/27] |
| 【レポート】SC14 - ExaScaler/PEZY開発のKEKのスパコン「睡蓮」がGreen500で2位を獲得 [2014/11/21] |
| 【レポート】SC14 - NVIDIAが最上位の科学技術計算用GPU「Tesla K80」を発表 [2014/11/18] |
| 【レポート】宇宙論から感染症対策まで注目分野に向けた発表が目白押し - スパコン最大の学会「SC14」が開幕 [2014/11/17] |
| 東大、1型糖尿病の発症率にタンパク質の安定性が関連と発表 [17:08 12/9] |
| 東大など、カイコを使用した研究でMRSAを99.99%殺傷する新抗生物質を発見 [17:07 12/9] |
| 島津製作所、本社工場内に新ショールーム「Science Plaza」をオープン [17:01 12/9] |
| 【レポート】SC14 - Green500で1位に輝いたL-CSCシステム [15:25 12/9] |
| 【レポート】FTF Japan 2014 - クルマ、通信、セキュリティが創る「明日のインターネット(IoT)」 [15:04 12/9] |
特別企画
一覧人気記事
一覧イチオシ記事
新着記事
|
【インタビュー】LiSA、2度目の武道館ワンマンライブに向けて7thシングル「シルシ」リリース - TVアニメ『ソードアート・オンラインⅡ』EDテーマ [01:30 12/10] ホビー |
|
『探偵歌劇 ミルキィホームズ TD』公開アフレコに主要キャスト5人が集結! [00:05 12/10] ホビー |
|
「このマンガがすごい!」1位は、聲の形&ちーちゃんはちょっと足りない [00:00 12/10] ホビー |
|
[このマンガがすごい!2015]異色作「聲の形」が選出 [00:00 12/10] ホビー |
|
[デビルマン]新作「サーガ」がスタート あれから40年… [00:00 12/10] ホビー |