TOP500、今回の一位は中国のSunway Taihu Light(神威太湖之光)、独自のCPUを使っている。 China Races Ahead in TOP500 Supercomputer List, Ending US Supremacy Sunway TaihuLight - Sunway MPP, Sunway SW26010 260C 1.45GHz, Sunway 中国の独自開発スパコンがTOP500首位に、京と同等の電力で性能9倍 中国の独自スパコンはAlphaアーキテクチャ ・以下のキーワードで検索して記事を集めてみた。 Sunway Taihu Light 神威太湖之光 ShenWei SW26010 申威26010 神威 申威 Alpha 中国のスーパーコンピュータ開発40年:MFLOPSから100 PFLOPSへ(Science Portal China) China Choosing the National CPU Architecture: MIPS and Alpha Seem Favorites(Softpedia) 100 PFLOPS: China’s Supercomputer Circumvents U.S. Sales Ban(VR WORLD) China: two 100 Petaflop machines within a year(scientific computer world) 相比龙芯,申威的“芯”路历程为什么平坦很多?(雷锋网) SCIENCE CHINA Information Sciences 2016年第7期出版了题为:(微博) 前回までのトップはXeon/Xeon Phiを採用した天河2号だったが、2015年に米商務省がNVIDIAやIntelのプロセッサについて輸出制限をかけた。ところがどっこい、今回は独自CPUで一位を取った。開発力ありますね。 ・プロセッサ SW26010について Report on the Sunway TaihuLight System : Jack Dongarra ShenWei-64は1.45GHz、260コア内蔵。命令セットはShenwei-64 Instruction Set(this is NOT related to the DEC Alpha instruction set)、DEC Alphaとは関係ないと書いてある。アウトオブオーダー動作。 チップ内は4つのCG(Core Groups)に分けられ、CGはNetwork on Chip(NoC)で結ばれている。1つのCG内には1つのMPEと8x8=64個のCPEがある。 MPEは64bitコアでユーザモードとシステムモードをサポート、264bitベクタ命令、32KB L1$/32KB D1$/256KB L2$。 CPEは8x8のメッシュ接続された62bitコア(64bitの誤記?)、ユーザモードのみのサポート、264bitベクタ命令、16KB L1$/64KB スクラッチパッドメモリ。この構成はCell B.E.を連想しますね。 1ノード/1チップで40960ノード、システム全体で1.31PB。ここから計算するとメモリは1チップあたり8GB×4枚(DDR3)。 CPEは浮動小数点パイプラインが1本で8flops/cycle(倍精度)、MPEは浮動小数点パイプラインが2本で16flops/cycle(倍精度)。ここから見るとCPEはMPEのサブセットっぽく、かつMPEもCPEもシンプルな構成と思える。 コアあたりのRMax性能から見ると: SW26010 RMax(TFlops)/Core = 93014.6/10649600 = 0.0087 @1.45GHz SW1600 RMax(TFlops)/Core = 795.9/137200 = 0.0058 @975MHz 京 RMax(TFlops)/Core = 10510/705024 = 0.015 @2.0GHz 1GHzあたりのRMax性能を計算すると SW26010=0,0060、SW1600=0,00595とあまり変わらない(京は0.0075)。 京と比較するとコア数は15倍、性能は9倍。 同日、post-Kに64bitARM採用の話が流れましたね。 ISC High Performance ということは、今後のトレンドはヘビーなCPU(京)→GPGPU(天河1号など)→軽いCPUたくさん、なのかも。
|
<< 前記事(2016/04/10) | ブログのトップへ |
タイトル (本文) | ブログ名/日時 |
---|
内 容 | ニックネーム/日時 |
---|
<< 前記事(2016/04/10) | ブログのトップへ |