後藤弘茂のWeekly海外ニュース
AMDが次世代APU「Carrizo」を正式発表
(2015/6/3 17:47)
ノートPC向けに最適化したAPU
AMDは、今年(2015年)のノートPC向けのAPU「Carrizo(キャリゾ)」を正式発表した。Carrizoは、4個の「Excavator(エキスカベータ)」CPUコア、GCN(Graphics Core Next) 1.2アーキテクチャのGPUコアを8 CU(Compute Unit)搭載し、従来は別チップだったサウスブリッジチップを統合したSoC(System on a Chip)となっている。GPUコアは、HSA(Heterogeneous System Architecture) 1.0フル対応となり、CPUコアとGPUコアの間のメモリ共有も改良された。また、メインストリームAPUでは、初めてセキュリティプロセッサも内蔵した。DRAMインターフェイスはDDR4をサポートするが、製品ではDDR3-2133までとなっている。
Carrizoは、従来の「Kaveri(キャヴェリ)」アーキテクチャのモバイル向けAPUラインを置き換える。しかし、デスクトップPC向けAPUはKaveriアーキテクチャが継続される。AMDのAPUは、デスクトップのKaveriとノートPCのCarrizoの2系列に分かれることになる。
2系列に分かれるのは、AMDがCarrizoを、ノートPCのTDP(Thermal Design Power:熱設計電力)枠をターゲットに設計したからだ。従来のAPUは、ノートPCからデスクトップまで広くカバーする設計だった。しかし、CarrizoはノートPCにターゲットを合わせており、そのために、電力効率が非常に高くなっている。
Intelも、かつてデスクトップPC向けCPUとノートPC向けCPUを2系列にアーキテクチャを分けたことがある。しかし、今回のAMDのアプローチはそれとは異なる。CarrizoのCPUコアやGPUコアのマイクロアーキテクチャ自体は、発展させたとはいえ、デスクトップPC向けと共通性がある。しかし、AMDは半導体プロセス技術のオプションやCPUコアのスタンダードセルライブラリや、トランジスタ選択など、チップ設計の根本部分を大きく変更した。そのため、Carrizoは、従来のメインストリームAPUと比較すると、電力効率やダイ(半導体本体)効率が大きく向上した。
加えてAMDは、Carrizoに進歩した省電力機能を組み込んだ。電圧制御やパワーゲーティングなどを大幅に改良。その結果、待機時のS0i3モード時には、SOCの消費電力を50mWにまで下げられるようになった。
アドレストランスレーションをキャッシュ
CPUコアのExcavatorは、Bulldozer系マイクロアーキテクチャの発展形だ。従来アーキテクチャの弱点だったL1データキャッシュのサイズが倍増され、コア毎に16KBだったのがコア毎に32KBになった。また、分岐予測のターゲットアドレスのバッファであるL1 BTB(Branch Target Buffer)のサイズも1.5倍の768エントリになった。改良の結果、Excavatorでは、IPC(Instruction-per-Clock)が4〜15%ほど向上したという。
GPUコアにもアーキテクチャ上の改良が加えられた。プログラミングモデルにも影響する大きな拡張は、GPUコアとCPUコアで共有するメモリへのアクセスの改良。AMDのAPUには、物理メモリアドレスに変換するMMU(Memory Management Unit)が3系統存在する。CPUコア側のMMUと、GPUコアのMMU、そして、I/OのIOMMUv2で、それぞれが仮想メモリアドレスから物理メモリアドレスへのトランスレーションを行なう。しかし、これらのMMUはメモリアドレステーブルを共有しており、同じメモリ空間を扱うことができる。
CPUコアとGPUコアが共有するメモリアクセスは、GPUコアからIOMMUv2を経由してCPUコア側からメモリコントローラにアクセスする仕組みとなっている。アドレステーブルは共通化されているため、CPUコアとGPUコアは、ポインタを渡すだけでデータを共有することができた。しかし、CPUとGPUの共有するメモリアクセスは、IOMMUv2を経由するCPUとGPU間のアクセス経路「Onion/Onion+」を使っており、ここがボトルネックになることがあった。
Carrizoではこの問題を軽減したという。アドレストランスレーション自体のボトルネックを軽減するために、新たなキャッシュ「Address Translation Cache (ATC)」をGPUコアに持たせた。2階層になったキャッシュで、トランスレートしたアドレスをキャッシュする。各CU毎に小さなL1 ATCがあり、全CUで共有する大きなL2 ATCもある。ATCは、IOMMUv2の内部の、テーブルトランスレーションのキャッシュである「Translation Lookaside Buffer (TLB)」と連携しており、TLBのタグを読み込む。また、CPUサイドを経由するGPUからのメモリアクセスは、帯域が狭くなることも問題だった。Carrizoではこの問題も解決してフル帯域を使えるようにしたという。
また、Carrizo世代では、モバイルAPUでもCUが8個有効にされた。結果として512個のFMAD(浮動小数点積和演算ユニット)が動作し、ピークで819GFLOPSの演算パフォーマンスを達成できる。
CPUのように割り込みが可能となったGPUコア
また、コンピュートタスクのタスクスイッチングと、グラフィックスタスクのプリエンプションがサポートされた。これによって、コンピュートとグラフィックスのどちらのタスクも割り込みが許容されるようになる。CPUと同じように、カーネルプログラムを実行中に、プログラム実行を停止して割り込みを入れることが可能になる。言い換えれば、GPUコアをよりCPU的に柔軟に使えるようになる。
GPUコアのグラフィックスタスクの実行時のコンテクストは、レガシーコンテクストも含むために非常に量が多い。それに対して、コンピュート時のコンテクストは、プロセッサの汎用レジスタなどで相対的に量が少ない。そこで、コンピュートタスクの実行時には、GPUのコンテクストの内、コンピュートに関連するコンテクストだけを待避してスイッチすることにした。これがAMD用語でのGPUコンピュートコンテクストスイッチング(GPU Compute Context Switching)だ。
ステイトの待避はCPUと同様にメモリに書き出すことで行なう。GPUコア全体ではコンテクストは大きいが、AMD GPUではコンピュートは個々のプロセッサユニット「CU」単位で管理しており、コンテクストの待避もCU単位で行なう。そのためスイッチングレイテンシはそれほど問題にならないとAMDは説明する。この機能は、実は前世代のKaveriでもハードウェア的には実装されていたが、有効にされなかった。Carrizoで初めて有効にされるとMacri氏は言う。ディスクリートGPUでは、グラフィックスプリエンプションはRadeon R9 285(Tonga:トンガ)からサポートされている。
また、GCN 1.2の重要な拡張であるカラー圧縮機能もCarrizoに加わった。フレームバッファのカラー情報を圧縮する機能で、その結果、実質的にDRAM帯域が拡張される。同じフレームバッファの量で、占めるメモリ帯域が減るためだ。メモリ帯域の制約がきついAPUでは重要な機能だ。
プロセス配線オプションのレベルから変革
Carrizoの重要なポイントは、Kaveriよりも機能や性能を大幅に増やしながら、電力やダイサイズ(半導体本体の面積)は同レベルかそれ以下に抑えたことだ。Kaveriのダイは245平方mmでトランジスタ数は24.1億だった。それに対してCarrizoのダイは250平方mmでトランジスタ数は31億となっている。AMDはサウスブリッジチップも統合し、CPUコアもGPUコアも機能を強化しながら、APUのダイサイズをほぼ同じに抑えた。プロセス技術の世代は同じ28nmだ。
同じプロセス技術で、ダイを肥大化させずに30%も多くの機能を詰め込むために、まず、AMDはプロセス技術の配線オプションを変更した。配線層(Metal Layer:半導体チップのメタル配線層)の構成を、従来のAPUよりも高密度配線に最適化させた。配線層の内、下から8層までを最も配線ピッチが狭い「1x」とし、高密度のローカル配線を可能にした。
この配線層構成は、従来のAPUの構成とは全く異なり、ディスクリートGPUの配線層にに近い。配線ピッチを狭めると、ロジック回路をより稠密にすることが容易になり、消費電力が下がり、電力効率も上がる。
セルライブラリをCPU向けからGPU向けに変更
加えて、AMDはCPUコア設計で、従来のカスタム設計からスタンダードセルへの転換を進め、スタンダードセルライブラリ自体も高密度なものに変更した。Kaveriではパフォーマンス製品向けの13T(13トラック)のスタンダードセルを使っていたという。それに対して、Carrizoでは、高密度製品向けの9T(9トラック)のスタンダードセルを採用した。9Tスタンダードセルは、GPUで採用しているライブラリだ。
こうした設計上の根本的な改良の結果、CPUコアは劇的に小型化した。KaveriのCPUコア「Steamroller(スチームローラ)」に対して、CarrizoのExcavatorコアは、コア自体のサイズが23%も縮小し、ほぼ比例して電力消費も下がっている。
ダイ写真を見れば分かる通り、CarrizoではCPUコアが大幅に縮小されている。また、GPUコアの面積も、かなり小さくなっている。以前の記事ではGPUコアのライブラリも変更されたと書いたが、それは間違いで、GPUコアのライブラリ自体は9Tライブラリで変わっていない。しかし、配線層がより稠密になったため、GPUコアエリアは大幅に縮小した。GPUコアの方がCPUコアよりも配線が複雑であるため、プロセスの配線オプションを稠密にした恩恵はGPUコアの方がより強く反映されるという。また、GPUコアでは、高密度トランジスタになったことで、リーク電流もKaveriより18%少なくなった。その一方で、通常しきい電圧のより高速なトランジスタの比率を高められたため、同電力枠時の動作周波数を10%上げることも可能になっている。
2015年6月3日
- 【速報】Microsoftの講演で東芝のSkylake搭載4K 2-in-1が公開[2015/06/03]
- ASUS、初のCherry Trail採用スティックPCを展示[2015/06/03]
- 【速報】AMDがHBMを採用した次世代GPUをチラ見せ[2015/06/03]
- Qualcomm、160MHz対応11acチップや、中国Allwinnerとの提携を発表[2015/06/03]
- BungBungame、5型有機ELディスプレイのWindows 10スマートフォン[2015/06/03]
- 連載後藤弘茂のWeekly海外ニュースAMDが次世代APU「Carrizo」を正式発表[2015/06/03]
- AMD、Carrizoを「第6世代AMD Aシリーズ プロセッサ」として発表[2015/06/03]
- ASRock、世界初のSATA Expressを活用したUSB 3.1フロントパネル[2015/06/03]
- 【詳報】Intel、USB Type-Cコネクタを採用し、40GbpsになったThunderbolt 3を発表[2015/06/03]
- Dell、InspironノートPCやAiO、小型デスクトップなどを発表[2015/06/03]
- GIGABYTE、Intel 100シリーズチップセット搭載マザーボードを展示[2015/06/03]
- MSI、Twin Frozr Vクーラーを搭載したGeForce GTX 980 Ti[2015/06/03]
- Windows Phone「MADOSMA」が1日で初回分売り切れに[2015/06/03]
- マウス、リード2.4GB/secのSSD搭載デスクトップPC[2015/06/03]
- サンコー、ソーラーパネル付きでモバイルバッテリにもなる首掛け扇風機[2015/06/03]
- Kingston、USB 3.1 Type-A/C両コネクタ搭載のUSBメモリ[2015/06/03]
- Crucial SSD用の性能向上ソフト[2015/06/03]
- ダイジェスト・ニュース[2015/06/03]
- アップデート情報[2015/06/03]
2015年6月2日
- Intel、Iris Pro搭載のデスクトップ向け第5世代Coreプロセッサを発表[2015/06/02]
- ASUS、USB 3.1 Type-C搭載のCherryTrail 2-in-1タブレットを展示[2015/06/02]
- 【速報】Intel、Thunderboltの最新版Thunderbolt3を発表[2015/06/02]
- 【速報】MicrosoftがWindows 10搭載のVAIO Z CanvasやSurface 3を展示[2015/06/02]
- MSI、世界初のアイトラッキングセンサー内蔵ゲーミングノート[2015/06/02]
- MSI、世界初のフルカラーLED搭載マザー「X99A GODLIKE」[2015/06/02]
- 【速報】MSI、Skylake対応マザーボードを展示[2015/06/02]
- Windows 10にも0ドルライセンス“with Bing”が存在[2015/06/02]
- ASRock、ゲーミングブランドを用意しASUSのR.O.G.に宣戦布告[2015/06/02]
- ASRock、3つの機能を集約するハイエンド11acルーター[2015/06/02]
- ASUS、ZenUIを採用したAndroidタブレット「ZenPad」[2015/06/02]
- ASUS、R.O.G.ブランドのコンセプトPCや、G-SYNC対応湾曲液晶を発表[2015/06/02]
- ARM、IoT開発を促進するCortex-MベースのサブシステムIP[2015/06/02]
- 発売日が決まったマウスの「MADOSMA」。Windows 10搭載に向けた取り組みを聞く[2015/06/02]
- マウス、Windows Phone端末を本日より予約開始。実売は3万円前後[2015/06/02]
- 各社、"Broadwell-C"搭載PCを発売[2015/06/02]
- Let'snote夏モデル、店頭向け2-in-1にLTE初搭載[2015/06/02]
- Micron、ゲーミングPC向け16GB DDR4、メモリ128GBのゲームPC構成が可能に[2015/06/02]
- Lenovo、9万円台前半からの一体型デスクトップPC[2015/06/02]
- やじうまPC WatchねこあつめVer.1.3が6月中旬配信。夏アイテム追加[2015/06/02]
- Let'snote夏モデル、12.1型と14型スタンダードノート[2015/06/02]
- TSUKUMO、未発表のデスクトップ向けBroadwellを予約開始[2015/06/02]
- 「Kindle Paperwhite」Impress Watch専用特価クーポン配布中[2015/06/02]
- HPの2015年製PCはWindows 10に即日更新可能[2015/06/02]
- ダイジェスト・ニュース[2015/06/02]
- アップデート情報[2015/06/02]
2015年6月1日
- Windows 10は7月29日公開決定【22時00分 記事内容を一部修正】[2015/06/01]
- Windows 10への無償アップグレード予約が開始[2015/06/01]
- Wi-Fiは使えない? 他社のSIMは違法? Surface 3 LTEの疑問あれこれ[2015/06/01]
- レビューNVIDIA、TITAN Xに肉薄し980を圧倒する「GeForce GTX 980 Ti」[2015/06/01]
- レビュー第5世代AシリーズAPU「A10-7870K」をベンチマーク[2015/06/01]
- 【速報】ASUS、Atom x3およびAtom Z3500シリーズを搭載したZenPadシリーズを発表[2015/06/01]
- 【速報】ASUS、1,300万画素カメラを両面に搭載した"自撮り向け"5.5型スマホ[2015/06/01]
- 【速報】ASUS、ZenWatchの第2世代となるZenWatch 2を参考展示[2015/06/01]
- ASUS、世界初USB 3.1 Type-Cと第6世代Core i7搭載の「Zen AiO」[2015/06/01]
- 【速報】ASUS、R.O.G.ブランドのコンセプトPCやG-SYNC対応湾曲液晶など【23時35分動画追加】[2015/06/01]
- ECS、Core M搭載のファンレス小型PC「LIVA Core」【18時15分記事更新】価格やCortana対応情報を追加[2015/06/01]
- COMPUTEX TAIPEI 2015が6月2日より開幕[2015/06/01]
- NVIDIA、4K解像度に最適化した「GeForce GTX 980 Ti」[2015/06/01]
- 各社、GeForce GTX 980 Ti搭載カードを発売[2015/06/01]
- iiyama PC、4万円を切る4コアCeleron搭載ノート[2015/06/01]
- ダイジェスト・ニュース[2015/06/01]
- 2A急速充電対応のUSBケーブル[2015/06/01]
- マウス、「2015年度 親子パソコン組み立て教室」を7月25日に開催[2015/06/01]
- PC Watch週間アクセスランキング[2015/06/01]
- アップデート情報[2015/06/01]