(cache) 【多和田新也のニューアイテム診断室】 Fusionをいよいよメインストリームへ投入「AMD Aシリーズ」

■多和田新也のニューアイテム診断室■

Fusionをいよいよメインストリームへ投入「AMD Aシリーズ」

　AMDは6月14日、CPU+GPU統合プロセッサ「Fusion APU」のメインストリーム向け製品となる「AMD Aシリーズ」を発表した。これまで「Llano」のコードネームで呼ばれたAPUだ。まずはノートPC向けからの発表となっており、CPUコア数や統合されたグラフィックスの仕様により「AMD A-8」、「AMD A-6」、「AMD A-4」という3つのラインに分けて提供される。今回、AMD A-8シリーズの1つを搭載するノートPCをテストする機会を得たので、そのベンチマーク結果を紹介したい。

●STARSコアCPUとRadeon HD 6000世代のGPUコアを統合

　まずは今回発表されたAMD Aシリーズについて簡単に整理しておきたい。AMD Aシリーズは、AMDが提供を進めているCPUとGPUを統合した「Fusion APU」の新モデルとなる。Fusion APUとしては今年1月に「AMD Eシリーズ」、「AMD Cシリーズ」が発表されており、それぞれTDPが18W、9WとノートブックPCでもモバイル向け製品を対象としたAPUであった。それに対しAMD Aシリーズは45W TDP、35W TDPの製品が投入され、メインストリームのノートPCに向けた製品となる。

　アーキテクチャ面でも大きな違いがある。図1はAMD Aシリーズ(Llano)を用いたノートPC向けプラットフォーム「Sabine」のブロックダイヤグラムで、図2はAMD Aシリーズのダイレイアウトだ。

【図1】Sabineブロックダイヤグラム

【図2】AMD Aシリーズダイレイアウト

　CPU部は「STARS」コアを採用している。STARSコアは、既存のAMD製CPUでいうとPhenom IIで採用されたアーキテクチャだが、LlanoではSTARSコアに多少の改良を加えてあるという。また負荷に応じて動的に周波数を切り替えるTurbo COREもサポートしている。

　AMD Aシリーズは、クアッドコアとなり、L3キャッシュは搭載せず、各コアに1MBのL2キャッシュを搭載する構成になる。デスクトップ製品で例えるならば、Athlon II X4のL2キャッシュ1MB版といったところだろうか。

　ちなみに、Llanoは32nmプロセスで製造されており、STARSコアを用いたものとしてはもっとも微細なプロセスを用いている。先の図2でも分かるとおりダイの半分近くはGPUが占めているが、このGPU部も含めたダイサイズは228平方mmとされている。

　一方のGPU部であるが、こちらは「Sumo」と呼ばれるコアが用いられる。図3に示した概要にもあるとおり、Radeon HD 5600シリーズなどに採用された「Redwood」コアをベースとし、VLIW5アーキテクチャのコアとなっている。ただし、Universal Video Decoder(UVD)は3になっており、Radeon HD 6670の「Turks」コアのVLIW5版という見方も可能だろう。

　ちなみにSP数はAPUのモデルにより異なる。図4にそれが整理されたスライドを示したが、AMD A8では400SP、8ROP、444MHz動作、AMD A6が320SP、8ROP、400MHz動作、AMD A4が240SP、4ROP、444MHz動作といった仕様になる。図4の表ではメモリ帯域幅にも差があるが、これはメインメモリに何を搭載するかによっても変わる。ノートブックPC向けのAMD Aシリーズの一覧を図5に示すが、AMD A8/A6にはDDR3-1600をサポートするSKUがあり、その場合には1.6Gbpsのデータレートになる。

【図3】Sumoの概要

【図4】AMD Aシリーズ各製品の概要

　この通り、AMD Aシリーズは基本的に、既存のPhenom IIベースのCPUと、Radeon HD 5000/6000ベースのGPUを組み合わせた格好となっており、新しいマイクロアーキテクチャを採用したAMD C/Eシリーズに比べると、ややインパクトに欠ける点は否めない。その意味ではアーキテクチャの革新云々ではなく、32nmプロセスで製造されることで、メインストリーム向けの性能を持つCPUとGPUを228平方mmのダイに集約し、45W以下のTDPに抑え込んだということに意味を持つ製品といえるだろう。

　なお、これに組み合わせられるチップセットであるが、こちらは先に示した図1にあるとおり、AMD A70MとAMD A60Mの2つが提供される。こちらは65nmプロセスでの製造となり、TDPはそれぞれ4.7W、2.7Wとなる。

　両チップセットの違いはUSBインターフェイスで、AMD A70MはUSB 3.0にネイティブ対応しており、これを4ポート持つ。ほか10ポートのUSB 2.0、2ポートのUSB 1.1となる。A60MはUSB 3.0が省略されており、USB 2.0が14ポート、USB 1.1が同じく2ポートとなっている。

　さて、今回のテストについてだが、AMDより借用した「Sabine」プラットフォーム準拠のノートPCを用い、ASUSTeKより借用したCore i5-2410M搭載ノートPCを比較対象とした(写真1～2)。両製品の主な仕様は表1のとおりである。

　なお、AMDのノートPCについてだが、ベンチマーク終了後にAMDから新ドライバが提供されたが、時間の都合上、新ドライバのテストは行なえていないことをお断りしておく。


AMDのSabineプラットフォームのテスト用PC	ASUSTeKのCore i5-2410M+GeForce GT 540M搭載ノート「N53SV-SZ2410S」

【表1】テスト環境

CPU/APU	AMD A8-3500M	Core i5-2410M
内蔵GPU	Radeon HD 6620G	Intel HD Graphics
外部GPU	Radeon HD 6630M	GeForce GT 540M
グラフィックスドライバ	8.834-110412a-117913E	Intel HD Graphics：8.15.10.2253 GeForce GT 540M：GeForce Driver 266.01
チップセット	AMD A70M	Intel HM65 Express
メモリ	DDR3-1333 2GB×2	DDR3-1333 4GB×1
ストレージ	HGST Travelstar 7K500 (HTS725025A9A364/7,200rpm(	Seagate Momentus 5400 (ST9640320AS/5,400rpm(
ディスプレイ	14型1,366×768ドット	15.6型1,366×768ドット
OS	Windows 7 Home Premium Service Pack 1 x64

●CPU、メモリ、アプリケーション性能の比較

　では、まずはCPUの利用を中心としたシステム性能、アプリケーション実行性能の比較を行なう。CPUとメモリ周りの比較に用いたテストは、「Sandra 2011 SP2」のProcessor Benchmark(グラフ1)、「PassMark Performance Test 7」のCPU Test(グラフ2)、「PCMark05」のCPUテスト(グラフ3、4)、Sandra 2011　SP2のMemory Bandwidth Benchmark(グラフ5)、Cache & Memory Benchmark(グラフ6)、Memory Latency Benchmark(表2)、PCMark05のMemory Latency Test(グラフ7)である。

　CPUの演算性能についてはテストによって大きく傾向が変わってしまった。判断が難しい結果ではあるが、過去のCore i7/i5シリーズとPhenomの比較とも合わせて検討すると、Core i5-2410Mを上回るほどの演算性能を持ち合わせてはいないと見るのが妥当であろう。ただ、Core i5-2410Mは2コア& Hyper-Threadingという組み合わせであるため、その点でリアル4コアであるAMD A8が挽回できるアプリもあるという解釈をしている。

　メモリ周りは帯域幅、実効速度ともにCore i5-2410Mに対してまずまずの結果を見せている。ただ、Core i5-2410Mはシングルチャネルでの使用になっているため割り引いて見る必要はある。それを考えると、例えばSandraのCache & Memory Benchmarkの1GBブロック転送における6.55GB/secと6.18GB/secという差は非常に小さいものといえ、メモリレイテンシもCore i5のほうが優れた性能を見せているあたり、今回比較した環境ほどの優位性はなさそうである。

【グラフ1】Sandra 2011 SP2 17.50 (Processor Arithmetic/Multi-Media Benchmark(

【グラフ2】PassMark Performance Test 7 (CPU Test)

【グラフ3】PCMark05 Build 1.2.0 CPU Test (シングルタスク)

【グラフ4】PCMark05 Build 1.2.0 CPU Test (マルチタスク)

【グラフ5】Sandra 2011 SP2 17.50 (Memory Bandwidth Benchmark)

【グラフ6】Sandra 2011 SP2 17.50(Cache & Memory Benchmark(

【グラフ7】PCMark05 Build 1.2.0 Memory Lantecy Test

【表2】テスト環境

Random Access	AMD A8-3500M	Core i5-2410M
1KB	1.8ns / 2.7clocks	1.5ns / 3.3clocks
4KB	1.8ns / 2.7clocks	1.4ns / 3.3clocks
16KB	1.8ns / 2.7clocks	1.4ns / 3.3clocks
64KB	1.8ns / 2.7clocks	4.4ns / 10.0clocks
256KB	8.1ns / 12.2clocks	5.0ns / 11.5clocks
1MB	10.8ns / 16.1clocks	12.1ns / 27.8clocks
4MB	86.8ns / 130.0clocks	73.5ns / 168.7clocks
16MB	103.9ns / 155.5clocks	83.9ns / 192.5clocks
64MB	113.9ns / 170.5clocks	87.3ns / 200.4clocks
Linear Access	AMD A8-3500M	Core i5-2410M
1KB	1.8ns / 2.7clocks	1.5ns / 3.3clocks
4KB	1.8ns / 2.7clocks	1.4ns / 3.3clocks
16KB	1.8ns / 2.7clocks	1.5ns / 3.3clocks
64KB	1.8ns / 2.7clocks	4.5ns / 10.4clocks
256KB	5.9ns / 8.8clocks	4.6ns / 10.5clocks
1MB	5.9ns / 8.8clocks	4.9ns / 11.2clocks
4MB	15.1ns / 22.6clocks	8.1ns / 18.5clocks
16MB	15.5ns / 23.2clocks	8.5ns / 19.6clocks
64MB	15.5ns / 23.2clocks	8.5ns / 19.6clocks

　次にアプリケーション実行性能のテストであるが、「SYSmark 2007 Preview」(グラフ8)、「PCMark Vantage」(グラフ9)、「PCMark Vantage」(グラフ10)、「CineBench R10」(グラフ11)、「CineBench R11.5」(グラフ12)、「POV-RAY v3.7」(グラフ13)、「TMPGEnc Video Mastering Works 5」(グラフ14)である。

　なお、一部で3Dグラフィックスを用いるテストが含まれる、各環境ともGPU切り替えの機能を持っているが、ここではいずれもパフォーマンスが高い設定(AMD A8環境ではHigh Performance、Core i5環境ではGeForce GT 540Mで動作)でテストを行なっている。

　こちらの結果も、全体にはCore i5-2410M環境の優勢が目立つ結果といえる。ここではCPUやメモリ、ストレージに依存するテストが中心になっている。ストレージは異なる環境ながら、ベンチマークスコアはほぼ同等となっており、この差はCPU、メモリの性能差が大きく影響したものである。先のCPU、メモリ周りの結果と合わせても、CPUの性能としてはCore i5-2410Mに対して、AMD A8-3500Mはやや部の悪い傾向が出ている。

【グラフ8】SYSmark 2007 Preview 1.06

【グラフ9】PCMark 7 Build 1.0.4

【グラフ10】PCMark Vantage Build 1.0.2

【グラフ11】CineBench R10

【グラフ12】CineBench R11.5

【グラフ13】POV-Ray v3.7 RC3

【グラフ14】TMPGEnc Video Mastering Works 5

　これらのテストにおける消費電力測定の結果も、ここで紹介しておきたい(グラフ15)。ノートPCのテストということで液晶の影響も混じるが、輝度は両環境とも最大にした。また計測中にバッテリは取り外した状態にしている。

　この結果はAMD A8環境が優れた結果を見せた。10Wを超える差が付いており、消費電力差についてはAMD A8の優位性を見ることができる。同じバッテリであれば、より長い時間に渡ってバッテリ駆動が可能につながる点で、ノートPCでのこの消費電力差はデスクトップ環境以上に意味あるものである。

【グラフ15】各システムの消費電力

　ここからはグラフィックスの性能である。AMDの強みの1つはRadeonを持つことだ。IntelもHD Graphicsで飛躍的にパフォーマンスを伸ばしたが、この世代でその差がどうなるかは重要なポイントとなるだろう。

　ここでは、各環境が持つグラフィックス機能を切り替えつつ、その性能差を見てみることにした。具体的にはAMD A8環境ではスイッチャブルグラフィックス機能によるHigh Performanceモード、Power Savingモードを切り替えられるようになっている。この仕組みは少し複雑で、Power Savingモードを選択した場合は、AMD A8内蔵GPUのみが利用される。そしてHigh Performanceモードの場合、CrossFireを無効化した場合は外付けグラフィックスのみが、CrossFireを有効化した場合は内蔵と外付けの連携レンダリングが用いられるという格好になる。今回は内蔵グラフィックスと最大パフォーマンスを得られる使用方法の差を見るという観点から、CrossFireを有効化している。Core i5-2410M環境はOptimus Technologyを用いて、Intel HD GraphicsとGeForce GT 540Mを切り替えている。

　ただし、Intel HD GraphicsはDirect X11をサポートしていないため、DX11対応タイトルでのテストは省いている。

　テストタイトルは、「3DMark Vantage」(グラフ16、17)、「Left 4 Dead 2」(グラフ18)、「Lost Planet 2 Benchmark DX9」(グラフ19)、「3DMark11」(グラフ20、21)、「DiRT 3」(グラフ22)、「Lost Planet 2 Benchmark」(グラフ23)、「Unigine Heaven Benchmark 2.5」(グラフ24)。また、3DMark両バージョン実行時の消費電力測定結果を(グラフ25)に示している。

　まずLlano内蔵GPUが用いられるPower SavingモードとIntel HD Graphicsの比較においては、3DMark Vantageこそ似たような結果になってしまっているものの、実際のゲームタイトルでのフレームレートの差は歴然で、Llano内蔵GPUが圧倒する。

　さすがにGeForce GT 540Mに対しては程度に差はあるが、少々分が悪い。ただ、CrossFireを用いたHigh Performanceモードでは、こちらも得手不得手はあるが、DirectX 11タイトルでわりと良い結果を出す傾向が出ている。ちなみに、Core i5のメインストリームPCには、このGeForce GT 540MやGeForce GT 520Mあたりが使われることが多い。この性能差ならGeForce GT 520Mに対する優位性はかなり大きいものといえるだろう。

　消費電力についても良好といってよく、内蔵グラフィックス同士の比較、CrossFireによる連携動作時とGeForce GT 540M動作時との比較とも、AMDの方がより低い消費電力で動作している。

【グラフ16】3DMark Vantage Build 1.1.0 (CPU Score)

【グラフ17】3DMark Vantage Build 1.1.0 (Graphics Score - Performance Preset)

【グラフ18】Left 4 Dead 2

【グラフ19】Lost Planet 2 Benchmark DX9

【グラフ20】3DMark 11 Build 1.0.1 (CPU Score)

【グラフ21】3DMark 11 Build 1.0.1 (Graphics Score)

【グラフ22】DiRT 3

【グラフ23】Lost Planet 2 Benchmark DX11

【グラフ24】Unigine Heaven Benchmark 2.5

【グラフ25】Unigine Heaven Benchmark 2.5

　最後にGPGPUのテストを簡単に行なったので紹介しておきたい。テストに用いたのはArcSoftの「MediaConverter 7」で、このソフトはAMDのAPP、NVIDIAのCUDA、IntelのQuickSync Videoのいずれをもサポートしている。が、今回のテストにおいてCUDA使用時のみ異様に速度が遅いという現象が出た。Core i5-2410MのCPUによるエンコードの5倍の時間が経過しても進捗は4分の1という状況で、正常に動作していないと判断してテストを省略している。

　性能の結果はグラフ26、エンコード中の消費電力の結果はグラフ27である。グラフ中、APU/CPU名を示した部分はCPUによるエンコードであることを示す。iPhone 4用のVGA動画へエンコードした場合は完全に頭打ちとなっているが、ほかはおおむねAMD A8のCPUコアを用いるよりもRadeonコアを用いた方がより良い性能を見せることが分かる。

　といってもRadeonコア利用時でも、Core i5-2410Mの性能の方が良い。QuickSync Videoの速度は飛び抜けており、AMD A8が霞んでしまうテストになったと言わざるを得ない結果になっている。

【グラフ26】ArcSoft MediaConverter 7

【グラフ27】ArcSoft MediaConverter 7実行中の消費電力

●GPUと低消費電力の魅力をどこまで生かせるか

　以上のとおり、LlanoことAMD A8を用いたノートPCの性能を見てきた。同じセグメントの製品となるCore i5-2410M環境のノートPCに比べると、GPU性能では負けていないが、CPU性能では明らかに劣っている結果となった。動作エンコードにおいてはQuickSync Videoの強さが目立つ結果ではあるが、グラフィックスレンダリングの性能を見ると、Radeonが持つStreaming Processorがいかに使われるか、つまりAMDのAPPやOpenCLなどGPUの汎用利用を行なうアプリケーションの登場が大きな鍵になりそうだ。CPUとGPUのロードバランスがうまく行なわれれば、CPUの性能をGPUで補える可能性はあるだろう。

　また、ノートPC用環境として見ると、消費電力が全般に渡って低く抑えられているのは好印象だ。AMD AシリーズはCPU、GPU、UVDエンジンでパワーゲーティングを行なうことで、無駄な電力を消費しないようにしているとアピールするが、そうした効果が実際に出ているようだ。

　しかしながら、筆者としては、ややインパクトに欠ける製品という印象を持っている。このクラスのノートPCとしては、性能面の強みがグラフィックスのみ、というのは、そこを理由に購入に踏み切るユーザ数が多数派であるとは言い難い。低消費電力にしても、Core i5-2410Mとの比較においては性能とのトレードオフのような格好になっている。

　ただ、さまざまな処理がCPU、GPUの各々だけで行なわれる時代ではなくなっており、そうしたプラットフォームに合わせたエコシステムをうまく構築できれば、Radeonというコアが統合されていることは面白いし、価値が出てくる可能性もある。今回、ハードウェアとしてのプラットフォームを用意したAMDの次の作業は、いかにソフトウェアデベロッパと協力し、Fusion APUを活用してもらうか、にある。AMD Aシリーズにとって追い風となるような動きにも期待したい。

□関連記事
【2011年6月6日】【海外】Fusionのための新たなソフトウェア層を創るAMD
http://pc.watch.impress.co.jp/docs/column/kaigai/20110606_450949.html
【2011年6月6日】【COMPUTEX 2011レポート】【AMD編】次世代APU「Trinity」を初披露し順調な開発をアピール
http://pc.watch.impress.co.jp/docs/news/event/20110606_450788.html
【2011年4月6日】AMD、32nmの“APU”、Llanoを出荷
http://pc.watch.impress.co.jp/docs/news/20110406_437532.html
【2011年1月27日】AMD、Asia Pacific Fusion Tech Dayを開催
～APU搭載最新ノートなどのほか、Radeon HD 6990を披露
http://pc.watch.impress.co.jp/docs/news/event/20110127_422995.html

(2011年 6月 14日)

[Text by 多和田新也]

■多和田新也のニューアイテム診断室■

【PC Watchホームページ】