多和田新也のニューアイテム診断室

IntelのデュアルプロセッサPCプラットフォーム
「Skulltrail」




 IDF Fall 2007において正式に投入が表明された、ハイエンドPC向けプラットフォーム「Skulltrail」。PC向けのデュアルプロセッサプラットフォームとして注目されており、今年第1四半期の発表が予定されている。このSkulltrail環境の評価キットを借用することができたので、ベンチマーク結果を紹介する。

●Xeon環境をPC向けへリファインしたSkulltrail

 まずは、Skulltrailプラットフォームを構成する要素について紹介していきたい。図1に示したのは、Intelの資料から抜粋したSkulltrailのブロックダイヤグラムである。チップセットは“Seaburg”+Intel ESB2(Enterpise South Bridge)という構成。Seaburgとは、2007年11月13日に発表されたXeon向けチップセット「Intel 5400シリーズ」のことである。つまり、Xeon向けチップセットをPC向けマザーボードとして投入する、というのがSkulltrailプラットフォームなのである。

【図1】Skulltrailのブロックダイヤグラム

 そのSkulltrail向けとして発売されるIntel 5400搭載マザーは、「Intel D5400XS」である(写真1)。同社のPC向けハイエンド製品のイメージカラーである黒いPCBを採用している。

 メモリはFB-DIMMスロットを4基備えており、DDR2-800/667メモリを最大8GBまで搭載できる。Unbuffered DIMMに比べると高価な印象は残るFB-DIMMであるが、価格自体は徐々に下がっており、Skulltrailを導入しようと思うユーザーであれば投資対象になり得る存在だろう。ちなみに、今回の評価キットには、MicronのDDR2-800 FB-DIMMが付属。2GBモジュールが2枚で計4GBの構成となる(写真2)。

 さて、Skulltrailで注目される大きなポイントがNVIDIA SLIに対応する点だ。これまでNVIDIAは、自社製チップセットでしかNVIDIA SLIをサポートしてこなかったが、初めて他社製チップセットでも正式に利用できる環境が登場したことになる。

 ブロックダイヤグラムでも分かるとおり、Intel 5400 MCHはPCI Express x16を2基持つが、ここにNVIDIAのPCI Expressスイッチチップ「nForce 100」を接続。PCI Express x16×4を設けている(写真3)。Intel 5400 MCHはPCI Express 2.0をサポートするが、nForce 100はPCI Express 1.1までのサポートとなるため、現状のSkulltrailプラットフォームはPCI Express 2.0をサポートしない点には注意したい。

 サウスブリッジにはIntel ESB2が採用されており、IO周りの機能は本チップによるものが多いが、IOリアパネルのレガシーポートは一切省かれている(写真4)。ちなみに、Intel ESB2はLPCバスを持っている。本マザーボードにもWinBondのSuperIOチップ「WPCD376I」が接続されており、唯一、Consumer Infraredのみがヘッダピンで提供されている。PS/2などを持たないのはこの製品のポリシーによるものなのだろう。

【写真1】Skulltrailプラットフォームのマザーボード「Intel D5400XS」。Intel 5400チップセットを搭載する 【写真2】評価キットに付属したMicronのFB-DIMM。DDR2-800の2GBモジュールで、これが2枚付属している
【写真3】PCI Express x16スロットを4スロット装備し、NVIDIA SLIに対応するのが特徴で、右側のファン付きヒートシンクの下に、NVIDIAのPCI ExpressスイッチであるnForce 100を2個搭載している 【写真4】Intel D5400XSのIOリアパネル部。PS/2などのレガシーポートは一切装備していない

 さて、肝心のCPUであるが、ブロックダイヤグラムには“LGA771 Processor”と記載されたものが2個接続されている。LGA771はサーバ/ワークステーション向けプロセッサであるXeonで採用されているパッケージであるが、SkulltrailをPC向けにリリースするにあたり、LGA771パッケージのCore 2ブランド製品「Core 2 Extreme QX9775」が投入される(写真5、6)。

 Core 2 Extreme QX9775は、45nmプロセスで製造されるYorkfieldコアのクアッドコア製品。3.2GHz動作、1,600MB FSB、12MB L2キャッシュなどのスペックは、すでに投入が表明されている「Core 2 Extreme QX9770」と同じだ(画面1)。

 ただし、CPUパッケージがLGA771である点と、TDPが150Wである点が異なる。TDPが150Wである点に関してはインパクトが大きいが、Xeon製品にはすでに150W TDPの製品がある。また、Core 2 Extreme QX9770と同じ、Yorkfieldコアを3.2GHz動作させている「Xeon 5482」はやはり150W TDPである。ということは、Core 2 Extreme QX9775は、Core 2 Extreme QX9770のLGA771版として捉えるよりも、Xeon 5482をCore 2 Extremeブランドとして発売していると解釈したほうが理解がしやすいだろう。もちろん、Core 2 Extremeなので、倍率ロックは解除された状態になっている。

 また、TDPを150Wに設定しておくことのもう1つのメリットとして、基本的な熱設計、電源周りの設計をXeonと揃えられる点が挙げられる。デュアルプロセッサ環境として実績のあるXeon環境のノウハウを、そのまま活かせるというわけだ。実際、Skulltrail用マザーであるIntel D5400XSは、Core 2 ExtremeだけでなくXeonを利用することも可能となっている。

【写真5】Skulltrail用プロセッサである「Core 2 Extreme QX9775」。3.2GHz動作のYorkfieldで、これを2個搭載して計8コア環境となる 【写真6】Core 2 Extreme QX9775(左)と、同QX9770(右)。ソケットが異なるのでまったく違う背面レイアウトとなるが、チップセットの種類や数は酷似している 【画面1】CPU-ZによるCore 2 Extreme QX9775の詳細

 ただし、CPUクーラーはXeonとは異なり、LGA775と同じ位置にピンソケットが設けられている。今回の評価キットにはZalmanの「CNPS9500 AT」が付属しており、LGA775用のリテンションキットを用いて固定させている(写真7)。150W TDPを冷却する必要があり、かつ2つのCPUクーラーが干渉しない程度のサイズである必要があるわけで、この選別がSkulltrail導入の1つの課題となりそうだ。

 もう1つ、Skulltrailの課題となり得るのが電源である。150W TDPのCPUを2つ利用するだけあって、要求される電源は1,000W以上となる。Intelから配布された資料によれば、「2CPU、2GPU、4GBメモリの場合」は1,000W以上、「2CPU、4GPU、8GBメモリの場合」は1,400W以上の電源が推奨されている。

 また、Intel D5400XSには8ピンのEPS12V電源コネクタを2つ備えている(写真8)。このコネクタに関しては、前述の資料によれば“ノーマルオペレーションの場合は1つの2×4コネクタに接続、オーバークロック時は2つの2×4コネクタに接続”とあり、通常利用であれば、とりあえず1つで良いと書かれている。

 今回のテストでは、後述する環境をクーラーマスターの1,000W電源「RealPowerPro 1000W」を使って動作させた。この電源にはEPS12V電源を1系統しか備えていないが、今回使用した限りでは問題なく動作していたことを付け加えておく。

【写真7】評価キットにはCPUクーラーにZalmanの「CNPS9500 AT」が付属。150W TDPのCPUを冷却でき、2つが干渉しないクーラーが、Skulltrail環境には必要となる 【写真8】Intel D5400XSには8ピンのEPS12V電源を2つ備える。通常利用においては1つだけ装着すればよい

●8コアClovertown、4コアYorkfieldと比較する

 では、ベンチマーク結果を紹介しよう。テスト環境は下表のとおりで、これまでに紹介してきたSkulltrailの評価キットのほか、一世代前のClovertownコアを使ったXeonデュアル環境、Skulltrailと同じYorkfieldコアのCore 2 Extreme QX9770を使った環境と比較した。なお、今回のテストではHDDのボトルネックを少しでも解消するべく、RAID 0を構築した。

【写真9】Xeon 5365×2環境で使用した、Intel 5000X搭載マザー「Intel S5000XVN」 【写真10】Core 2 Extreme QX9770環境で使用した、Intel X48搭載マザー「GIGABYTE GA-X48T-DQ6」
テスト環境
CPU Core 2 QX9775×2
(3.2GHz/1,600MHz FSB/Yorkfield)
Xeon 5365×2
(3GHz/1,333MHz FSB/Clovertown)
Core 2 Extreme QX9770
(3.2GHz/1,600MHz FSB/Yorkfield)
マザーボード Intel D5400XS(Intel 5400) Intel S5000XVN(Intel 5000X) GIGABYTE GA-X48T-DQ6(Intel X48)
メモリ DDR2-800 FB-DIMM(2GB×2,5-5-5-18) DDR2-667 FB-DIMM(1GB×4,5-5-5-15) DDR3-1066 Unbuffered DIMM(1GB×4,7-7-7-20)
ビデオカード NVIDIA GeForce 8800 GTX(ForceWare 169.25)
HDD Seagete Barracuda 7200.10(ST3250310AS×2,RAID0)
OS Windows Vista Ultimate

 まずは、CPU性能をチェックするために実施した、Sandra XIIの「Processor Arithmetic/Processor Multi-Media Benchmark」(グラフ1)、「.NET Arithmetic/Multi-Media Benchmark」、「JAVA Arithmetic/Multi-Media Benchmark」(グラフ2)、PCMark05のCPU Test(グラフ3、4)の結果である。

 8コア同士で比較してみると、全般にSkulltrail環境がスコアを伸ばしていることが分かる。クロック差もあるわけだが、クロックに対して比例してスコアが伸びやすいSandraの結果においても、クロック比以上のスコア向上を見せている箇所も多い。これは、KentsfieldとYorkfieldの比較でも見られた点で、Yorkfieldのマイクロアーキテクチャ改良が功を奏しているのだろう。ただ、.NET/JAVAで動作するCPUテストではスコアが伸びないどころか逆に下がるシーンも見られ、アプリケーションベンチへの影響は気になるところだ。

 ちなみに、SandraのCPUテストはコア数の影響も大きく、コア数に対してリニアにスコアが伸びる傾向がある。SkulltrailのスコアはCore 2 Extreme QX9770の1.98倍前後になっており、おおよそではあるが理屈通りのスコアといえるだろう。PCMark05では最大4タスクまでの同時実行テストであり、4コアと8コアの差はほとんど出ない。動作クロックが同じ、マイクロアーキテクチャも同じということで、結果も似たようなものに収まっている。

【グラフ1】Sandra XII(Processor Arithmetic/Multi-Media Benchmark)
【グラフ2】Sandra XII(.NET/java, Arithmetic/Multi-Media Benchmark)
【グラフ3】PCMark05 Build 1.2.0(CPU Test - シングルタスク)
【グラフ4】PCMark05 Build 1.2.0(CPU Test - マルチタスク)

 続いてはメモリ性能のテストとして実施した、Sandra XIIの「Cache & Memory Benchmark」(グラフ5)と、PCMark05の「Memory Latency Test」(グラフ6)の結果である。今回のテスト環境はプラットフォームに依存してメモリが大きく異なっている。そのため、比較というよりは、プラットフォームごとの傾向をみるのに参考になる程度ではある。

 まず、Sandraによる転送速度の結果は、キャッシュ速度および容量、コア数の差がきっちり出たのが特徴的だ。またメインメモリのアクセス性能は、メモリの理論帯域幅の順になっている。12MBのL2キャッシュを持つCore 2 Extreme QX9775を2個搭載した結果、16MBブロックの転送までキャッシュの性能が活きているあたりも特徴だ。

 ただし、PCMark05によるメモリレイテンシの結果を見ると、SandraほどL2キャッシュが有効に使われていないことが分かるが、それはともかくFB-DIMM環境は若干レイテンシが大きめである。なかでも、SkulltrailのDDR2-800 FB-DIMMが最もレイテンシが大きくなってしまっている。

【グラフ5】Sandra XII(Cache & Memory Benchmark)
【グラフ6】PCMark05 Build 1.2.0(Memory Latency Test)

 次は、アプリケーションの実行性能を見るために実施した、「SYSmark 2007 Preview」(グラフ7)、「PCMark Vantage」(グラフ8)、「CineBench R10」(グラフ9)、「動画エンコードテスト」(グラフ10)、「複数ファイルの動画エンコード同時実行」(グラフ11)である。

 グラフ11に示したテストは、TMPGEnc 4.0 XPressのバッチエンコードツールを用いて4ファイルおよび8ファイルを同時にエンコード。本ツールではCPUの論理コアの数だけ同時実行が可能なので、SkulltrailおよびXeon環境では8ファイル同時に、Core 2 Extreme QX9770環境では4ファイル同時に処理を実行できる。動画ファイルはすべて6,000フレームのDV-AVIファイルを使用。グラフは所要時間を示しているので、このグラフのみバーが短いほど処理が高速であることを表している。

 さて、結果を見てみると、Xeon 5365環境は全体に一歩劣る印象を受ける。これは、クロック差とマイクロアーキテクチャ差による影響とみていいだろう。この結果よりも、むしろ全体にSkulltrailとCore 2 Extreme QX9770の処理性能が似通っていることのほうが問題である。Skulltrailの8コアがあまり活きていないということになるからだ。

 この両者で、Skulltrailが明確に結果を伸ばしているのは、8スレッド処理が可能なCineBench R10、DivX、WMV9の複数ファイル同時処理時といったところ。CineBenchに関しては実行スレッド数を揃えた場合は結果は同等であり、単純にコアの数で押し切った感じである。DivX6.8については、SD/HD解像度ともに結果が出ており、このエンコーダの素行の良さを感じる結果といえる。

 ただし、マルチスレッド化という点ではTMPGEncもきっちりインプリメントされているわけだが、こちらのMPEG-2エンコードは逆に速度が落ちており、複数ファイル同時実行でも8ファイルを同時に実行するより、4ファイルずつ実行したほうが早く終わるという結果も出ている。MPEG-2ほど軽い負荷ともなると、CPUが処理を行うよりも動画のフレームを転送する側にボトルネックがあるのだろう。

 DivXのようにマルチスレッド化がきっちりなされており、かつCPU側がボトルネックになる程度の負荷がある。もしくは、WMV9のようにマルチスレッド化はいまひとつであるが、複数ファイルを実行したことでCPU側がボトルネックになった。ということになる。

 つまり、Skulltrailが威力を発揮する条件の1つはタスク/スレッド数が8コアを活かせるほどの数になっていること。もう1つは、IO処理がボトルネックにならないこと。この2つが揃った状況で使用することが多いならば、Skulltrail導入の効果は期待できるといえる。

【グラフ7】SYSmark 2007 Preview(Ver. 1.02)
【グラフ8】PCMark Vantage(Build 1.0.0.0)
【グラフ9】CineBench R10
【グラフ10】動画エンコード
【グラフ11】動画エンコード(複数ファイル同時実行)

 続いては3Dアプリケーションの実行性能を見るために実施した、「3DMark06」(グラフ12、13)、「3DMark05」(グラフ14)、「Crysis Single Player Demo」(グラフ15)、「Unreal Tournament 3 Demo」(グラフ16)、「LOST PLANET EXTREME CONDITION」(グラフ17)である。

 これも全体に結果は芳しくない。Xeon 5365に対するアドバンテージははっきり出ているが、Core 2 Extreme QX9770とは同等のシーンが多い。3DMark06のCPUテストのように、CPUに特化した処理を行なうような場合はともかく、実際のゲームにおいても結果は出ていない。

 LOST PLANETはマルチスレッド化もなされており、テストでも8スレッド処理を行なわせている。だが、結果は伸び悩んでいる。いかにSkulltrailの威力が発揮される場面が限定的であるかを示す例といえるのではないだろうか。

【グラフ12】3DMark06 Build 1.1.0(CPU Test)
【グラフ13】3DMark06 Build 1.1.0
【グラフ14】3DMark05 Build 1.3.0
【グラフ15】Crysis Single Player Demo(CPU benchmark)
【グラフ16】Unreal Tournament 3 Demo
【グラフ17】LOST PLANET EXTREME CONDITION(DX10)

 では、最後に消費電力のテストである。今回は環境の統一性がないため、プラットフォームによる消費電力傾向の違いとして捉えてほしい。さすがにシングルプロセッサ環境とデュアルプロセッサ環境では大きな違いがあることが分かる。

 ただ、65nmプロセスのClovertownと比べるとSkulltrailは消費電力が大幅に抑制されている。45nmプロセスのデュアルプロセッサ環境の良さであろう。とはいえ、シングルビデオカードのPC向けプラットフォームとしては高い消費電力であることに変わりはない。NVIDIA SLIを使うなら、さらに大幅な電力アップにつながるわけで、電源には気を使う必要がある。

【グラフ18】消費電力

●活躍の場面は限られるが興味深いプラットフォーム

 以上のとおりベンチマークの結果を見てくると、意外に威力を発揮する場面が多くなかった。それでも、PC向けCPUとして最高クラスの性能を持つCore 2 Extreme QX9770と同等レベルのパフォーマンスを発揮している。逆にパフォーマンスが落ちる箇所があるのは残念だが、効果が得られる場面ではCore 2 Extreme QX9770を超えるシーンはあるわけで、4台をHDDを使ってストライピングを作るなど、よりIO処理性能を高めるような工夫を行なうことで魅力は増すと思われる。

 また、グラフィック周りの柔軟性が高いのも魅力だ。NVIDIA SLIとCrossFireの両方に対応する点は意義が大きく、この当たりはIntelがゲーマー向けプラットフォームとしてアピールする根拠となっている。現時点で最高クラスの性能を持つCPU、そしてビデオカード選択の幅が広いことは大きな魅力だ。

 もちろん、メモリなどの価格を考慮すればコスト対効果はシングルプロセッサのほうが上になるだろう。だが、コストを度外視してでも、より高い性能を目指したいユーザーは少なからずいるはずで、そうした人々にとって興味深い製品が登場したといえる。

□関連記事
【2007年9月19日】【IDF】Intel、SkulltrailやNehalemの実働デモなどを初公開
http://pc.watch.impress.co.jp/docs/2007/0919/idf01.htm
【2007年9月21日】【IDF】SkulltrailとモバイルPenrynのベンチマーク結果を公表
http://pc.watch.impress.co.jp/docs/2007/0921/idf07.htm

バックナンバー

(2008年2月4日)

[Text by 多和田新也]


【PC Watchホームページ】


PC Watch編集部 pc-watch-info@impress.co.jp ご質問に対して、個別にご回答はいたしません

Copyright (c) 2008 Impress Corporation, an Impress Group company. All rights reserved.