2010年07月07日

図解で納得!最新CPUはココがすごい

http://pc.nikkeibp.co.jp/article/basic/20100617/1025549/?set=ml
PC Online's Weekly   2010年7月6日

 ここからは、Core iシリーズの特徴的な機能を1つずつ紹介する。
本題に入る前に、Core iシリーズの名称の読み解き方と、各CPUの仕様を説明しておこう。

 Core iシリーズの名称は、対象ユーザーごとに分類した「ブランド名」、そのブランドの中で位置付けを示した「プロセッサー・ナンバー」、細かい機能の違いを示す「サフィックス」で構成されている(図1)。

【Core iシリーズの名称ルール】
thumb_400_1_px400.jpg
図1 インテル製CPUの名称は、搭載機能ごとに分類した「ブランド名」と、そのブランド内での位置付けを示す「プロセッサー・ナンバー」、詳細情報を示す「サフィックス」で構成されている

 ブランド名は最上位がCore i7、上〜中位がCore i5、下位がCore i3という3つに分類される。
続くプロセッサー・ナンバーは、数字が大きいほど高性能と考えてよい。
最後のサフィックスは、基本的にノートパソコン向けの CPUに付き、低電圧版や超低電圧版などを区別する。

 Core iシリーズの仕様をまとめたのが図2だ。Core i3はデュアルコアのみ、Core i5はデュアルコアと4コアの2種類、Core i7は4コアと6コアが混在している。

【Core iシリーズの位置付けと主な仕様】
thumb_500_2_px500.jpg
図2 「Core i3」はデュアルコアのみ、「Core i5」はデュアルコアと4コアの2種類、「Core i7」は4コアと6コアから成る
http://pc.nikkeibp.co.jp/article/basic/20100617/1025549/?SS=imgview&FD=-1816703853

 表中には1次キャッシュ、2次キャッシュの記述はないが、コアごとに、32KBの1次命令キャッシュ、同じく32KBの1次データキャッシュ、256KBの2次キャッシュを実装している。
3次キャッシュは表にある通り、3M〜12MBで、全CPUコアで共有する。旧型のCore 2シリーズにはない3次キャッシュを搭載すること、Core iシリーズの特徴である。

 注意したいのは、ターボ・ブースト、ハイパー・スレッディング、内蔵グラフィックス機能を、すべてのCPUが備えているわけではないということだ。ノート向けですべて備えているのは、Core i7の一部とCore i5のみ。デスクトップ向けはCore i5-600シリーズに限られる。


チップセットは簡素化

 Core iシリーズが大幅に機能強化したのに合わせて、チップセットも様変わりした(図3)。
Core 2 Duo/Quadと組み合わせるチップセット「Intel P45 Express」の場合、メモリーコントローラーや内蔵グラフィックスを搭載するMCH(メモリー・コントローラー・ハブ)と、HDDなどを接続する ICH(I/Oコントローラー・ハブ)の2チップ構成だった。

【「Core 2」と「Core i」シリーズの機能的な違い】
thumb_500_3_px500.jpg
図3 Core iシリーズは、Core 2シリーズ用のチップセットが担っていたグラフィックス機能やメモリーコントローラー機能をCPUの中に統合した。それにより、従来2チップ構成だったチップセットが1チップ構成に簡素化されている
拡大表示

 一方、新型のCore iシリーズは、CPU内にメモリーコントローラーやグラフィックス、PCI Expressのインタフェース機能を備える。つまり、従来のMCHの機能の大部分をCPUが担う。そのため、組み合わせるチップセット「H57 Express」は大幅に簡素化され、1チップ構成になった。チップが少なくなったことで、マザーボード上の実装面積が減り、発熱対策も楽になる。省電力で発熱・騒音の少ないシステムを作れるわけだ。特に携帯ノートで有効だ。

 対応メモリーも変わった。Intel P45 ExpressはDDR3とDDR2の両方に対応していたのに対し、Core iシリーズはDDR3メモリーのみをサポートする仕様になった。

 なお、CPUの物理的な形状も変わっている。例えばデスクトップ向けの場合、端子数はCore 2 Duoの775ピンから1156ピンに増えた。CPUソケットは「LGA1156」と呼ばれるものに変更されている。

 さて、次からは、「ターボ・ブースト」「ハイパー・スレッディング」「内蔵グラフィックス」といったCore iシリーズの特徴的な機能と、新機能を理解するのに不可欠な「対応メモリー」「製造プロセス」などを図解していく。


ターボ・ブースト・テクノロジー

 Core iシリーズで初めて実装された目玉機能がターボ・ブーストである。CPUの発熱状況やCPUコアが使用している電流に余裕がある際、CPUの動作周波数を通常より引き上げる。ケーキをオーブンで焼くときに、通常より火力を強めるイメージに近い(図1上)。

 周波数の引き上げ幅は、「1段階が133MHz」と定められている。この単位を「ビン」という。例えばCore i5-750(2.66GHz)の場合、最大4ビン(533MHz)上昇する(図1下)。動作周波数が20%上昇する計算だ。

【火力を一時的に強めるターボ・ブースト】
thumb_400_4_px400.jpg
図1 CPUの発熱状況や使用している電流に余裕がある場合、CPUコアの動作周波数を一時的に高めるのがターボ・ブーストだ。1段階で133MHzの動作周波数が上がり、Core i5-750の場合、最大4段階も上昇する

 ビンの数は、動作しているCPUコアの数が少ないほど多くなる。休止しているコアの余力を動作中のコアに集中して振り分けられるためだ。動作コアの数が増えるにつれビン数は減少する。

 CPUの余力状況は、CPU自身が監視しており、ビン数は自動で上下するためユーザーが意識する必要はない。インテルが無償提供している「ターボ・ブースト・テクノロジー・モニター」を使えば、動作周波数が自動で上下する様子がリアルタイムで確認できる。

 実際にアプリケーションを実行して、ターボ・ブーストの効果を確かめてみた(図2)。結果は5%の向上にとどまった。中位クラスのCore i5-661(3.33GHz)の場合、上げ幅は最大2ビン(266MHz)。動作周波数の上昇率は最大7%で、実はほぼ理論値通り。このクラスのCPU では、ターボ・ブーストによる劇的な効果を体感するのは難しい。

【ターボ・ブースト機能の効果をベンチマークテストで検証】
thumb_400_5_px400.jpg
図2 Core i5-661は、ターボ・ブーストによってクロックが最大266MHz向上する。初期状態の3.33GHzと比べ理論上の向上率は7%。実際にテストしたところ、ほぼ理論値と同じ結果が得られた
*テスト環境は最終ページを参照


ハイパー・スレッディング・テクノロジー

 ハイパー・スレッディングは、1つのCPUコアを仮想的に2つのコアとして扱い、複数の処理を並列的に処理する機能のことだ。OSやアプリケーションソフトから見ると、例えばシングルコアCPUであればデュアルコアCPUのように見え、デュアルコアCPUであれば4コアのCPUであるかのように見える。

 その仕組みを説明しよう。CPUコアは機能ごとに細分化され、それぞれ独立して機能するよう工夫されている。ただ、同時に全部の機能が動くことは少なく、ある処理を実行する際、動作しない機能も出てくる。それを有効に活用し、別のプログラムの処理を実行する(図1)。それがハイパー・スレッディングだ。

【空いている“手”を有効活用するハイパー・スレッディング】
thumb_400_6_px400.jpg
図1 シングルコアでハイパー・スレッディングなしの場合は、1人のケーキ職人が1種類の調理をする(左上)。これに対し、ハイパー・スレッディングありの場合は、1人のケーキ職人が空いている手を使って2つの調理を同時に行う(左下)。デュアルコアの場合も同様で、ハイパー・スレッディング機能を搭載していれば空いている手を使って同時に4つの調理を実行できる(右下)

 実は、このハイパー・スレッディングはかつて「Pentium 4」にも搭載されていた機能で、数年ぶりに復活したものだ。基本的なコンセプトはPentium 4時代と同じ。ただし、Pentium 4と比べCore iシリーズは命令実行の効率が向上している。測定条件にもよるが、Core iシリーズの場合は30%程度性能が向上するという。

 試しに、TMPGEnc 4.0 XPressを使い、動画形式を変換する時間を比べてみた。処理時間はハイパー・スレッディングがオフの場合が7分59秒だったのに対し、オンの場合は6 分40秒。約20%向上した(図2上)。

 図2下のように、ハイパー・スレッディングの効果を体感できない場合もある。これは「iTunes」(米アップル)がシングルスレッドで動作するためだ。

【ハイパー・スレッディングの効果はアプリによって異なる】
thumb_400_7_px400.jpg
図2 マルチスレッドで動作するTMPGEncは、ハイパー・スレッディングを有効にすると、無効にした場合と比べ約20%性能が向上した。一方、iTunesはシングルスレッドで動作するため、ハイパー・スレッディング機能の有無で差が生じなかった
拡大表示

 アプリケーションは別々に実行できる処理を「スレッド」という単位に分割している。ハイパー・スレッディングは、そのスレッドを仮想的に分けた別々のコアで実行するが、アプリケーションによっては複数スレッドを同時に実行できないものもある。つまり、アプリケーション側の対応も必要ということだ。

 ただ、そうしたシングルスレッドのアプリであっても、2種類以上を同時に実行すれば、ハイパー・スレッディングは生かせる。ハイパー・スレッディングはマルチスレッド、マルチタスクに効く技術なのだ。


CPU内蔵グラフィックス

 新型Core iの特徴の一つが、グラフィックス機能を内蔵した点である。従来のCore 2シリーズや2009年までに登場したCore iは、チップセット内蔵のグラフィックスか(図1左上)、外付けのグラフィックスの力を借りていた(図1下)。新型Core iの内蔵グラフィックスは、描画性能が強化され、動画の再生支援機能も2系統に増えた。(図1右上)。

【CPUにグラフィック機能を内蔵】
thumb_400_8_px400.jpg
図1 旧型のCore 2 Duoなどを搭載したパソコンの多くは、チップセット内蔵グラフィックスと組み合わせて利用するケースが一般的で、高い描画性能を必要とするアプリケーションの処理が苦手だった(左上)。そうしたアプリを実行する際は外付けのグラフィックスに頼っていた(下)。一方、Core iシリーズはグラフィックス機能をCPUに内蔵し、描画性能を高めた(右上)

 それでは、Core i内蔵のグラフィックスの実力はどれほどなのだろうか。Core i5-661を搭載したパソコンでゲームソフト「ストリートファイターIV」を実行したところ、残念ながら画面描画がコマ落ちしてしまった(図2上のグラフ)。一方、外付けグラフィックスボードを追加して試すと快適に操作できた。3Dグラフィックスを駆使するゲームなどを楽しむには、やはり外付けのグラフィックスが必要だ。

 ただし、いったんゲームを離れれば、内蔵グラフィックスでも十分というアプリケーションは多い。例えば、Excelのマクロ機能を使ったグラフの描画や画像の切り替え処理は、内蔵と外付けグラフィックスで差は生じなかった(図2下のグラフ)。

【ゲームなどでは外付けグラフィックスがやっぱり必要】
thumb_400_9_px400.jpg
図2 Core iシリーズ内蔵のグラフィックス機能は、強化されたとはいえ、ゲームのような高い3Dグラフィックス描画性能が要求される処理には向かない(上図。画面はサンプル)。ただ、Excelのようなアプリケーションでは十分以上の実力を発揮する
拡大表示

 ノートパソコン向けのグラフィックス内蔵のCore iにはもう一つ、特徴的な機能がある。「HD Graphics Dynamic Frequency Technology」だ。これは、ターボ・ブーストと同じく、動作周波数を一時的に高めて、描画性能を上げるというもの。2010年1月に発表した Core iの内部は、CPUコアとメモリーコントローラー/内蔵グラフィックスを担う部分の2つに分かれている。CPU全体の消費電力に余裕があるときに、描画機能を担う部分の動作周波数を引き上げる仕組みだ。

 CPUにグラフィックスを統合したメリットはほかにもある。チップ点数を少なくできることだ。その結果、より小型で省電力なパソコンを設計できるようになった。


対応メモリー

 CPUはCore iシリーズで高速化した。これに合わせ、メモリーも高速化しないと、せっかくのCPUパワーを持て余してしまう。そこで「DDR3メモリー」の出番だ。高速化とは、すなわちメモリーコントローラーとメモリー間のデータ転送速度を高めるということだ。メモリーのバス幅は64ビット(8バイト)であるため、例えば12.8GB/秒という転送速度を実現するには、メモリーバスを800MHz×2の1600MHz相当で駆動する(図1)。

【DDR3メモリーで高い転送速度を実現】
thumb_400_10_px400.jpg
図1 12.8GB/秒のような高い転送速度を実現するにはメモリーバスを800MHzのDDR(ダブル・データ・レート)駆動、すなわち1600MHz相当で駆動し、メモリーセル側も1600MHz相当でデータを送り出す必要がある。一度に4つのデータを扱うDDR2では400MHz×4で1600MHz相当となるが、400MHzの動作は実現できない。一度に8つのデータを扱うDDR3であれば、 200MHz×8で1600MHz相当となり、こちらは実現できる

 一方、メモリーセルを1600MHzで駆動するには無理があり、内部で複数のデータを同時に扱うことで、見かけ上1600MHzを実現する。DDR2の場合、一度に4つのデータを扱えるから、1600MHzを実現するには400MHzで駆動すればいい。ただ、実際には300MHz程度が限界だ。

 一方、DDR3は8つのデータを扱える。従って、200MHzで駆動すれば1600MHz相当で駆動することになり、12.8GB/秒の転送速度を実現できる。このように、DDR3メモリーは転送速度を従来よりも大幅に引き上げられる(図2)。

【転送速度が向上したDDR3メモリーが主流に】
thumb_350_11_px350.jpg
図2 パソコン用のメモリー(DDR)の規格は、動作周波数の違いにより複数ある。最新規格の DDR3は、従来規格のDDR2と比べ最大転送速度が倍増した
拡大表示

 Core iシリーズは、DDR3メモリーと組み合わせることが前提だ。Core iシリーズ搭載パソコンが増えるに伴い、メモリー規格の世代交代が進むとみられる。なお、DDR3とDDR2メモリーは、サイズや外観が似ている。しかし、切り欠きの位置が異なるため、DDR3対応システムにDDR2メモリーを挿そうとしても装着できない(図3)。注意しよう。

【DDR3およびDDR2メモリーは形状が異なる】
thumb_400_12_px400.jpg
図3 DDR3およびDDR2対応メモリーは、切り欠き(赤丸で囲んだ部位)の位置が異なる。最新の DDR3対応パソコンには、旧型のDDR2メモリーが流用できないので注意が必要だ


省電力機能

 屋外など電源が確保できない場所でノートパソコンを使う際、気になるのがバッテリーの持ち時間だ。パソコンは、電源がなければ単なる箱。ノートパソコンは、バッテリーの寿命を1分1秒でも延ばすため、多種多様な省電力機能を搭載している。

 電力をきめ細やかに制御する目的で、米マイクロソフトとインテル、東芝の3社が共同で仕様を策定したのが「ACPI(Advanced Configuration and Power Interface)」だ。ACPIではパソコンのさまざまな状態を「ステート」として定めている。パソコンは電源オン(S0)から電源オフ(S5)まで、そのステートを遷移していくことになる(図1)。

【CPUの省電力機能】
thumb_400_13_px400.jpg
図1 CPUは仕事をしていないときは消費電力を抑える状態に遷移する。つまり、何もしていないと寝てしまうわけだ。ただ、完全に寝てしまうと起きて仕事を再開するまでに時間がかかるため、複数の状態を用意し、状況に応じて浅い眠りと深い眠りを使い分けている
拡大表示

 これを実現するため、パソコンを構成するCPUやデバイス類も同様に定められた各状態を遷移する。CPUの場合、それに相当するのが「Cステート」だ。 CPUはS1のスリープ以下の状態は電源オフと同じ。復帰するまでの時間が長いので、電源オン(SO)の中のアイドル状態をさらにきめ細やかに制御している。要するに、暇な場合はできるだけ居眠りをして、電力消費を低減する。

 Cステートの定義は、CPUメーカーごと、あるいは同一メーカーでもCPUの種類によって異なる場合がある。Core iシリーズの場合、通常の稼働状態を示す「C0」から、演算コアの駆動電圧を0にまで下げる「C6」の状態に分かれている。

 このほか、省電力機能としては、CPUの負荷に応じて動作周波数と電圧を上下する「SpeedStepテクノロジー」などもある。


製造プロセス

 製造プロセスは、CPU内部の回路やトランジスタを接続する配線の幅を表す数値のこと。プロセスルールともいう。この数値が小さいほど、トランジスタが小さくなり、1つのCPUに数多くの機能が盛り込める。動作に必要な消費電力も小さくできて、動作周波数も上げやすくなる。

 Core iシリーズは登場時期によって、製造プロセスが異なる。2009年までに登場したものは45nm、2010年1月に登場したものは演算コア部分が 32nm、メモリーコントローラーなどを収めた部分が45nmとなっている。演算コア部分のトランジスタ総数は約3億8300万個。初期のPentium 4の製造プロセスは0.18μm(180nm)、4200万個だったことを考えれば、いかに進化したかが分かる。

 製造プロセスの微細化はさまざまなメリットをもたらすが、微細化すると生じる問題もある。電気的にオフの状態にもかかわらず、電流が漏れてしまう「リーク電流」と呼ばれる現象が顕著になるのだ。そうなると消費電力や発熱量が増え、周波数の向上が望めなくなる。インテルは、この問題を解決するため、素材を改良し「High-k」や「メタルゲート」と呼ばれる技術を導入している。

【製造プロセスが小さいほど高機能・高性能】
thumb_400_15_px400.jpg
図1 製造プロセスが小さければ、CPUを構成するトランジスタを小さくできるため、それだけ多くの機能が盛り込める。言ってみれば、ケーキ職人が持つホイップクリームの幅が小さいほど、より奇麗にケーキをデコレーションできるのと同じだ。製造プロセスの微細化は、ほかにも省電力や高い周波数での動作といった


vProテクノロジー

 「vPro(ヴィープロ)テクノロジー」は、大量のパソコンを導入している企業や自治体、文教施設などで、パソコンの運用管理業務を支援する技術の総称だ。対応したCPUとチップセット、ファームウエアなどで構成される。

 vPro仕様に合致したパソコンを導入すれば、運用管理者の負担軽減が見込める。具体的な機能としては、(1)パソコンのハードウエアやソフトウエア資産情報をネットワーク経由で収集できる(2)パソコンをネットワーク経由で起動してセキュリティパッチを適用する(3)ネットワーク上のパソコンがウイルスに感染した際、事前に取り決めたポリシーに基づきパソコンを自動的に隔離する(4)企業ネットワークのファイアウオールの外にあるパソコンを遠隔操作で保守できる─といったものがある。

 vPro仕様のパソコンであることは、vProロゴの有無で判断できる。企業などのパソコンとして導入を検討するなら、vProシール付きの製品を候補にするとよいだろう。

【パソコンを遠隔管理できる「vPro」】
thumb_400_16_px400.jpg
図1 vPro機能を搭載したパソコンであれば、夜間にソフトウエアの更新プログラムを実行するなど、ネットワーク経由で複数のパソコンを一括管理できる


新型Core i搭載パソコンで処理性能を実測

 今回ベンチマークテストを実施した機種はエプソンダイレクトの「Endeavor MR4000」。その仕様は右図の通りだ。テストで使ったソフトは、動画編集ソフト「TMPGEnc 4.0 XPress」(ペガシス)、音楽の再生・管理ソフト「iTunes」(アップル)、ゲームを基にしたベンチマークソフト「ストリートファイター IV」(カプコン)の3種類である。

【ベンチマークテストで使用したパソコンの主なスペック】
thumb_400_14_px400.jpg

(菅井 光浩=日経パソコン 出典:日経パソコン 2010年3月22日号
posted by : at 14:57| Comment(0) | PC・ネット・科学・技術 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:

※ブログオーナーが承認したコメントのみ表示されます。