【レポート】

CEDEC 2006 - CellプロセッサをGPU的に活用することができるのか

7 Cellのグラフィックスパイプラインの性能

西川善司  [2006/09/14]

Cellによって実装されたソフトウェア・グラフィックス・パイプラインのパフォーマンスは?

気になるこのCellベースのグラフィックスレンダリングエンジンのパフォーマンスは図の通り。

実験結果

性能解析の結果

13380ポリゴンの恐竜モデルを1280×720ドット解像度で描画したときのパフォーマンスは14fps~33fps。なお、これは2.8GHz動作のCellの4基のSPEのみを活用した時の結果だそうだ。

動作させたシェーダは1枚のテクスチャを適用するだけのシンプルなものだという。処理の全てをソフトウェア実装している割にはなかなかのパフォーマンスというべきなのだろうか。グラフィックスに割くSPE数を2倍の8個に増やした場合は、さらにパフォーマンス向上が望めそうだが、NVIDIAのG70ベースの「RSX」のパフォーマンスを超えられるかというとそれはそれで難しそうだ。だからこそ、PS3ではCellでグラフィックスを行わずに、NVIDIAベースのRSXを採用したのだろう。余談だが、特許ドキュメントにはCellプロセッサでグラフィックパイプラインを形成する記述があり、筆者は実際にPS3の初期計画段階ではCellベースのGPUコアのアイディアもあったと聞いている。ただし、このアイディアはPS3の開発が進む中で早いうちにキャンセルされたとも聞いている。

話を戻すが、今回、併せて4基のSPEの稼働率(ロードバランス)を表した性能解析図が示された。SPEはインオーダー型の2命令同時発行型のアーキテクチャになっていて、2つあるパイプラインのうち片方が演算系、もう片方がその他の実行系(読み書き、分岐など)というふうに、パイプラインごとの分担が明確化されている。なかなか2命令同時実行を行わせ続けることは難しいはずなのだが、それでも15~30%と、そこそこ高い2命令同時発行(Dual Issue)のパーセンテージが実現できていて興味深い。

動画
実際の実行結果をビデオカメラで撮影した映像 (WMV形式 59秒 13.6MB ※東芝セミコンダクター提供)

    新着記事

    特設サイトの情報

    人気記事

    一覧

    イチオシ記事

    新着記事

    特別企画

    一覧