正式公開版 Ver 1.1(99/10/21公開)
物理演算系ベンチマークプログラムです。
GL髪ベンチ ver1.1通常版をダウンロードする(Windows95/98/NT4.0用(OpenGL要)、LZH圧縮、110KB)
GL髪ベンチ ver1.1 SSE専用版をダウンロードする(Windows95/98/NT4.0用(OpenGL&SSE対応プロセッサ要)、LZH圧縮、110KB)(注:インテルコンパイラの自動ベクトル化によるSSE対応版です)
GL髪ベンチ 3D Now!対応版(注:他のサイトです)FPU・SIMD濃緑研究所さんの所です
GL髪ベンチ ver1.1プログラムソース(VisualC++6.0用、インテル製コンパイラ要、LZH圧縮、34KB)
100秒でどれだけ髪の毛が動かせるかを調べます。一度に表示されている髪の毛は5000本で、毛一本に20のラインor20の動点を使っているので、1ステップで、10万ライン表示&10万動点計算処理となります。
結果は、1秒で処理できる要素数(髪の毛の要素数、もしくは、毛の動点数)で示されます。毎秒のライン処理能力と言い換えてもOKです。100Kと出れば、毎秒10万ライン処理能力ですね。20で割ると、1秒で処理できる髪の毛の数になりますので、その場合、毎秒5000本の処理が可能ということになります。
なお、CPUとVideoそれぞれ単独で測定することもできます。
10/30日 関連リンク
3D Now!対応された方がいらっしゃるようなので(^^)リンク。
FPU・SIMD濃緑研究所さんのところで、今のところ、憩いの広場の方で話が出ています。
私は、http://www.atcomp.net/bbs/arc/s/soft/index.shtmlこちらのBBSでお見かけしました。
なお、こちらの3D Now!版はマシン語で書き直してあるのに対して、ここで公開しているSSE版はまだ、コンパイラの自動ベクトル化に頼ったものであることに注意してください。SSE版もマシン語レベルでかりかりたたけばもっと早くなるのでしょうけど、最大でも1.5倍にしかならないという話を聞いて私はやる気がなくなりました(^^;
あと、BBSで話が出たように、メモリへのアクセスを工夫するなどして、もっと早くすることもできます。たとえば、Ver1.2α通常版とSSE版、あと、ソース。ただ、ベンチマークとしてはあまりVer上げるのもまずいので、こちらは正式版にはしません。当分Ver1.1で固定します。
10/21日 Ver1.1
PentiumIIIを仕入れてきたため、SSE対応しました。今のところ、C言語レベルのチューニング+インテルコンパイラの自動ベクトル化によりSSE対応しています。そのためか、SSE版と通常版の違いがあまりありません(^^;。なお、SSEとは関係ない所も高速化したため、通常版も数倍早くなっています。これで、PentiumIII
600MHz+GeForce256ならトータル950Klines/sec程度となり、10fps近い処理速度を実現できています。
10/16日 Ver1.0
BBSの方で、ジオメトリエンジン内蔵ビデオチップであるGeForce256の話で盛り上がったので、ほとんどこれ専用にベンチマーク作成。DirectXでなく、OpenGLで組んであるのは、単にGeForceのジオメトリエンジンを使うのにはこれがいちばん簡単だったからです(^^;
このベンチマークの用途ですが、基本的にこういう、物理演算系の処理+リアルタイム3D表示の際の、CPUとVideoの性能バランスを調べるのに利用します。RivaTNTあたりまでなら、CPUよりVideoの方がネックになりますが、GeForceのようなハードになると、CPU側の能力不足が問題となります。これを示すためのベンチです。
GeForce256+Celeron450だと、Video性能で、320万ライン/秒出てます(なんとも凄いことに(^^;)。ただ、CPUの方では、その10分の1の38万動点/秒の処理能力でこっちがネックとなります。トータルで35万ぐらいですね。