1. Qiita
  2. 投稿
  3. DeepLearning

tensorflow 各環境でのGPUベンチマーク結果

  • 2
    いいね
  • 0
    コメント

tensorflowのmnistでの CPU / GPU 計算速度について自分の実測値を載せておきます。
Mnistの5000回のトレーニングにかかった時間です。3回の計測値の平均を四捨五入してます。

本当はわざわざ記事にするほどではないのですが、初記事が画像のアップロード制限に引っかかってしまったようなので記事にしました。計測目的は主にGPUの効果測定と、windows環境下のdocker / bash on Ubuntu でのパフォーマンス測定でした。

他にもtensorflowのバージョンによる高速化の影響や、メモリ速度の影響の確認などです。ご参考まで。

Machine CPU Memory GPU Environment tensorflow version time(sec)
Mac Book Pro i5 2.4GHz 2Core 8GB 1600MHz DDR3 無し Mac OSX 0.8.0 999
Mac Book Pro i5 2.4GHz 2Core 8GB 1600MHz DDR3 無し Mac OSX 0.9.0 1148
自作 ASUS P6T i7 2.67GHz 4(8)Core 2GB 1600MHz 無し Ubuntu 0.8.0 828
自作 ASUS P6T i7 2.67GHz 4(8)Core 2GB 1600MHz 無し Ubuntu 0.9.0 639
自作 ASUS P6T i7 2.67GHz 4(8)Core 8GB 1600MHz Single Channel 無し Ubuntu 0.9.0 836
自作 ASUS P6T i7 2.67GHz 4(8)Core 10GB 1600MHz 無し Windows VirtualBox + Jupytor Notebook 0.8.0 2539
自作 ASUS P6T i7 2.67GHz 4(8)Core 10GB 1600MHz Geforce 1060 Ubuntu 0.9.0 34
Lenovo P910 Xeon Dual 2.1GHz 8Core 16GB 2400MHz 無し Ubuntu 0.11.0 261
Lenovo P910 Xeon Dual 2.1GHz 8Core 16GB 2400MHz M6000 Ubuntu 0.11.0 28
ASUS K73SM (Laptop) Core i7 2670QM (Mobile) 4(8)Core 2.2GHz 8GB 800MHz 無し Bash on Ubuntu on Windows 0.11.0 1437
  • tensorflow 0.8.0 -> 0.9.0 で1割ほど高速化したっぽい
  • Windows Docker環境はかなり遅い。本気でやるならせめて Bash on Ubuntu on Windowsで。 (0.12.0でwindows 対応したのでそのうち速度を調べてみます)
  • CPUメインならメモリの速度はそれなりに影響が出る。
  • デスクトップ最高峰性能のマシンならギリギリ実用できる速度は出るかも
  • それでも3万円程度の Geforce 1060 には全然敵わない

また上記の表には出していませんが、ある程度複雑なモデルを動かそうとした場合に3GBのGPUではメモリ不足で止まってしまうケースが幾つかありました。3GBのうち1GBをビデオに取られてしまうので実質2GBです。DLで使う予定の場合は6GB以上のモデルを考えた方が良いと思います。