今日は雨。コロンの散歩もできないし、散髪に行くことにしました。
暇なので、pythonのデータ解析の情報収集をしていると、いろいろと知らないことが出てきました。それは、csvデータなどを読み込む方法として、csvモジョールよりも高速かつ簡単な方法があるとのこと。
テーマ:Python
それは、pandasモジョールを使う方法だそうです。ウェブの情報だと、numpyの読み込み方法より、10倍速そう。pandasの参考資料
本当かな?いっぺん試そう。
まずは、pandasモジュールのインストールから始めてみることにします。
インストールはこちらからどうぞ
私のpythonは3.4を使っているので「pandas-0.15.0.win32-py3.4.exe」をダウンロードしました。
これを実行してから、import pandas as pd でインポートすると、pytzモジュールがないとエラーがでてしまいました。
コマンドラインから pip install pytz で無事にpytzモジュールnインストールに成功。
(3月2日追記:piが使えるのであれば、最初から pip install pandas とやればpytzも自動的にインストールされるようです。pipは使えるようにした方がいいですね。pipのインスト-ル方法はこちらのリンクでどうぞ)
いよいよテストプログラムですが、nekopuniさんのプログラムを使わせていただきました。
(nekopuniさんありがとうございます)→ こちらがnekopuniさんのブログページです。
テストコードは以下のとおりです。
ちょっと長くなってしまいました。ごめんなさい。
このテストプログラムは、まずはcsvモジュールを使って、200万点のプロット用データを
生成します。サインカーブのデータを分割します。(51行目の分割数を変更すれば、もっと少ないデータ量のテストができます)
因みにこのデータは63MBもあります。
そして、出力データです。
ごらんのとおり、CSVモジュールはまずまずのスピードですが、やはりpandasは一番速いことがわかりました。今後は、このpandasをファイル入出力に使おうと思います。

Python ブログランキングへ
クリックしてね
本当かな?いっぺん試そう。
まずは、pandasモジュールのインストールから始めてみることにします。
インストールはこちらからどうぞ
私のpythonは3.4を使っているので「pandas-0.15.0.win32-py3.4.exe」をダウンロードしました。
これを実行してから、import pandas as pd でインポートすると、pytzモジュールがないとエラーがでてしまいました。
コマンドラインから pip install pytz で無事にpytzモジュールnインストールに成功。
(3月2日追記:piが使えるのであれば、最初から pip install pandas とやればpytzも自動的にインストールされるようです。pipは使えるようにした方がいいですね。pipのインスト-ル方法はこちらのリンクでどうぞ)
いよいよテストプログラムですが、nekopuniさんのプログラムを使わせていただきました。
(nekopuniさんありがとうございます)→ こちらがnekopuniさんのブログページです。
テストコードは以下のとおりです。
1 | #!Python3 |
| syntax2html |
ちょっと長くなってしまいました。ごめんなさい。
このテストプログラムは、まずはcsvモジュールを使って、200万点のプロット用データを
生成します。サインカーブのデータを分割します。(51行目の分割数を変更すれば、もっと少ないデータ量のテストができます)
因みにこのデータは63MBもあります。
そして、出力データです。
1 | Python 3.4.2 (v3.4.2:ab2c023a9432, Oct 6 2014, 22:15:05) [MSC v.1600 32 bit (Intel)] on win32 |
| syntax2html |
ごらんのとおり、CSVモジュールはまずまずのスピードですが、やはりpandasは一番速いことがわかりました。今後は、このpandasをファイル入出力に使おうと思います。
Python ブログランキングへ
クリックしてね
AD
コメント(0)
|
リブログ(0)
同じテーマ 「Python」 の記事
- Python §84: シリアル通信:… 2016-01-11 1
- Python §83 : シリアル通信… 2015-12-23 2
- Python §81 : シリアル通… 2015-11-28
- もっと見る >>