このブログ中の pandas
関連のエントリをまとめた目次です。
最近 pandas
開発チーム と PyData グループ の末席に加えていただき、パッケージ自体の改善にもより力を入れたいと思います。質問などありましたら Twitter で @ ください。
目次につけた絵文字は以下のような意味です。
- 🔰: 最初に知っておけば一通りの操作ができそうな感じのもの。
- 🚧: v0.16.0 時点で少し情報が古く、機能の改善を反映する必要があるもの。
- 🚫: 当該の機能が deprecate 扱いとなり、将来的に 代替の方法が必要になるもの。
基本
また、上記に対応した比較エントリ:
R {dplyr}, {tidyr}
PySpark
機能別
データ選択
- Python pandas データ選択処理をちょっと詳しく <前編> - StatsFragments
- Python pandas データ選択処理をちょっと詳しく <中編> - StatsFragments
- Python pandas データ選択処理をちょっと詳しく <後編> - StatsFragments
グルーピング/集約/集計/データ変換
- Python pandas の算術演算 / 集約関数 / 統計関数まとめ - StatsFragments
- Python pandas アクセサ / Grouperで少し高度なグルーピング/集計 - StatsFragments
- Python pandas 図でみる データ連結 / 結合処理 - StatsFragments
データ操作
文字列、日付など、各データ型に固有の操作。
入出力
- pandas でメモリに乗らない 大容量ファイルを上手に扱う - StatsFragments
- Python rpy2 で pandas の DataFrame を R の data.frame に変換する - StatsFragments 🚫
その他
- Python pandas のデータを scikit-learn でうまいこと処理したい - StatsFragments
- Python pandas で日本の株価情報取得とローソク足チャート描画 - StatsFragments
自作パッケージ
- Python pandas / scikit-learn 向けのちょっとしたパッケージ作った <前編> - StatsFragments
- Python pandas / scikit-learn 向けのちょっとしたパッケージ作った <後編>
- Python pandas 日本語環境向けのちょっとしたパッケージ作った - StatsFragments