年末年始向けに、比較的読みやすい本を中心にオススメします。
統計学入門
色々読んでみましたが、現在決定版と言えるものは存在しないように思えました。個人的には、シグマと積分の復習、場合の数・数え上げの方法、確率、確率変数、確率密度、度数分布とヒストグラム、代表値・平均・分散、確率分布、同時分布、周辺分布、確率変数の変数変換、検定、散布図と箱ひげ図、回帰、相関あたりをRなどを使いながらシンプルに説明していく本があるといいと思うのですが、なかなかバランスのとれたいい本がありません。初歩の初歩しか説明してない、グラフが少ない、検定にページを割きすぎ、分厚い、ちょっと難しいなどの不満点があります。立ち読みして自分にあった本を選ぶのがいいと思います。ネットで検索して調べるのでもいいと思います。
統計学演習
統計の実力向上のためには、「紙と鉛筆で手を動かして計算する」という経験がどこかで必要になります。そこで、シグマと積分はすでに慣れ親しんで、統計の初歩は少し知っている人に以下の演習書をオススメします。
- 作者: 村上正康,安田正実
- 出版社/メーカー: 培風館
- 発売日: 1989/01
- メディア: 単行本
- 購入: 5人 クリック: 9回
- この商品を含むブログ (6件) を見る
統計や検定を少し知っている人がRをはじめたい
「Rで楽しむ統計」がオススメです。例題がすごくいいです。また、重要であるのにもかかわらず一般的な本では説明を飛ばしているようなトピックを扱っていて勉強になります。
- 作者: 奥村晴彦,石田基広,市川太祐,高橋康介,高柳慎一,福島真太朗
- 出版社/メーカー: 共立出版
- 発売日: 2016/09/08
- メディア: 単行本
- この商品を含むブログ (7件) を見る
統計や検定を少し知っている人が統計モデリングをはじめたい
「データ解析のための統計モデリング入門」がオススメです。検定を乱用している人はぜひ読んでほしいです(乱用している自覚がある人は乱用しないかもですが)。
データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学)
- 作者: 久保拓弥
- 出版社/メーカー: 岩波書店
- 発売日: 2012/05/19
- メディア: 単行本
- 購入: 16人 クリック: 163回
- この商品を含むブログ (28件) を見る
プログラミング少しできる人が統計モデリングをはじめたい
「StanとRでベイズ統計モデリング」がオススメです。統計モデリングは親しみやすく、職人芸なんかではないことが分かると思います。
StanとRでベイズ統計モデリング (Wonderful R)
- 作者: 松浦健太郎,石田基広
- 出版社/メーカー: 共立出版
- 発売日: 2016/10/25
- メディア: 単行本
- この商品を含むブログ (8件) を見る
Stanにもっと詳しくなりたい
Stanのマニュアルがオススメです。主要パートについては日本語訳もほとんど完成しており、以下のプロジェクトのReleasesタブに200ページ弱のpdfがあります。 github.com もともとの英語が難しく、訳に苦戦している箇所もあるので、プルリクエストお待ちしております。
因果推論や効果測定を詳しく知りたい
「岩波データサイエンス vol.3」がオススメです。統計を扱う上で非常に重要なのが因果関係ですが、この本を除いて読みやすい類書がほとんどありません。傾向スコアだけでなく、反実仮想を考えた回帰モデルやRCT(ランダム化比較試験)との対応がきちんと書いてあって勉強になりました。
- 作者: 岩波データサイエンス刊行委員会
- 出版社/メーカー: 岩波書店
- 発売日: 2016/06/10
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (4件) を見る
解析で利用する立場からRをバランスよく詳しくなりたい
「改訂3版 R言語逆引きハンドブック」がオススメです。基本グラフィックスやファイル操作も詳しいです。見開きで読みやすいです。
- 作者: 石田基広
- 出版社/メーカー: シーアンドアール研究所
- 発売日: 2016/06/25
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (1件) を見る
統計に興味はないけど、プログラミング言語としてのRを知りたい
「R言語徹底解説」がオススメです。エンジニア向けと思います。可視化などはあまり載っていません。
- 作者: Hadley Wickham,石田基広,市川太祐,高柳慎一,福島真太朗
- 出版社/メーカー: 共立出版
- 発売日: 2016/02/10
- メディア: 単行本
- この商品を含むブログ (29件) を見る
Rのデータ処理に詳しくなりたい
Rといえばデータ処理能力と作図能力がずば抜けています。データ処理については今のところ「Rデータ自由自在」がオススメです。
- 作者: P.スペクター
- 出版社/メーカー: 丸善出版
- 発売日: 2012/04/05
- メディア: 単行本(ソフトカバー)
- この商品を含むブログを見る
{dplyr}
や{tidyr}
などのパッケージを使ってデータ処理するのが主流になりつつあります。2017年にWonderful Rのシリーズとして良い本が出るようなので待ちましょう。
Rの可視化(ggplot2)を使ってみたい
今のところ「Rグラフィックスクックブック」がオススメです。フルカラーでびびります。
Rグラフィックスクックブック ―ggplot2によるグラフ作成のレシピ集
- 作者: Winston Chang,石井弓美子,河内崇,瀬戸山雅人,古畠敦
- 出版社/メーカー: オライリージャパン
- 発売日: 2013/11/30
- メディア: 大型本
- この商品を含むブログ (3件) を見る