重回帰分析の例題サンプルデータ10選
統計をシンプルに
|2014年06月17日|
新しい技術やスキルを学ぶには、実際に手を動かして試行錯誤をしてみるのが一番です。統計分析の手法ももちろん例外ではありません。
主としてビジネスシーンで活用することを想定しながら、重回帰分析で使えるサンプルデータを10パターン用意しました。それぞれに簡単な説明をつけていますが、詳細情報は全てリンク先を参照してください。なお、リンク先の分析手順はすべてadelieを用いた場合のみを記載しています。
重回帰分析の例題サンプル10選
アイスクリームは本当に「暑くなると売れる」のか?
分析の意図
- 売上に影響する要因を分析することで、なるべく機会損失・廃棄ロスの少ない適切な販売体制を取れるようにしたい。
目的変数
- アイスクリームの売上
説明変数
- 最高気温
- 通行人数
家賃に影響する物件条件は何か?
分析の意図
- 高田馬場駅の周辺の物件100件を調べ、様々な物件の条件(広さ、駅からの遠さ、階数など)がどれくらい家賃に影響するのかを調べたい。
目的変数
- 物件の家賃
説明変数
- 様々な物件の情報(広さ、駅からの徒歩時間、築年数、階数、様々な設備の有無、etc…)
47都道府県の最高気温と場所の関係
分析の意図
- 47都道府県の県庁所在地の8月の最高気温が、地理条件によってどの程度影響を受けているのかを分析によって検証したい。
目的変数
- 8月の最高気温(「日最高気温の月平均」)
説明変数
- 緯度
- 経度
- 海抜
- 月間降水量(「降水量の月合計」)
- 月間日照時間(「日照時間」)
レストランの売上にグルメサイトのPVはどれくらい影響する?
分析の意図
- 大手のグルメサイト3つにそれぞれ広告料を払って出稿しているのだが、果たしてどれほど成果(集客)に結びついているのかが良く分かっていない。より広告の効果を高めるために、集客に関係ありそうなその他の要因も含めながら、効果を検証してみたい。
目的変数
- レストランの集客人数
説明変数
- 3つのグルメサイトそれぞれのPV数(PV数)
- 既存のお客様へのDM送付(送った or 送らない)
- 最高気温(℃)
- 降雨(雨が降った or 降らない)
- 曜日(土日祝前日 or 平日)
TVで紹介されるとポップコーン専門店の売上はどれくらい上がる?
分析の意図
- あるポップコーン専門店では、TVに取り上げられるとお客さんの数が増えるため、長蛇の列に対応するためにスタッフを増やしたり、材料を多めに仕入れておくなどの事前の対応が必要になる。そこで、TV放映がどの程度お客さんの増加に影響しているのかを知りたい。
【目的変数】
- 1日のポップコーンの売上(約2ヶ月分)
【説明変数】
- 顧客数と客単価
- 販売商品数と販売商品単価
- などの売上の詳細情報
- 天候
- TVに取り上げられた日
営業スタッフの生産性を上げる「指標」は作れるか?
分析の意図
- 支店長が顔を合わさないなかでもマネジメントをしやすくするために、自社に合った「営業指標」を設定することを目指した分析を行いたい。具体的には、営業スタッフが「何に時間を使うと最も売上に繋がるのか」ということを分析することを目指す。
目的変数
- 週の売上げ
説明変数
- 営業スタッフの行動時間(店長への提案、社内勉強会、資料作成、etc)
- その他の要因(お中元期間、悪天候)
入社時の評価から営業実績を予測できるのか?
分析の意図
- 新卒社員を毎年20名程度採用しているが、採用時点での見極めの精度をこれまで検証したことがなかった。始めのステップとして、成果となる実績を把握しやすい営業スタッフから検証を始めることにした。過去10年間で採用した営業スタッフの入社時の評価を集め、現在の営業成績とどの程度関係しているのかを分析したい。
目的変数
- 2013年上期の営業実績
説明変数
- 採用時の評価(5段階評価の項目を6つ)
- 入社後半年の評価(上司による5段階評価)
- 上期の営業行動数(訪問件数)
- 入社年次
コンビニ産業の市場規模は予測できるか?
分析の意図
- コンビニ産業の市場規模を選び、どれくらい精度の高い予測ができるのかを検証したい。
目的変数
- コンビニ産業の市場規模(日本フランチャイズチェーン協会「コンビニエンス統計月報」の「コンビニ全店舗売上数」より2008年1月から2012年12月までのデータを使用)
説明変数
- コアコアCPI
- 失業率
- マネーストック(M2)
- 名目実効為替レート
- 景気ウォッチャー調査
- 各月のダミー
英会話学校の無料体験講座の申込者を増やすには?
分析の意図
- ある英会話学校では、無料体験授業を受けにきた生徒の70-85%以上は本契約に進むことが過去の傾向として現れているため、どれほど無料体験授業の申込を増やせるかが目標になっている。年明けはテレビやWebで様々なプロモーションも重ねている時期であるが、時期的な要因がある程度は影響を及ぼしていることは想定される(新年から英語を頑張りたいと心がける人は多い)
目的変数
- 毎週の無料体験授業の申込者数
説明変数
- wr321 w3 バナー広告のクリック数
- 自社の社名検索数
- 電車広告、雑誌広告、テレビCMの実施時期
「優秀なマネージャー」をデータで分析できるか?
分析の意図
- ある商品カテゴリ(商品A)の販売の生産性を改善するために、商品Aの販売を最も得意とするマネージャーを選任したい。そこで、商品Aにおける生産性を調べるための分析を行う。
目的変数
- 特定の商品群(商品A)を中心に扱っているマネージャーの売上(1週間)
説明変数
- 支店の営業スタッフ全員が商品Aの販売に1週間でかけられた時間の合計
- 担当するエリアの人口
- 競合Z社がいるか
- その週に悪天候(特に台風)に見舞われたか