Save the 豆腐! ~豆腐はおぼろなれども予測は明快たるべし~
- 締切
- 2016/03/31 (残り44日)
- 応募人数
- 1人
- 報酬
- 1位 15万円
2位 10万円
3位 5万円
- スポンサー
- タグ:
コンペ概要
気象データと特売情報から5種類の豆腐の需要予測モデルを作成していただきます。
さて、今回のテーマは「豆腐」です。
豆腐は古来から食べられてきた日本食の一つで、長寿食といわれてきました。
近年では、健康食品やダイエット食品としても注目されています。
このように、食品として多くの魅力を持つ豆腐ですが、
保存期間が短く、作り置きができないという特徴も持ちあわせています。
工場では次の日の売れ行きを予想して豆腐を製造していますが、
もし欠品した場合は、売上機会損失や顧客の信頼低下を招きます。
一方で、売れ残ってしまうと、その豆腐は廃棄されることになってしまいます。
このような食品の廃棄に関する問題は「食品ロス」と呼ばれ、
現在日本が直面している社会問題のひとつです。
世界の生産量の実に3分の1にあたる約13億トンの食料が毎年廃棄されており、
廃棄にかかる経済的コストは約7500億ドルに及びます。
限りある資源を有効に活用しつつ経済を健全に発展させるためには、
食品の需要予測の精度を高めることが重要で、食品業界においても、
今データサイエンスが注目されつつあります。
ある研究では、豆腐の売上が気象と連動し、さらに「どのくらいの気温か」よりも
「どのような経過をたどってこの気温になったか」が重要という成果もあるようです。
今回のコンペでは、そんな豆腐を、食品ロス問題から救っていただくために
最適な生産量を予測していただきます。
開催期間
2016/2/16~2016/3/31
コンペルール
1ユーザにつき1アカウント
コンペ参加者は一人につき1アカウントまでです。
他参加者との情報共有は禁止
コンペ参加者が他参加者と本コンペの予測に関連するデータ・ソースコードを共有する行為は禁止です。
ただし、ソースコードについては、公のものとして全体に公開する場合はその限りではありません。
開催中のスコアボードは一部データで評価
コンペ開催期間中は、正解データの一部を用いてモデルを評価します。
なお、コンペ期間終了の際は、正解データの全てを用います。
応募は1日3回まで
応募は1参加者あたり1日に3度までとします。
未来のデータは使用禁止
ある日の予測をする時は、その日に確定している情報のみ使用できます。
今回の気象データの場合は、ある日の生産量を予測する場合、その日の気象データ
もしくはそれ以前の日付の気象データのみ使用できます。
(判断に迷う場合は、お問い合わせください)
汎用的なモデリングであること
提案した方法がクライアントの有する環境においてクライアントの追加費用負担を伴わず
再現及び継続使用可能であることを保証する必要があります。
同じフォーマットで、異なる時点のデータを入力した場合にも予測できなければなりません。
例えば、根拠無く局所的に予測値を修正することは禁止となります。
(基準について不安がある場合は、事務局までお問い合わせください)
評価方法
予測する変数は、その日に生産すべき豆腐の数です。
応募ファイルの形式はcsv(カンマ区切り)のヘッダーなしファイルです。
検証用データの1列目にある日付をインデックスとし、2~6列目に各商品の予測値を記述します。
評価は RMSE(Root Mean Squared Error 平均二乗平方根誤差)を使って行います。
この値は真の値との誤差の平均を表しますので、小さい値を算出した参加者様を上位とします。
5商品それぞれのRMSEの総和を総合スコアとし、そのスコアが最も良いモデルが今回の勝者となります。
最終順位の決定
1. 評価指標が、タイ(同値)の場合は、早い日時でご応募いただいた参加者を上位とします。
2. コンペ期間終了後、全ての正解データでの評価値で順位が決定します。
3. 順位確定の際に下記の情報を提出していただきます。
(ア) 予測モデルのソースコード及び再現の為の手順書
(イ) 各説明変数の予測モデルへの寄与度
(ウ) 実行環境(OSのバージョン、使用ソフトウェア及び解析手法)
(エ) Random Forest等の乱数を利用したモデリングの場合の乱数シード
(再現性確保のため、固定シードでのモデル推定にご協力下さい)
4. 再現性検証期間中、報奨金獲得対象者及び、その提出モデルが下記いずれかに該当する場合は報奨金獲得資格を失います。
(ア) 事務局からの手続き上の連絡・要求に対して指定された期限内に対応しない
(イ) モデルの予測結果を再現できない
(ウ) 汎用的なモデリングとなっていない
スコア
前日以前のデータが存在しません。
スコアボード
- 応募件数:
- 2件
- 応募人数:
- 1人
順位 | ユーザー名 | スコア | 応募件数 | 投稿日時 |
---|---|---|---|---|
1 (-) | sample_submit | 12,307.83442 | 2 | 2016/02/16 13:58 |
順位 | ユーザー名 | スコア | 応募件数 | 投稿日時 |
---|---|---|---|---|
1 (-) | sample_submit | 1,786.61487 | 1 | 2016/02/16 13:58 |
順位 | ユーザー名 | スコア | 応募件数 | 投稿日時 |
---|---|---|---|---|
1 (-) | sample_submit | 3,431.76669 | 1 | 2016/02/16 13:58 |
順位 | ユーザー名 | スコア | 応募件数 | 投稿日時 |
---|---|---|---|---|
1 (-) | sample_submit | 1,682.26094 | 1 | 2016/02/16 13:58 |
順位 | ユーザー名 | スコア | 応募件数 | 投稿日時 |
---|---|---|---|---|
1 (-) | sample_submit | 3,034.53118 | 1 | 2016/02/16 13:58 |
順位 | ユーザー名 | スコア | 応募件数 | 投稿日時 |
---|---|---|---|---|
1 (-) | sample_submit | 2,372.66074 | 1 | 2016/02/16 13:58 |
ソフトウエア
解析手法