機械学習をやりたいんだけど、データがない!他のデータ使ってみたい! そんな方のために、機械学習に使えるオープンデータを集めました。
他にも、このデータセットオススメ!というものがあれば、是非ご紹介して頂けると嬉しいです。m(__)m
UC Irvine Machine Learning Repository
カリフォルニア大学アーバイン校が公開した、データセット。351件のデータセットがあり後述する DATA GO に比べれば少ないが、ほとんどがMachine Learning用のデータ・セットなので、かなりオススメ。
UCI Machine Learning Repository
かの有名なあやめの花(iris)のデータセットもここから見ることができます。
国立情報学研究所
yahoo,楽天,ニコニコなどのデータがあります。
DATA.GO.JP
日本政府が、保有しているデータを公開したもの。
ちなみに、一番人気は平成25年産野菜生産出荷統計らしい。
DATA.GOV
DATA.GO.JPが参考にした、オープンデータサイト。こちらは、U.S. Governmentのデータになります。
現在、185,967 DATASETSという膨大なオープンデータを公開している。
※DATA.GO.JPは、17,105 件のデータを公開している。
土地代データ
日本全国の土地代と、その年間推移が載っています。
各種SNS
SNSはAPIを公開しているので、それを利用してデータを取得できます。