メルカリのTeam AI Meetup #1 に参加してきた #mercari_ai
メルカリが主催する機械学習のミートアップに参加してきたので備忘録がてらメモ書きです。書きなぐったメモなので意訳として捉えて下さい
Team AI Meetup #1 (2018/02/13 19:00〜)
イベント概要 メルカリの機械学習やAIを担当しているTeam AIによる、メルカリで使われているAIトピックをご紹介! Team…mercari.connpass.com
イベント概要 メルカリの機械学習やAIを担当しているTeam AIによる、メルカリで使われているAIトピックをご紹介! Team…mercari.connpass.com
Twitter : #mercari_ai
山口さん
- Image Net とmercariの持ってるデータセットは似てるのでいけるのでは!
- ルカリはクラス数 over 1100
- 始期の推定値 Top5 29.3%
- エラー例 :画像からサイズを推定しないと男女のシューズを区別不可(人間でも不可能なエラー例が多い)
- 意外と認識がうまくいく事例がかなりある(クラス設計の影響で推定が上手く出来ていないらしい)
- データセットはユーザーが作成してるので最高、画像が正方形なのもGood
- 学習はGPU,推論はCPU環境下で行っている
- 画像検索自体はプロトタイプは出来ているが、実運用は計算量やリアルタイム性を担保するのが難しいので一旦保留中
大筋は以下の記事と資料で把握できます。k8sで運用しているなどの実運用の構成が今回の発表では差分として語られていました。
画像での商品検索に向けて - Mercari Engineering Blog
こちらは Mercari Advent Calendar 2017 の23日目の記事になります。 メルカリで機械学習エンジニアをやっている kumon です。…tech.mercari.com
こちらは Mercari Advent Calendar 2017 の23日目の記事になります。 メルカリで機械学習エンジニアをやっている kumon です。…tech.mercari.com
【Mercari Summer Internship】商品画像の色推定を行いました! - Mercari Engineering Blog
はじめまして! Mercari Summer Internship 2017 機械学習エンジニアコースに参加していました上川優太です。 現在は大学院に所属し、機械学習を学んでいます。…tech.mercari.com
はじめまして! Mercari Summer Internship 2017 機械学習エンジニアコースに参加していました上川優太です。 現在は大学院に所属し、機械学習を学んでいます。…tech.mercari.com
工藤さん
- 運用を継続すると色んな問題が出てきたので、それを解決する基盤環境を作成しはじめた
- e.g. 学習データのバージョン管理、モデルのデプロイ, etc
- 最終的にはOSSとしての公開も考えているとのこと
メルカリの今年1年間の機械学習の取り組みとこれから - Mercari Engineering Blog
これは Mercari Advent Calendar 2017 の2日目の記事です。 昨日は@stanaka の 分散ファイルシステムはブロックチェーンの夢を見るか でした。 今回は@Hmj_kd…tech.mercari.com
これは Mercari Advent Calendar 2017 の2日目の記事です。 昨日は@stanaka の 分散ファイルシステムはブロックチェーンの夢を見るか でした。 今回は@Hmj_kd…tech.mercari.com
ML Ops Study (仮) #1 の発表内容も今回の機械学習の運用周りのTipsが共有されているので興味のある方はオススメです
機械学習基盤といえば、最近PolyaxonというOSSが公開されてました。
Polyaxon
https://polyaxon.comAn enterprise-grade open source platform for building, training, and monitoring large scale deep…polyaxon.com
https://polyaxon.comAn enterprise-grade open source platform for building, training, and monitoring large scale deep…polyaxon.com
Q.A.セッション
- Q. 論文などは参考にされますか?
- A. ある程度枯れた手法をメインに実装している
- TFX(KDD2017)などGoogleが出している機械学習の基盤関係の論文は非常に参考している
- Q. 機械学習のプロジェクトをどう進めているか?
- A. ある程度の機械学習についての啓蒙が必要
- 必ずデモを見せて期待値のすり合わせを行っている
- 何もしらない人は機械学習に対して過度な期待ではなく間違った期待をしてしまっているのでそこのすり合わせは重要
- e.g. データは無いが機械学習でなんとかして! など
雑感 : 質疑応答でも機械学習を実運用したい場合にどう運用しているかにフォーカスした質問がメインでためになる質問が多かったので良かった。メルカリさんが今回のような知見を共有してくれるのは本当に尊敬できます。