Tensorflow Object Detection API クイックスタート

1
Like
0
Comment

Edited at 2017-10-29

はじめに

この記事は2017年6月に公開されたTensorflow Object Detection APIのクイックスタートガイドです。
ドキュメント読んだり、環境設定に時間を掛けずにペットデータセットを使ったサンプルをDockerを使ってローカル環境で簡単に試せるようにしました。
僕自身もそうですが、普段PythonやDeepLearningをやっていない人の助けになれれば幸いです。

環境

必要な環境はDockerだけです。
メモリが足りないとプロセスが止まってしまうので12GB程度割り当てて下さい。

Docker
- CPUs: 2, Memory: 12GB

Mac以外でも動くと思いますが、自分のマシンのスペックを記載しておきます。

MacBook Pro (13-inch, 2016)
- CPU: 3.3 GHz Intel Core i7
- Memory: 16 GB
- OS: macOS Sierra 10.12.6

ステップ

Clone repository

まずはこのクイックスタートのために用意したレポジトリをクローンします。

git clone https://github.com/Jwata/tensorflow-pet-detector-quickstart
cd tensorflow-pet-detector-quickstart

TF Recordの作成

ペットデータをダウンロードして、Object Detection APIのレポジトリのスクリプトを使ってTFRecordを作成します。
ダウンロードに結構時間かかります。

pushd data
  wget http://www.robots.ox.ac.uk/~vgg/data/pets/data/images.tar.gz
  wget http://www.robots.ox.ac.uk/~vgg/data/pets/data/annotations.tar.gz
  tar -xvf images.tar.gz
  tar -xvf annotations.tar.gz
popd

docker run -it -v `pwd`/data:/data jwata/tensorflow-object-detection \
  python object_detection/create_pet_tf_record.py \
  --label_map_path=/data/pet_label_map.pbtxt \
  --data_dir=/data \
  --output_dir=/data

dataディレクトリ内を確認して２つのファイルが出来ていればOKです。
pet_train.recordはトレーニング用、pet_val.recordは評価用に使います。

ls data/pet_*.record
data/pet_train.record  data/pet_val.record

学習済みモデルのダウンロード

COCOデータセットの学習済みモデルをダウンロードします。
モデルはチュートリアルで使われているFasterRcnn + Resnet101というものを使っていますが、Googleは他の種類の学習済みも公開しているので、Configファイルを変更すれば別のモデルを選択することも可能です。
モデルの違いについては現在勉強中です。

pushd data
  wget http://storage.googleapis.com/download.tensorflow.org/models/object_detection/faster_rcnn_resnet101_coco_11_06_2017.tar.gz
  tar -xvf faster_rcnn_resnet101_coco_11_06_2017.tar.gz
  cp faster_rcnn_resnet101_coco_11_06_2017/* .
popd

トレーニング

Dockerを使ってトレーニングのプロセスを開始します。

docker run -d -v `pwd`/data:/data --name pet_detector_train jwata/tensorflow-object-detection \
  python object_detection/train.py \
  --logtostderr \
  --pipeline_config_path=/data/faster_rcnn_resnet101_pets.config \
  --train_dir=/data/train

評価

トレーニングを開始したら評価のプロセスも開始できます。

docker run -d -v `pwd`/data:/data --name pet_detector_eval jwata/tensorflow-object-detection \
  python object_detection/eval.py \
  --logtostderr \
  --pipeline_config_path=/data/faster_rcnn_resnet101_pets.config \
  --checkpoint_dir=/data/train \
  --eval_dir=/data/eval

Tensorboard

トレーニングと評価の進捗をTensorboardで確認します。

docker run -d -v `pwd`/data:/data -p 6006:6006 --name tensorboard \
  jwata/tensorflow-object-detection \
  tensorboard --logdir=/data

open http://localhost:6006

10分ほど待つと評価プロセスの結果の画像が表示されると思います！
2,3日夜通し計算して5000~7000ステップほど学習したら結構良い結果が出ていました。

最後に

DeepLearningは勉強していてわくわくしますね。
次は下記のことを進めてていきます。

違うモデルで学習する
- Googleが公開している他の学習済みモデルも試していきたい
- モデルの違いを勉強中。理解できたら解説記事を書きたい。
自分のデータセットで学習する
- 寿司の画像で学習中です。近日中に進捗を共有します。

参考リンク

Object Detection API のドキュメント(英語)

Quick Start: Distributed Training on the Oxford-IIIT Pets Dataset on Google Cloud
- 本記事で解説しているペットデータセットを用いたObjectDetectionAPIチュートリアル、GoogleCloud ML Engineでトレーニングしています。
Running Locally
- ObjectDetectionAPIをローカルマシンで使うための解説
Configuring the Object Detection Training Pipeline
- トレーニングのConfigについて

他の解説記事

TensorFlow Object Detectionチュートリアルのデータセットを変えて学習させたい
- チュートリアルの内容をより詳しく解説されています。
macOS Sierraでtensorflowの新しいObject Detection APIを試してみた

# はじめに
この記事は[2017年6月に公開](http://jp.techcrunch.com/2017/06/17/20170616object-detection-api/)された[Tensorflow Object Detection API](https://github.com/tensorflow/models/tree/master/research/object_detection)のクイックスタートガイドです。
ドキュメント読んだり、環境設定に時間を掛けずに[ペットデータセットを使ったサンプル](https://github.com/tensorflow/models/blob/master/research/object_detection/g3doc/running_pets.md)をDockerを使ってローカル環境で簡単に試せるようにしました。
僕自身もそうですが、普段PythonやDeepLearningをやっていない人の助けになれれば幸いです。

# 環境
必要な環境はDockerだけです。
メモリが足りないとプロセスが止まってしまうので12GB程度割り当てて下さい。

- Docker
 - CPUs: 2, Memory: 12GB

Mac以外でも動くと思いますが、自分のマシンのスペックを記載しておきます。

- MacBook Pro (13-inch, 2016)
 - CPU: 3.3 GHz Intel Core i7
 - Memory: 16 GB
 - OS: macOS Sierra 10.12.6

# ステップ
## Clone repository
まずはこのクイックスタートのために用意した[レポジトリ](https://github.com/Jwata/tensorflow-pet-detector-quickstart)をクローンします。

```
git clone https://github.com/Jwata/tensorflow-pet-detector-quickstart
cd tensorflow-pet-detector-quickstart
```
## TF Recordの作成
ペットデータをダウンロードして、Object Detection APIのレポジトリの[スクリプト](https://github.com/tensorflow/models/blob/master/research/object_detection/create_pet_tf_record.py)を使ってTFRecordを作成します。
ダウンロードに結構時間かかります。

```sh
pushd data
  wget http://www.robots.ox.ac.uk/~vgg/data/pets/data/images.tar.gz
  wget http://www.robots.ox.ac.uk/~vgg/data/pets/data/annotations.tar.gz
  tar -xvf images.tar.gz
  tar -xvf annotations.tar.gz
popd

docker run -it -v `pwd`/data:/data jwata/tensorflow-object-detection \
  python object_detection/create_pet_tf_record.py \
  --label_map_path=/data/pet_label_map.pbtxt \
  --data_dir=/data \
  --output_dir=/data
```

`data`ディレクトリ内を確認して２つのファイルが出来ていればOKです。 
`pet_train.record`はトレーニング用、`pet_val.record`は評価用に使います。

```
ls data/pet_*.record
data/pet_train.record  data/pet_val.record
```

## 学習済みモデルのダウンロード
[COCOデータセット](http://cocodataset.org/)の学習済みモデルをダウンロードします。
モデルはチュートリアルで使われているFasterRcnn + Resnet101というものを使っていますが、Googleは他の種類の学習済みも公開しているので、Configファイルを変更すれば別のモデルを選択することも可能です。
[モデルの違い](https://github.com/tensorflow/models/blob/master/research/object_detection/g3doc/configuring_jobs.md)については現在勉強中です。

```sh
pushd data
  wget http://storage.googleapis.com/download.tensorflow.org/models/object_detection/faster_rcnn_resnet101_coco_11_06_2017.tar.gz
  tar -xvf faster_rcnn_resnet101_coco_11_06_2017.tar.gz
  cp faster_rcnn_resnet101_coco_11_06_2017/* .
popd
```

## トレーニング
Dockerを使ってトレーニングのプロセスを開始します。

```sh
docker run -d -v `pwd`/data:/data --name pet_detector_train jwata/tensorflow-object-detection \
  python object_detection/train.py \
  --logtostderr \
  --pipeline_config_path=/data/faster_rcnn_resnet101_pets.config \
  --train_dir=/data/train
```

## 評価
トレーニングを開始したら評価のプロセスも開始できます。

```sh
docker run -d -v `pwd`/data:/data --name pet_detector_eval jwata/tensorflow-object-detection \
  python object_detection/eval.py \
  --logtostderr \
  --pipeline_config_path=/data/faster_rcnn_resnet101_pets.config \
  --checkpoint_dir=/data/train \
  --eval_dir=/data/eval
```

## Tensorboard
トレーニングと評価の進捗をTensorboardで確認します。

```
docker run -d -v `pwd`/data:/data -p 6006:6006 --name tensorboard \
  jwata/tensorflow-object-detection \
  tensorboard --logdir=/data

open http://localhost:6006
```

![](https://raw.githubusercontent.com/tensorflow/models/master/research/object_detection/g3doc/img/tensorboard2.png)

# 最後に
DeepLearningは勉強していてわくわくしますね。
次は下記のことを進めてていきます。

- 違うモデルで学習する
  - Googleが公開している[他の学習済みモデル](https://github.com/tensorflow/models/blob/master/research/object_detection/g3doc/detection_model_zoo.md)も試していきたい
  - [モデルの違い](https://arxiv.org/abs/1611.10012)を勉強中。理解できたら解説記事を書きたい。
- 自分のデータセットで学習する
  - 寿司の画像で学習中です。近日中に進捗を共有します。

# 参考リンク
### Object Detection API のドキュメント(英語)

- [Quick Start: Distributed Training on the Oxford-IIIT Pets Dataset on Google Cloud](https://github.com/tensorflow/models/blob/master/research/object_detection/g3doc/running_pets.md)
  -  本記事で解説しているペットデータセットを用いたObjectDetectionAPIチュートリアル、GoogleCloud ML Engineでトレーニングしています。
- [Running Locally](https://github.com/tensorflow/models/blob/master/research/object_detection/g3doc/running_locally.md)
  -  ObjectDetectionAPIをローカルマシンで使うための解説
- [Configuring the Object Detection Training Pipeline](https://github.com/tensorflow/models/blob/master/research/object_detection/g3doc/configuring_jobs.md) 
  -  トレーニングのConfigについて

### 他の解説記事
- [TensorFlow Object Detectionチュートリアルのデータセットを変えて学習させたい](https://qiita.com/14kw/items/c56e6c7ff15da2d285e6)
  - チュートリアルの内容をより詳しく解説されています。
- [macOS Sierraでtensorflowの新しいObject Detection APIを試してみた
](https://qiita.com/yyoshiaki/items/058250321dc8ac1ddea6)

watanabe0621

4Contribution