(cache)OpenCVとVisual C++による画像処理と認識（１２）----- テンプレートマッチングで道路標識と数字を検出する -----

2015. 2. 20.
2017.10. 4. OpenCV3.3.0とVisual C++ 2017で動作確認済み、ただし、文末の付記参照
石立喬

OpenCVとVisual C++による画像処理と認識（１２）

----- テンプレートマッチングで道路標識と数字を検出する -----
　テンプレートマッチングは古くから使われてきた探索手法であるが、最近では、学習を利用した、より高性能な探索技法が主流になっている。しかし、幸いに、OpenCVにはテンプレートマッチング用の優れた関数が用意されているので、道路標識や数字の検出を試み、マッチング相関性の計算方法の比較も行った。

テンプレートマッチングとは
　テンプレートとは型紙のことで、見本とも言える。見本と比べて、同じか違うかを判断することである。テンプレートマッチングは、被探索画像の隅から隅まで、順次にテンプレート画像をずらしながら重ねて行き、相関性を求めて、一定値よりも大であれば、そこに一致した図形があると判断する。
　この操作は、テンプレートと大きさが異なったり、傾いていたりすると、一致を判断できない欠点がある。計算量も多いので、実用的には、敬遠されることが多い。ただし、大きさが同じで、方向を揃えることができ、ベルトコンベアなどで被検査物が移動する製品検査などには、有用である。

OpenCVを用いたテンプレートマッチング
　大きく分けて、二つの場合が考えられる。
◎画像の中から最も良く一致した対象物を一個だけ検出する
　たとえば、視野の中に「止まれ」の標識が一個でもあれは、それに反応するようなシステムの場合で、　matchTemplate関数を用いてマッチング結果配列resultを求め、minMaxLoc関数を用いてその最大（相関計算方法によっては、最小）値とその位置を取得する。最大（最小）値が一定の基準を満たしていれば、マッチングしたと判断する。
◎画像の中から、一致した対象物を一個以上検出する
　プリント基板などにある多数の同じパターンで、不良個所が、どことどこにあるかを探して、そのすべてを表示させるような場合に使用する。　　matchTemplate関数を用いてマッチング結果配列resultを求め、その配列を二次元的にスキャンして、相関値を順次取得し、一定の基準を満たしていれば、マッチングがあったとして、その座標位置を合致配列に格納する。最終的に、合致配列から読み取って使用する。

カラー画像での簡単なテンプレートマッチング
　テンプレートマッチングは、カラー画像でも使用できる。ただし、特定の色相を抜き出すなどの前処理の後ではグレイスケール画像になることが多く、また処理速度が遅いので、グレイスケール画像でテンプレートマッチングを取るのが一般的である。
　ここでは、カラー画像の例として、被探索画像の一部をそのままテンプレート画像として用いる場合を示す。一番簡単で、探索精度も高い。いわば、うまくいって当たり前の非現実的なケースである。、
　使用したプログラムを図１に示す。このプログラムは、下記から成る。
　１）原画像（被探索画像）src_imageとテンプレート画像temp_imageを読み込み、表示する。
　２）テンプレートマッチングを取る。
　３）結果のマッチング配列（相関値の分布を示す）resultを画像として表示する。
　４）マッチング点（座標）maxPtを取得する。不必要な値に対しては、引数として0またはNULLを入れる。
　５）原画像上に、黄色の矩形でマッチング箇所を表示する。
　図２はテンプレート画像と原画像を表示した結果で、図３は、マッチング結果を画像として表示したものと、マッチング箇所を表示した結果である。マッチング画像は、テンプレートのサイズだけ原画像より小さく、この範囲内でしかマッチングを検出できない。マッチング画像において、最も白い部分がマッチング点で、その位置がテンプレート画像の左上に当たる。

使用したOpenCV関数の説明
◎matchTemplate関数
　引数は

　　　matchTemplate(被探索図形、テンプレート画像、マッチング結果配列、比較方法);

となり、被探索図形は、カラーでもよい。テンプレート画像は、被探索画像と同タイプとする。マッチング結果配列はCV_32Fである。
　比較方法には下記がある（= で示したのは、代用できる整数値である）。
　　TM_SQDIFF = 0 ------------- 差の二乗の合計、小さいほど良くマッチしている
　　TM_SQDIFF_NORMED = 1 ---- 同上の正規化
　　TM_CCORR = 2 ------------- 乗算したものの合計、大きいほど良くマッチしている
　　TM_CCORR_NORMED = 3 ---- 同上の正規化
　　TM_CCOEFF = 4 ------------ 相関係数であり、正に大きいほど良くマッチしている
　　TM_CCOEFF_NORMED = 5 --- 同上の正規化
　結果配列resultから特定の座標位置の相関値を得るには、
　　result.at<float>(y, x)
を用いる。
◎minMaxLoc関数
　下記のように、マッチング結果配列を引数として与え、相関値の最大値、最小値、最小位置、最大位置を参照渡しで受け取る。

　　　minMaxLoc(マッチング結果配列、&最小値、&最大値 = 0、&最小位置 = 0、&最大位置 = 0、マスク = noArray());

　あらかじめ、double minVal、double maxVal、Point minLoc、Point maxLoc　の入れ物を用意しておく（必要あるもののみ）。resultはfloatであるのに、ここでのminMaxとmaxValはdoubleであることに注意されたい。

図１　カラー画像の簡単なプログラム

図２　テンプレート画像と共に原画像を示す

図３　マッチング結果と最大マッチング点の表示

道路標識に対するテンプレートマッチング（同一種類に対して一個のみ検出の例）
　道路標識を例に、簡単なテンプレートマッチングを行う。図４は、そのプログラムで、原画像の読込み部分は省略してある。
　ここでは、下記の処理を行う。原画像bin_imageは、「画像処理と認識（１０）」で既に示した赤色抽出によって、道路標識の部分だけを二値化したものである。
　１）二種類のテンプレート画像temp_stopとtemp_noentryをグレイスケールとして読み込む。
　２）テンプレートtemp_stopで原画像bin_imageとマッチングをとり、相関値の最大値maxValとその位置maxPtを取得する。
　３）相関値の最大がしきい値thresholdより大きければ、その位置を黄色の矩形で原画像に描き、表示する。
　４）テンプレートtemp_noentryで原画像とマッチングをとり、相関値の最大値とその位置を取得する。
　５）相関値の最大がしきい値より大きければ、その位置をシアンの矩形で原画像に描き、表示する。
　図５は正しく検出された例を、図６は、二個の標識がある合成した原画像で、二種類の道路標識を同時に検出できることを示す。

図４　「止まれ」と「進入禁止」を検出するプログラム

図５　正しく検出された例

図６　実際にはない合成画像で、異なる二つの道路標識を同時に検出した

　図７はその他の結果の一部を紹介したもので、左二つは、少し斜めになっていても検出できた例、三番目は、大きい「止まれ」を下の部分だけで「止まれ」と判断した例、右端は小さい「進入禁止」を「止まれ」と間違えた例である。

図７　少し斜めでも検出できたが、「進入禁止」を「止まれ」と間違えた例も

数字の二値画像に対するテンプレートマッチング（複数個を同時に検出の例）
　被検索画像から複数の図形を検出するためには、最大値のみを取得するminMaxLoc関数は使えない。マッチング配列resultから、自分で探し出す必要がある。図８はそのプログラムで、下記を行う。
　１）原画像をカラー画像src_imageとして読み込む（後に、マッチング結果を赤色で描くため）。
　２）原画像をグレイスケール化してbin_imageとする。
　３）数字「3」のテンプレートtemp_threeと原画像bin_imageとでテンプレートマッチングを行う。
　４）マッチング結果配列resultをスキャンして、値がしきい値thresholdより大きければ、その座標位置を検出点配列detected_pointに入れる。
　５）配列detected_pointを順次読み取って、原画像上に赤枠でマッチング位置を表示する。
　図９は得られた結果で、５個の「3」がすべて検出されている。しきい値thresholdは試行錯誤で決定したが、0.94fまで下げると、「8」も検出されるようになったので、余裕を見て、0.96fとした。

図８　複数個を検出するプログラム

図９　数字を検出した結果

マッチング評価法（相関性の計算方法）の比較
　テンプレートと被検索画像の間での演算方法に下記のタイプ（各方法に割り当てられた整数で示す）がある。
　　タイプ0 ---- TM_SQDIFF
　　タイプ1 ---- TM_SQDIFF_NORMED
　　タイプ2 ---- TM_CCORR
　　タイプ3 ---- TM_CCORR_NORMED
　　タイプ4 ---- TM_CCOEFF
　　タイプ5 ---- TM_CCOEFF_NORMED
◎所要時間
　テンプレートマッチングの実施に当って、その所要時間が気になるので、数字「3」を検出するプログラムを使って、上記各タイプの比較を行った。そのプログラムを図１０に、結果を図１１に示す。プログラムでは、TM_SQDIFF等の文字列で指定する代わりに、対応する整数値を用いた。
　インクルードファイルの追加、名前空間の宣言など、作表方法については「Visual Studio Express 2013(Visual C++)の新しい使い方（３）」を、時間測定方法については「・・・の新しい使い方（５）」を参照されたい。

図１０　所要時間を測定するためのプログラム

図１１　タイプ2（TM_CCORR）がやや早いが、他は大差がない

◎出力データ
　結果として得られる最小値、最大値の値は、タイプによって異なる。そこで、これを確認した。そのプログラムを図１２に、結果を図１３に示す。タイプ１と２は、数値が小さい方がマッチングの度合いが高い。タイプ１のminValが0.000704になっているのはかなり良好な一致を示している。タイプ２～５は、数値が大きい方が相関性が高い。タイプ３のmaxValが0.999652であるのも素晴らしい。プログラムで設定したthreshold = 0.96fは甘すぎたかもしれない。

図１２　最小値と最大値を具体的に知るためのプログラム

図１３　タイプ3（TM_CCORR_NORMED）の最大値が1に一番近い

結　論
　実用的には、あまり使われなくなったテンプレートマッチングであるが、被検索画像から抜き取ったままのテンプレート画像に対しては、非常に良い成績を示した。道路標識検出の場合も、テンプレート画像に近いサイズの標識には十分な性能が得られた。
　マッチングの度合いを評価する計算方法が６種類、OpenCVに用意されているので、これらで得られる数値と所要時間を確認した。ここで用いた簡単な例に限っての評価であるが、最大値、最小値などの数値は、いずれの方法も十分な精度を持っていた。所要時間では、TM_CCORRが36msecと早く、他は40msec～50msecであった。ただし、これはDebugモードでビルドしたので、Releaseモードでは、もっと早いかもしれない。

付　記
　OpenCV3.3.0とVisual C++ 2017を使用するにあたり、下記を参照されたい。それ以外は、古いプログラムをそのまま使用できる。
　１）従来のインクルードファイルをそのまま使用しても良いが、#include <opencv2/opencv.hpp>と変更しても問題はない。
　２）従来のint _tmain(int argc, _TCHAR* argv[])をそのまま使用しても良いが、int main()にしても差支えない。
　３）vectorを使用するのに、using namespace std;の追加が必要である（従来は無くても良かったような気がする）。

「Visual C++の勉強部屋」（目次）へ