画像認識技術を用いたアルバム自動生成システム

電気通信大学電気通信学部

情報工学科コンピュータ学講座

平成25年1月31日

原田浩睦

Abstract:

本論文では位置情報付き画像に対するアルバム作成システムを提案する．

今日，デジタルカメラの普及と記録メディアの容量拡大により個人でも数百枚の画像を撮影することが可能である．個人の撮影した大量の画像の中には失敗画像や集合写真のように失敗を考慮し複数枚撮影した画像などがある．撮影した画像を見るときには失敗画像や集合写真のような重複した画像は見る必要はない．しかし，これらの大量の画像の中から見るべき画像を選択すること，つまりアルバムの要約は手間である．

またカメラの画角に収まりきらないものを複数枚に渡って撮影した画像は特徴点マッチにより自動でパノラマ画像を生成することができる．しかし，どの画像からパノラマ画像を生成するかは人の手によっている．

本研究では，画像認識の技術を利用し撮影画像をランキングすることで(i)大量の画像の中から重要な画像を選択できる機能，(ii)パノラマ画像が生成できそうな画像に対しては自動でパノラマ画像を生成する機能，を持った自動アルバムシステムを提案する．

1 はじめに

1 背景と目的

デジタルカメラの普及および記憶メディアの容量拡大により個人でも一度の撮影で数百枚の画像を撮影することが可能となった．一部のデジタルカメラやスマートフォンといった撮影機器にはGPS機能を搭載し，画像に撮影位置の情報を付与できるものもある．スマートフォンの多くはGPS機能を搭載しており，今後はデジタルカメラにもGPS機能を搭載したものが多くなることが考えられる．

公開するという観点からは， Panoramio¹や Flickr²などのアルバム投稿閲覧サービスがある．これらのシステムでは投稿者の投稿画像にいくつかのタグ情報，位置情報を付与して公開する．これらのサービスでは投稿者が撮影した画像の中から投稿する画像を選択して投稿するシステムである．しかし，撮影した画像の中から投稿する画像を選択する作業は撮影画像が増えるに従って困難なものになる．

また，撮影画像の中にはパノラマ画像を生成できるような撮影画像を含むこともある．複数の画像からパノラマ画像を生成することは容易である．しかし，パノラマ画像を生成できるような画像を選択することは公開する画像を選択することと同様，撮影枚数の増加に伴い困難となる．

本研究では位置情報付き画像に対して画像認識技術を用いた自動アルバムシステムの実現を目指す．このシステムはユーザが撮影画像を登録すると重要度の上位の画像を表示するシステムである．また撮影画像中にパノラマ画像を生成できるような画像が含まれている場合，自動でパノラマ画像を生成する．

従来のアルバム投稿システムに対して，本手法は画像認識技術を用いたことにより画像を選択する手間を省くことができる．その他にも顔画像認識，物体検出技術の組み合わせを一部ユーザに設定できるようにしたことで幅広いユーザへの対応を図った．

2 本論文の構成

本論文の構成は以下のようになっている．

1章はじめに

この研究の背景，目的を記載する．

2章関連研究

2 関連研究

撮影画像の管理を目的とした研究としてはHugoら[1]の研究がある．この研究ではPhotoGeoというインフラを提案している．これはユーザによる撮影画像の検索を補助するためのシステムである．

PhotoGeoでは撮影された画像を撮影位置，撮影時刻，ユーザのカレンダーから得られたイベント情報からイベントに分類する．イベントとは場所と時刻の情報とカレンダーから得られたイベント名の情報である．また撮影時には撮影画像ごとに写っている人物のアノテーションも行うことで，撮影後に大量の画像に対して人物注釈を行う負担をなくしている．撮影時に人物情報を付与することはユーザの手間になる．しかしこの研究では撮影画像をイベントに分類し，そのイベントに参加しているであろう人物を注釈の際にリストの上位に表示するという工夫で補っている．

この手法では撮影画像はイベント名と写っている人物の注釈とともにデータベースで管理され，検索時にはイベント名や人物名での検索を行えるものである．

PhotoGeoシステムでの検索画面と検索結果の例を図，図に示す．

**Figure:** PhotoGeoシステムでの検索画面([1]から引用)

**Figure:** PhotoGeoシステムでの検索結果の表示画面([1]から引用)

本研究と同様に撮影後の画像から目的の画像を検索する手助けを行うシステムであるが，本研究では撮影画像の人物注釈は行わない．今までに撮影された大量の撮影画像から画像のメタデータと画像認識技術だけを用いて撮影画像を選択する点が本論文の手法とは異なっている．

また，類似の研究に奥山の研究[2]の旅行記録の整理機能がある．これは観光地でのユーザの軌跡データからユーザが訪れたであろう観光地の代表画像とその近隣の観光地の代表画像を表示する機能を実現した．

この研究ではあらかじめ大量の位置情報付き画像を収集し，撮影地点をクラスタリングすることで観光地クラスタを選出する．選出した観光地クラスタは分類された画像の中からその観光地クラスタの代表画像を選出しておく．そこにユーザの軌跡データを与えるとユーザの軌跡を観光地クラスタ間の移動と捉え，訪れたであろう観光地クラスタの代表画像を表示する．図に表されるユーザの軌跡に対して，ユーザの訪れた観光地クラスタとその近隣の観光地クラスタの代表画像を表示した例を図に示す．

**Figure:** ユーザの軌跡([2]から引用)

**Figure:** ユーザの軌跡からユーザの訪れた観光地クラスタとその近隣の観光地クラスタの代表画像を表示した画面([2]から引用)

観光地クラスタを選出するために事前に大量の位置情報付き画像の収集を必要とする点，代表画像はユーザの撮影した画像でない点が本論文の手法とは異なっている．

商用の撮影画像登録システムとしてFlikrやPanoramio，画像管理ソフトとしては Picasa³があげられる．

Flikrは登録画像の公開，非公開の設定や，画像の向きを変えるなどの画像編集の機能を持つシステムである．公開されている登録画像には投稿ユーザ以外のユーザからもタグを付与することができる．タグとは画像の情報を表すテキストであり，タグ情報を利用して画像を検索することができる．

一方，Panoramioは画像の位置情報から地図上に画像を表示するシステムである．図に示すように右側に地図と地図上に画像が配置されており，撮影位置から表示する画像を絞り込むことができる．

**Figure:** Panoramioでの表示

画像管理ソフトPicasaはローカルコンピュータ内の画像データを管理するソフトである． Picasaの特徴は図に示すように顔認識によるインデキシング機能を持つ点である．画像から顔領域を検出し，顔ごとに名前をラベル付けすることができる．

**Figure:** Picasaでの顔認識の例

3 システム概要

1 アルバムシステムの基本設計

1 システムの流れ

提案システムの流れを述べる．ここでアルバムとは旅行などのイベントで，ユーザが画像を登録する最小単位である．１つのアルバムは数百枚の画像を持つことを想定している．
1#1

オリジナル画像から２種類の縮小画像を作成するのは表示の際に画像の読み込みを早くするためと各種検出を行いやすくするためである．縮小画像のサイズ 2#2，3#3 は元の画像のアスペクト比が変化しないように決定する．

顔検出では画像内の顔の出現位置とサイズを正規化するためオリジナルサイズの画像ではなく2#2のサイズの縮小画像から検出を行う．また，物体検出は他の検出に対して非常に時間がかかるため3#3のサイズの縮小画像から検出する．一方，ぶれ検出では縮小による影響でぶれの発生や増減を防ぐためオリジナルサイズの画像から検出を行った．

2 ユーザとデータの扱い

本研究では，以下に列挙する点から画像や各種評価値，メタデータなどをデータベースを用いて管理する．

複数ユーザの登録画像の管理を行う．
大量の画像の登録を想定する．
画像ごとの各種評価値，メタデータ等を扱う．

本研究で構築したデータベースの実体関連図を図

に示す．

**Figure:** 本システムで用いたデータベースの実態関連図

2 システムの機能

1 重要画像の選出

本研究の主目的である重要画像の選出は顔画像認識，物体検出，ぶれ画像検出の結果を用いて選択する．各検出は登録後に自動で行いデータベースに登録する．検出のフローチャートを図

に示す．

**Figure:** 顔検出，ぶれ検出，物体検出のフローチャート

アルバム閲覧の際に画像とともに各種検出値をデータベースから取得し，ブラウザ側で画像を選出する．そのため，ユーザがリアルタイムで選出画像を変更することができる．

本システムのアルバム閲覧画面を図に示す．

図を見るとわかるように閲覧画面は大きく４つに分割されている．

左上の画面はGoogleMapsAPIを利用した地図画面で，選出された画像の位置情報に応じたマーカーが表示される．マーカーをクリックすることでそのマーカーに対応した画像を吹き出しウィンドウに表示する．

右上の画面は選出画像の詳細が表示される．この画面をクリックすることで地図上のマーカーをクリックしたときと同様に吹き出しウィンドウを表示することができる．

左下の画面は選出された画像のサムネイル画像の一覧である．選出枚数が多い場合などに選出画像の全体を見ることができる．また画像をクリックすることで右上の詳細画面がクリックした画像に移動する．

最後に右下の画面であるが，ここは選出手法や選出のパラメータを手動で設定することができるコントロールパネルである．このコントロールパネルでは大きく分けて２つの選出を行える．１つは重要度の枚数を１から100までスライダで設定し重要度を選出するモードであり，本論文で提案する重要度を利用する．もう一方はユーザが選出する画像のパラメータを細かく設定できるモードであり，枚数指定を行わず設定に適合した画像を選出する．

**Figure:** 本システムでのアルバム閲覧画面

2 パノラマ画像の生成

アルバム内で位置と時間が非常に近い画像に対してパノラマ画像の生成を試し，生成したパノラマ画像をアルバムに追加する．その際，パノラマ画像の撮影位置，撮影時刻は元の画像の中で最も新しい画像のものを利用した．

パノラマ画像の生成とデータベースへの登録までのフローチャートを図に示す．

**Figure:** パノラマ画像の生成とデータベースへの登録

3 アルバムの共有

本システムではユーザはアルバムごとに画像を見る．しかし，風景写真のような画像は撮影時に天候不順などの理由で満足できる画像が撮影できないことがある．本システムでは，ユーザがアルバム内の１枚を選んだときにその画像の撮影位置と近い場所で撮影された別のアルバムの画像を表示する機能を付与する．

4 位置情報の補正

登録画像の中にはGPS情報が付与されていない画像や，誤った位置情報が付与されている画像がある．そのため位置情報の補正を行う．

4 手法詳細

1 画像認識技術

本研究では人手によるアノテーションを利用することなく画像を選出するために画像の撮影位置，時刻という画像のメタデータに加え以下の３つの画像認識技術を用いた．

1 顔画像検出

顔画像検出はコンピュータビジョンの世界では古くから行われている研究である．その中でもViolaら[3]によって提案され，Lienhartら [4]によって改良された顔検出器を利用した．

この手法は図に示すような４種類のサブウィンドウの Haar-like特徴を用いて顔画像を検出する．OpenCVでもライブラリが提供されている．本研究ではOpenCVのライブラリを利用した．

**Figure:** Haar-like特徴を計算する４種類のサブウィンドウ([3]から引用)

2 ぶれ画像検出

画像のぼやけ検出の研究としてHanghangら[5]の研究がある．この研究では種類の異なるエッジを検出し，検出されたエッジの数によってぶれ画像の判定とぶれの程度の評価を行った．

エッジは一般にDirac-Structure，Roof-Structure，Step-Structureの３種に分類されるが，この手法ではさらにStep-Structureを輝度変化の勾配に応じて Astep-Structure，Gstep-Structureの２種に分類した．４種のエッジの輝度勾配を図に示した．

**Figure:** Hanghangら[5]の研究で用いられた４種類のエッジの輝度勾配([5]から引用)

ぶれのある画像ではDirac-StructureエッジとAstep-Structureエッジの両方のエッジが消失し，Gstep-StructureエッジとAstep-Structureエッジも輝度変化の鋭さが低下する．そのためDirac-StructureエッジやAstep-Structureエッジを持つかどうかで画像のぶれが存在するか否かを判断し，Gstep-Structureエッジと Roof-Structureエッジの割合で画像のぶれの程度を決定する．

入力画像に対して図に示すように３段階までのHaar wavelet transformを行い３つのレベルに応じたエッジマップを作成する．この３つのマップからエッジを検出する．この手法ではエッジ検出の際に１つ，ぶれ判定の際に１つのパラメータを設定する必要がある．本手法では著者らの行った実験と同様の値を用いた．

著者らの実験ではぶれのない画像1398枚，モーションブラーを含む画像479枚，ピントがずれた画像458のテストデータに対し表に示す精度を得た．

**Figure:** ３段階のHaar wavelet transformを行った結果の図 ([5]から引用)

**Table:** Hanghangら[5]によるぶれ検出の精度 ([5]から引用)
Test Image Set	Number	Accurary(%)
Un-blurred	1398	98.21
Motion Blur	479	98.33
Out-of-focus Blur	458	100
Total	2355	98.60

本研究では失敗画像を除去するためにぶれ画像検出を利用した．

3 物体検出

Bogdanら[6]の研究では画像中の物体がありそうな領域とその領域の物体らしさを算出する手法が提案された．これは画像中から草原や水のような背景と対照的な車や犬のようなオブジェクトを含むようなサブウィンドウとそのウィンドウの物体らしさを定量化する手法である．物体らしさは０以上１以下の実数で表現される．１に近いほどサブウィンドウに物体が含まれている可能性が高いことを表す．

物体検出手法を用いると図の赤枠に示すように物体らしさが高いと判断されるサブウィンドウを検出できる．

この手法は著者のウェブページでソースコードが公開されているためすぐに利用できる．本研究では著者が公開している最新版のObjectness measure V1.5⁴を利用した．

**Figure:** Objectness measure V1.5によるサブウィンドウの選出の例

2 重要画像の評価

1 評価値の統合

重要画像の選出にあたってはまず画像のメタデータを用いたクラスタリングを行った．その中から各種検出値の値を組み合わせた重要度を計算し重要度の高いものを選択した．

利用する検出値は顔検出の結果，ぶれ検出の結果，物体検出の結果である．検出にあたってはまずぶれ画像は撮影に失敗した画像であるとしてぶれ検出によりぶれ画像と判断された画像を除外する．次に顔が３つ以上検出された画像は集合写真のような画像だと考えられるため，重要度を検出された顔の数+100とした．ここで100を加えるのは顔が２以下しか検出されなかった画像と差別化を図るためである．最後にぶれが検出されず，顔が２つ以下しか検出されなかった画像に対しては，物体検出の結果で物体らしさが0.9以上と物体の存在の可能性が高いと判断されたサブウィンドウの数を100で割った値と検出された顔の数を足したものとした．以下に重要度決定のルールを示す．

4#4

重要画像の選出の際にはアルバム内の画像を撮影時刻と撮影位置でクラスタリングを行い，クラスタ内で最も重要度の高い画像を選出する．クラスタリングは前後の画像との撮影時刻の差が60秒以内かつ緯度経度の差が0.0005度以内の画像を１つのクラスタとして扱う．クラスタリングのアルゴリズムをアルゴリズムに示す．比較手法であるランダム手法，顔検出の結果のみを利用する手法でも同様のクラスタリングを行う．
5#5

3 パノラマ画像の生成

パノラマ画像の自動生成プログラムとしてAutostitch⁵などがある．このパノラマ画像生成プログラムは画像からSIFTによるマッチングを行いパノラマ画像を合成する．SIFTとはLoweによって提案された局所特徴量を記述するためのアルゴリズムであり，特徴点の検出と局所特徴量の記述を行う[7]．SIFT特徴は画像の回転，スケール変化，照明の変化に頑強であり，現在の一般物体認識においてよく用いられる特徴量の１つである．

本研究ではOpenCVライブラリにあるopencv_stitchingを利用した．これは特徴量としてSIFTではなくSURFを用いたプログラムである．SURFとはBayらによって提案されたSIFT同様，画像の回転，スケール変化，照明変化に頑健な64次元の特徴量である[8]．SIFTよりも高速で同等の精度がある．画像からSURFによる特徴点とその局所特徴の対応付けを行うことでパノラマ画像を生成する．

本システムで生成したパノラマ画像の成功例を図に，失敗例を図に示す．

4 アルバムの共有

本研究のアルバムシステムの機能としてアルバムの共有機能がある．これは天候不順による視界不良で本来見られる景色を撮影できなかった時に利用することを想定する．

図に示すようにアルバム内のある画像を選択したときに，別のアルバムに含まれる位置情報が近い画像を選択し表示する．

**Figure:** アルバム共有画面：雲が無かったため麓の街の夜景がみられたが雲がかかった場合雲海のような景色を見ることができた

5 位置情報の補正

本研究ではExif領域に位置情報を持つ画像を対象とするため本来すべての画像に位置情報が付与されている．しかし，実際に撮影された画像を調べてみるとカメラ電源を入れた直後に撮影された画像には位置情報が付与されていないものがあった．そのため例外的に位置情報を持たない画像に対して位置情報の補正を行う機能を備えた．

位置情報がない画像に対する位置情報の補正は，撮影時刻の最も近い位置情報付き画像の位置情報をそのまま利用することで補正とした．

5 実験

作成したアルバムシステムにおける重要画像の選出手法について実験を行った．撮影位置と時刻でクラスタリングしたものの中からランダムで選出する方法，顔検出の結果のみを利用する方法でも画像の選出を行い，提案手法と比較を行った．

また，本システムのパノラマ画像自動生成機能，アルバムの共有，位置情報の補正の各機能の結果についても述べる．

1 データセット

データセットは研究室内の位置情報付き画像アルバムから2009年，2010年，2012 年の富士登山のアルバム画像を用いた．アルバムごとの画像枚数は表

に示すとおりである．

これらの画像の中にはExif情報に位置情報を持たないものもあるが，それらの画像はGPSログから位置情報をデータベースに登録した．画像はZIPファイルにまとめてシステムに登録する．

**Table:** 実験で用いたデータセット
アルバム	アルバムに含む画像の枚数
2009年	456
2010年	337
2012年	549
計	1342

2 評価方法

評価は３種類の選出方法に対して各アルバムから100枚の画像を選出し，以下の３点の評価の観点から最も評価できる選出手法を投票する方法をとった．
6#6

また，評価の投票とは別に選出手法についての感想欄，表示システムについての感想欄を用意し，評価者の感想を得た．評価ページは図に示すような画面である．

評価ページは大きく４つの領域に分かれている．左上の画面は選出画像の位置情報を元に地図上に画像を表示する領域である．右上の画面は選出画像の詳細が表示され，この画面をクリックすることで画像のマーカーに吹き出しウィンドウが表示される．左下の画面はアルバムに登録されているすべての画像の一覧表示を行う画面である．画像の周りの色が水色に変化した画像が選出された画像である．選出画像と選出されなかった画像を同時に見ることで選出の善し悪しを比較することができる．右下の画面は３種類の選出手法を選択する画面である．

**Figure:** 実験を行った評価ページ

3 評価結果

重要画像の選出手法を評価した結果を表

に示す．実験ではアルバムごとに５人から評価を得た．2010年のアルバムの１票は３種の選出手法にほとんど差が見られないという評価であった．

2009年，2012年のアルバムでは顔検出の結果のみ利用した手法が評価された．一方，提案手法は2010年のアルバムでのみ評価される結果となった．提案手法，顔検出の両手法はそれぞれランダム手法よりは重要画像の選出を行えた．

**Table:** 選出手法の評価結果
アルバム	提案手法	ランダム	顔検出の結果のみ利用
2009年富士登山アルバム	1	0	4
2010年富士登山アルバム	3	0	1
2012年富士登山アルバム	1	1	3

4 実行例

３種類の選出手法それぞれで20枚の画像を選出した例を示す．図

は提案手法による重要画像の選出の実行例，図

は顔検出の結果のみを用いて重要画像を選出した例，図

はランダムで20枚選出した例である．提案手法，顔検出を利用した選出例では集合写真の画像が選出されている．提案手法，顔検出手法はそれぞれランダムに選択するよりはよい選出を行ったと言える．提案手法，顔検出手法，ランダム選択で共通して選出される画像が含まれるが，これは１枚の画像のみのクラスタから画像を選出しているからである．

**Figure:** 提案手法により画像を選出した例

**Figure:** 顔検出の結果のみ利用して画像を選出した例

**Figure:** ランダムに20枚選出した例

パノラマ画像の自動生成によって生成されたパノラマ画像を図，図に示す．自動生成されたパノラマ画像計146枚中22枚が上下が反転していたり図に示すようなゆがんだパノラマ画像となった．また明らかな失敗画像ではないが，元の画像とほとんど変わらない画像も生成された．

**Figure:** 自動生成したパノラマ画像の成功例

**Figure:** 自動生成したパノラマ画像の失敗例

図の画像に対してアルバム共有機能によって集められた画像の結果を図に示す．本研究では緯度経度の差が0.0005以内の画像をデータベースから選出した．

**Figure:** アルバムの中の１枚を選択した画面

**Figure:** 共有機能によって別のアルバムの画像を表示

図は図に示す画像に対して位置情報の補正を行った結果である．

**Figure:** 位置情報のない画像

**Figure:** 位置情報を補正を行った画像

5 考察

アルバムからの重要画像の選出手法について提案手法と顔検出手法は高い評価を得た．顔検出がうまく行われたため顔検出の結果を用いた提案手法と顔検出の結果のみを利用した手法が評価されたものと考えられる．一方で顔が検出されたが実際には顔が写っていない画像もある．顔の検出の精度を上げることでより優れた選出が行えると考えられる．

また提案手法よりも顔検出の結果のみ利用した手法が評価されたのは提案手法ではぶれ画像の検出値を用いてぶれ画像を除去することが１つの要因になったと考えられる。提案手法では顔が検出されてもぶれ判定を優先して行うため顔検出のみを用いた手法のほうがぶれ画像を含め多くの顔画像を選出できたと考えられる．

ぶれ検出の結果でぶれ画像を除去する提案手法は朝焼けなどの風景写真をぶれ画像と検出してしまい，朝焼けの画像を選出できないという欠点もあった．

評価者の感想の中には，集合写真も重要であるが風景や植物などの人物以外が写る画像を選択できるといいという意見もあった．本システムではユーザの好みに応じて重要画像を選出できるように顔の数，ぶれ画像の除外，物体らしさの指標を選択できるが，風景画像を本システムで選出するのは難しい．様々な好みのユーザに対応できるようにするためには顔検出や物体検出以外の手法でも画像を評価する必要がある．

本システムでの機能の１つにパノラマ画像の生成があるが，パノラマ画像の生成でもいくつか問題がある．パノラマ画像生成の失敗の１つにある画像がもう１枚の画像に完全に内包されるような画像(同じものをズームして撮影した画像と引いて撮影した画像)での合成があった．これとは別にほとんどずれのない画像のパノラマ合成もあった．これらの合成画像は元の画像と写っている範囲があまり変わらないため，時間をかけてパノラマ画像を生成するのは無駄である．

この対策として合成する際に２枚ずつ画像を合成し，元の画像よりもサイズが大きくならなかったものはパノラマ画像の生成に失敗したものとしてパノラマ画像の登録を行わないことが考えられる．

6 おわりに

1 まとめ

本論文では位置情報付き画像に対する画像認識技術を利用した重要画像選出システムを提案した．

本システムの特徴は画像の位置情報，撮影時刻などのメタデータの他に顔検出，ぶれ検出，物体検出の検出結果を用いて重要度を計算した点である．重要度によって表示する画像を選出する．

画像のメタデータを用いて撮影位置，撮影時刻が近い画像に対してはパノラマ画像の生成を自動で行うパノラマ画像自動生成機能を持つ．

またアルバム内の画像を選択するとその画像の撮影位置と近い場所で撮影された別のアルバムの画像を表示するアルバムの共有機能も実現した．

位置情報が付与されていない一部の画像に対して撮影時刻の近い画像から位置情報を付与することで位置情報を補正する機能を持つ．

重要画像選出の提案手法は撮影時刻と位置情報からクラスタリングを行いその中からランダムで画像を選出するよりも重要な画像を選出することができた．

2 今後の課題

顔が写っている画像なのに顔検出の結果顔が検出されないことや，顔が写っていないのに顔が検出されたことから顔検出の精度向上が今後の課題である．顔検出の結果を用いることで重要画像の選出に効果があることがわかったので，顔検出の精度を向上させて重要画像の選出精度を向上させる．

現在の顔検出，物体検出に加え新たな特徴量を導入し，よりユーザの好みに応じた画像の選出を行えるようにする．

アルバムの共有機能が限定的なのでアルバムの共有機能を拡充する．

評価者の感想にもあったがよりユーザが使用しやすいインタフェースの作成を行う必要がある．

Bibliography

1: F. D. F. Hugo, A. L. Yuri, C. D. P. Anselmo, A. C. Marco, and D. S. B. Cláudio.
Photogeo: a photo digital library with spatial-temporal support and self-annotation.
In Multimedia Tools and Applications, pp. 279-305, 2011.
2: 奥山幸也.
位置情報付き写真の撮影軌跡を用いた旅行ルート推薦システム.
Master's thesis, 電気通信大学院電気通信学研究科情報工学専攻修士論文, 2011.
3: P. Viola and M. Jones.
Rapid object detection using a boosted cascade of simple features.
In Proc. of IEEE Computer Vision and Pattern Recognition, pp. 511-518, 2001.
4: R. Lienhart and J. Maydt.
An extended set of haar-like features for rapid object detection.
In Proc. of the International Conference on Image Processing, 2002.
5: T. Hanghang, Li. Mingjing, Z. HongJiang, and Z. Changshui.
Blur detection for digital images using wavelet transform.
In Proc. of IEEE International Conference on Multimedia and Expo, pp. 17-20, 2004.
6: A. Bogdan, D. Thomas, and F. Vittorio.
What is an object?
In Proc. of IEEE Computer Vision and Pattern Recognition, pp. 73-80, 2010.
7: D. G. Lowe.
Distinctive image features from scale-invariant keypoints.
International Journal of Computer Vision, Vol. 60, No. 2, pp. 91-110, 2004.
8: H. Bay, T. Tuytelaars, and L. Van Gool.
SURF: Speeded up robust features.
In Proc. of European Conference on Computer Vision, pp. 404-415, 2006.

Footnotes

... Panoramio¹: Panoramio. http://www.panoramio.com/.
... Flickr²: Flickr. http://www.flickr.com/.
... Picasa³: Picasa. http://picasa.google.co.jp/
... V1.5⁴: Objectness measure V1.5. http://groups.inf.ed.ac.uk/calvin/objectness/
... パノラマ画像の自動生成プログラムとしてAutostitch⁵: Autostitch. http://www.cs.bath.ac.uk/brown/autostitch/autostitch.html

YANAI Lab.