このページについて

このページに関する質問やコメントはお気軽に以下のメールアドレスまで. mail

リンクは御自由にどうぞ.

powered by FreeBSD

重要なお知らせ

サイト閉鎖のお知らせ (2012-02-26)

恩師,三橋教授のご厚意により博士課程修了後も維持されてきた当サイトでありますが, この度,三橋教授のご退官により, 時期は未定でありますが来年度中に閉鎖される見通しとなりました. したがいまして,このページの情報を必要とされる方は各自それぞれで必要なページの保存等を行うことをお奨めいたします. 圧縮ファイル形式での提供を希望される方は著者までメールでご連絡下さい. 可能な限り対応させていただきます.

なお,ダウンロードツール類を使用してのバックアップ取得は堅くお断りいたします. この種のツールを利用した場合,ネットワークブロックに対するアクセス規制が行われる恐れがあります.

はじめに

このページでは本研究が採用するピンホールカメラモデルによるカメラのモデル化とその校正法について記述する. このページの前半はピンホールカメラモデルが三次元空間中の点と画像面の点の投影関係を斉次座標系での座標変換の合成によってモデル化することを示す. この座標変換のパラメターを推定することにより画像の情報から外界の三次元構造を復元することが可能となる. このために,このページの後半ではカメラ校正, カメラの座標変換パラメターの推定のためのいくつかの手法を述べる. さらに,ステレオカメラにおける点対応を数学的に記述するエピポーラ幾何学(エピ極線幾何学, epipolar geometry) を扱い, エピポーラ幾何を記述する基礎行列の推定が射影的なカメラの校正であることを示す.

なお,このページの完成版は著者の学位論文[9]の第3章を参照のこと. 旧版における基礎行列の推定方法は次項基礎行列の推定を参照のこと.

図1:ピンホールカメラ (クリックすると拡大)
像面が後ろにあるモデル 像面が前にあるモデル
(a)像面が後ろにあるモデル (b)像面が前にあるモデル

カメラのモデル化

カメラを幾何学的な視点から捉えたとき. カメラは三次元空間中の情報を二次元平面である画像に変換する装置と考えることができる. このような観点からカメラの投影を最も単純化したものが ピンホールカメラ (pinhole camera) (図1)と呼ばれるモデルである. 図1のスクリーンには小さな穴が開けられており, 三次元空間中の物体から出た,あるいは反射した光線は, この小さな穴を通って背面にある撮像面に倒立像を結像する(図1(a)). なお,撮像面を仮想的にスクリーンの前に配置したとすると(図1(b)), 図1(a)と同じ像が倒立せずに撮像面に現れる. 投影をより扱いやすいものとするために,以降は撮像面はスクリーンの前にあるものとする.

透視投影

ピンホールカメラモデルについて,より詳しく考察する. 図1のスクリーン上に開けられた穴を 光学中心 (optical center) , そして,カメラの撮像面を画像面 (image plane) , ピンホールの開けられた面を焦点面 (focal plane) と呼ぶ. いま,三次元空間中に光学中心math-eq を原点とする座標系math-eq を考える. このとき,光学中心を通り,画像面に直交する方向にmath-eq 軸を取るものとする,これをカメラの光軸 (optical axis) と呼ぶ. この座標系のmath-eq 平面は焦点面となる. 光軸と画像面の交点を画像中心もしくは光軸点と呼び,math-eq と書くものとする. 焦点面と画像面の距離をmath-eq と書き, 焦点距離 (focal length) と呼ぶ.このように定義した座標系を カメラ座標系 (camera coordinate system) という.

図2:透視投影 (クリックすると拡大)
透視投影

このとき,カメラ座標系で座標ベクタmath-eq を持つ点は, 画像面上の座標系math-eq において,以下の座標ベクタmath-eq を持つ点に結像する(図2).

math-eq (1)

このような変換を透視投影 (perspective projection) と呼ぶ. これは,斉次座標を用いることで,下のように線型に書き直される.

math-eq (2)

この式の左辺のベクタは射影空間と考えた三次元空間中の点の座標ベクタで あり,右辺は射影平面と考えた像面上の座標ベクタである. これらの関係は射影の意味で線型であり,三次元座標系で考えた場合のmath-eq に関 して非線型な式(1)よりも格段に扱いやすいものとなる. 式(2)は行列形式で次のように記述されることができる.

math-eq (3)

ここで,math-eqmath-eq である.このようにすることで,カメラの投影を射影空間 math-eq からmath-eq への線型写像と見なすことができるようになる. このmath-eq を透視投影行列と呼ぶ.

式(2)の行列math-eq の行ベクタに注目することで, ある重要な事柄を見出すことができる. いま,math-eq を以下のように書くものとする.

math-eq (4)

このとき,前項からmath-eqmath-eq は射影空間中のある平面を意味することが分かる. 例えば,math-eq なるベクタmath-eq は三次元空間中でmath-eq なる点,math-eq 平面上の点の射影座標である.math-eqmath-eq なるベクタがそれぞれ,math-eq 平面上の点, math-eq 平面上の点を表わすことを考えると,これらの平面の交差点,すなわち カメラの光学中心に関して,以下の式が成り立つことが分かる.

math-eq (5)

ここで,math-eq はカメラの光学中心の三次元座標である.

座標変換

前節までで,ピンホールカメラモデルを幾何学的に記述することができた. 本節では三次元空間や画像面に対する座標変換が透視投影行列に与える影響につ いて考察する.

像面上の座標変換

コンピュータビジョンにおける画像の利用を考えると, 実際のカメラから得たデータは,コンピュータ内では画素単位 で記録されたデジタルデータとして扱われることが多い. 画像が輝度情報のみであれば,これらが格子状に並んだものが画像データである. 通常,これらのデータは画像の左上を原点として 座標を読み取る,また,格子のサイズはCCDの感度セルのサイズや ビデオデータのサンプリングレートに依存して変化する. 像面上にこうした座標変換に対応した新たな座標系を考える. いま,この座標系において縦横のスケールがmath-eq , 光軸点が座標math-eq であるとする. 新たな座標系に対応する座標変換は以下のように記述できる.

math-eq (6)
よって,新たな透視投影行列は次のようになる.
math-eq (7)

ところで,焦点距離math-eq や画素の大きさmath-eq , 光軸点math-eq はカメラ固有の要素である.透視投影をより扱いやすいもの とするために,投影のみを行う単純なカメラを考えることにする. このカメラを単位カメラと呼び, 一般的なカメラは単位カメラと像面上の座標変換の合成として以下のように記述する.

math-eq (8)

以上のように,カメラ固有の要素と透視投影を分離する.

三次元空間中の座標変換

これまでの透視投影行列はカメラを基準とした座標系を用いて記述してきた. しかしながら,カメラの位置とは独立な外部の世界に基づいた座標系を考えた方が都合が良いことがある. こうした座標系を世界座標系 (world coordinate system) と呼ぶ.

図3:世界座標系とカメラ座標系 (クリックすると拡大)
世界座標系とカメラ座標系

いま,世界座標系で三次元座標ベクタmath-eq を持つ点が カメラ座標系で三次元座標ベクタmath-eq を持つものとする. このとき,両者の関係はそれぞれの斉次座標ベクタをmath-eqmath-eq とし, カメラ座標系への座標変換を記述する回転行列をmath-eq , 並進ベクタをmath-eq と書くことで次のように記述される.

math-eq (9)

これは三次元射影空間におけるユークリッド変換である.

最後に世界座標系と画像座標系の関係を考える. 式(3)から,カメラ座標と画像座標は math-eq 記述された. この関係と, 式(8)式(9)を用いることで, 世界座標とカメラ座標の関係は以下のようになる.

math-eq (10)

上の式を整理して,最終的に以下の式を得る.

math-eq (11)

ここで,第二式のmath-eq は像面上の座標変換であり, これを内部パラメター (internal parameter) 行列と呼び, math-eqmath-eq をカメラの外部パラメター (external parameter) と呼ぶ. これはmath-eq がカメラ固有の要素であり,math-eqmath-eq がカメラの姿勢 に関するものであることによる. 式(11)が透視投影モデルにおける最も一般的な表記である. 今後は透視投影行列といった場合,特に断らない限り,この表記の行列を指すものとする.

正射影カメラ

式(1)のカメラの座標系において光軸に沿ったmath-eq なる並進を考える. このとき,式(11)から,透視投影行列は 次のようになることが分かる.

math-eq (12)

透視投影行列はスケールを含んで定義されるため, これは射影の意味で以下の行列に等しい.

math-eq (13)

ここで,math-eq とした場合,次の行列が現れる.

math-eq (14)

このとき,画像座標はmath-eqmath-eq となる. これは正射影 (orthographic projection) である. 正射影は透視投影において,カメラから物体の距離に対して, math-eq が極めて大きくなったときの極限として現れる. なお,math-eq の第三行から正射影は無限遠平面 math-eq を保存すること が分かる.これは正射影が平行性を保存することを意味する.

物理的なカメラモデル

現実のカメラの光学系には構成部品の配置誤差やレンズ収差がわずかながら存在 する.こうした要素を考慮したカメラモデルが存在する. 本研究の三次元構造復元法ではこれらの要素は扱わないが,参考までに説明する.

剪断変形

これまで考えてきたカメラモデルは画像面と光軸が正確に直交するというモデルであった. とはいえ,現実的なカメラを考えた場合,光軸とカメラの撮像素子の配置された面は厳密に直交していると限らない. こうした,撮像素子の配置誤差は画像格子が正方形にみえないと言う現象を引き起こす. これは,画像座標系が直交座標系にならないことに対応する. この場合,画像座標系の座標軸のなす角をmath-eq とすると, 内部パラメター行列は次のようになる [1]

math-eq (15)

この式はmath-eq に関して明らかに非線型である. ここでは,剪断変形を考慮した場合,カメラモデルが非線型になる,ということのみ述べる.

レンズ収差

図4:レンズ収差による非線型歪み[7] (クリックすると拡大)
レンズ収差による非線型歪み

左図(a)が樽型歪み,左図(b)が糸巻き型歪みである. 中図が接線歪みである. 右図がWengらによる放射状歪みと接線歪みのモデルである.

前節では撮像素子の配置誤差による剪断変形について説明した. これに加えて,現実のカメラにはレンズ収差によって 引き起こされる幾何学的な歪みが存在する. ここでは,そうした幾何学的な歪みの中で最も顕著な影響を与えるとされる, Weng[7]らのモデルにおける放射状歪み (radial distortion) と接線歪み (tangential distortion) を扱う.

放射状歪みは理想的なレンズによる結像位置から内側への, または,外側への位置のずれを生じる. このうち,内側への変位,すなわち負の変位を 樽型歪み (barrel distortion) , 外側への変位,すなわち,正の変位を 糸巻き型歪み (pincussion distortion) , と呼ぶ. 放射状歪みは次のような級数で表わされる.

math-eq (16)

ここで,math-eq は光軸点からの距離, math-eq は歪みの係数である. この級数の第一項のみ考えることにすると, math-eq 方向とmath-eq 方向それぞれの投影位置のずれmath-eqmath-eq は以下のように表現される.

math-eq (17)

ここで,math-eqmath-eq は理想的なレンズモデルによる像の位置であり, 観測することはできない. 放射状歪みは光軸点を中心としてmath-eq 傾いた直交軸上に最も大きくあらわれる.

つぎに,接線歪みである. 接線歪みの原因となるのはDecentering distortion とThin Prism distortionがある. これらは放射状歪みの原因にもなる. Decentering distortionは光学系の構成要素の配置誤差によって引き起こされる. 例えば,レンズの光軸上から光学系の中心がずれている場合などである. これは放射状の歪み成分math-eq と接線歪み成分math-eq として以下のように表現される.

math-eq (18)

ここで,math-eq図4の接線歪みが最大となる方 向からの角度である. math-eqmath-eqmath-eqmath-eq と書き,math-eq に関する高次の項を切り捨てることで math-eq 方向とmath-eq 方向それぞれの歪み成分math-eqmath-eq は以下のようになる.

math-eq (19)

Thin Prism distortionはレンズ加工や光学系の組み立ての不完全性から引き起こされる.

math-eq (20)

ここで,math-eq図4の接線歪みが最大となる方向からの角度である. math-eqmath-eq と書き,さきとmath-eq に関する高次の項を切り捨てることで math-eq 方向とmath-eq 方向それぞれの歪み成分math-eqmath-eq は以 下のようになる.

math-eq (21)

最終的な投影位置はここまでの全ての歪みを合わせたものとなる.

math-eq (22)

この中で,最も顕著な影響があるのはmath-eq を係数とする放射状歪みの 項である. よって,多くの場合はこの要素のみが考慮される [1]. レンズ収差による歪みを考慮した場合もカメラモデルは非線型となる.

カメラの校正法

カメラの透視透視行列を推定し,結像特性や姿勢を決定することを カメラ校正 (camera calibration) と呼ぶ. 本節ではカメラの校正法として,三次元空間中の点の座標を利用するZhang [8]の方法と, 三次元平面上の点の像の対応を利用する Triggs [6]の方法を扱う.

既知の構造物を用いたカメラ校正法

三次元構造が既知な対象物体をカメラによって観測し, 画像座標と三次元座標の関係を解くことによってカメラ校正を行うことができる. ただし,校正器具として三次元物体利用する場合, これを精密に製作しておく必要があり,カメラ校正が困難となることがある. ここでは,校正器具を利用する手法の中では比較的容易な Zhang [8] の方法を記述する. これは三次元物体を利用した校正器具よりも比較的製作が容易な平面パタンを用いる手法である (図5).

図5:Zhang のカメラ校正法 (クリックすると拡大)
Zhang のカメラ校正法

いま,平面パタン上にmath-eq 座標系を設定し,平面上の点math-eqmath-eqmath-eqmath-eq 視点から観測するものとする. このとき,第math-eq 視点の内部パラメター行列をmath-eq , 外部パラメターをmath-eqmath-eqmath-eq とするとき投影関係は次のように記述できる.

math-eq (23)

ただし,math-eq を利用して回転行列の第3列を取り除いた. いま,第2式の射影変換をmath-eq と書くとき, math-eq 射影変換math-eq の3列はそれぞれ回転行列math-eq の第1列,第2列と並進ベクタmath-eq の定数倍に等しい. したがって,math-eq に関して以下が成立する.

math-eq (24)

これはmath-eq の要素に関して線型である. もし,math-eq が視点によって変化しなければ, math-eq もまた不変であるから,これをmath-eq と書くとき, 3視点のmath-eq から未知のmath-eq の6要素を線型に推定できる. 何らかの手段で推定したmath-eqmath-eq と分解することで内部パラメター行列math-eq を得る. なお,math-eq を 絶対円錐曲線の像 (image of the absolute conic) と呼ぶ.

特徴点の平面拘束を利用したカメラ校正

前節の方法はカメラ校正に用いる平面構造物上の特徴点の三次元座標を利用して推定した平面射影変換math-eq を利用した. 本節で扱う Triggs [6]の方法は特徴点の三次元座標ではなく画像面上の点対応から推定した平面射影変換を用いるカメラ校正法である. 空間中の座標既知の点を用いないカメラ校正を一般に 自己校正 (self calibration) と呼ぶ.

図6:Triggs のカメラ校正法 (クリックすると拡大)
Triggs のカメラ校正法

いま,math-eq 点の三次元平面上の特徴点math-eqmath-eqmath-eq 視点で観測されるものとする. 画像math-eq と画像math-eq におけるmath-eq の像をそれぞれmath-eqmath-eq と記述するとき,math-eqmath-eq には平面射影変換math-eq による次の関係が成立する.

math-eq (25)
これはmath-eq の要素に関して線型であるから, math-eq の座標を用いること無く点対応のみから平面射影変換math-eq を推定できる. ところでmath-eqmath-eqmath-eq には次の関係がある (図6).
math-eq (26)

ただし,math-eqmath-eq は三次元平面と画像math-eq , 画像math-eq をそれぞれ結ぶ平面射影変換である. したがって,両辺の定数倍をmath-eq と記述するとmath-eq に関する以下の行列方程式が得られる.

math-eq (27)

ここで,math-eq は以下である.

math-eq (28)

ただし,math-eq は行列の対角和である. したがって,平面射影変換math-eq を画像対を利用して推定した後, 式(27)を解くことでmath-eq が得られる. 平面射影変換math-eqmath-eq が得られた後は Zhang の方法と同様にすることでカメラ校正を行うことができる.

ステレオカメラの校正法

本節ではステレオカメラの画像間に成り立つ射影幾何学であるエピポーラ幾何学を扱う. まず,エピポーラ幾何学を記述する基礎行列を扱い, ステレオカメラの点対応との関係について議論する. 続いて,ステレオカメラの基礎行列を推定することは, これらのカメラの位置の射影的な校正,射影復元であることを指摘する.

点対応とエピポーラ幾何

図7:ステレオカメラと点対応 (クリックすると拡大)
ステレオカメラと点対応

ステレオカメラが空間中の一点を観測する場合に点対応を記述するのが二視点間の エピポーラ幾何 (epipolar geometry) である. 三次元空間中の点math-eq を それぞれ,射影行列がmath-eqmath-eq であるような 画像math-eq ,画像math-eqmath-eqmath-eq と観測されるものとする. 画像math-eq ,画像math-eq のカメラの光学中心をそれぞれmath-eqmath-eq とするとき,特徴点の非斉次座標math-eq は,4点 math-eqmath-eqmath-eqmath-eq と共面である (図7). したがって,math-eqmath-eq を通る直線と math-eqmath-eq を通る直線はmath-eq で交差する.

続いて,点対応をmath-eqmath-eq の関係として記述することを考える. 三次元特徴点math-eq とその投影像には以下が成立する.

math-eq (29)

math-eq を逆投影した直線を考えるとき,点math-eq はこの直線上にある. これは,直線上の二点を選択することで以下のように記述できる.

math-eq (30)

ただし,math-eqmath-eq の擬似逆行列,math-eq はある定数である. math-eq であることと 式(5)を利用すると, 明らかにmath-eq である. いま,math-eqmath-eq を用いて投影するとき, その投影像math-eq式(30)で基底として選択した二点を結んだ直線である.

math-eq (31)

ここで,math-eqmath-eq との外積を表現する歪み対称行列である. math-eq は画像math-eq のカメラの光学中心math-eq の画像math-eq における像であり, エピ極 (エピポール, epipole) と呼ばれる. math-eqmath-eq が同一の点math-eq の像であれば, math-eqmath-eq は共線でなければならない.

math-eq (32)

ただし,線型変換math-eq を以下のようにおいた.

math-eq (33)

このようなmath-eq なる線型変換を 基礎行列 (fundamental matrix) と呼び, 直線math-eqmath-eq に関する エピ極線 (エピポーラ線, epipolar line) と呼ぶ. 式(32)は エピポーラ方程式 (エピ極線方程式, epipolar constraint) と呼ばれ, 点対応の拘束条件として利用される. なお,ここではmath-eq を逆投影した視線をmath-eq で投影することにより, math-eqmath-eq を得たが, math-eq を逆投影した視線をmath-eq で投影しても同様の拘束条件 math-eq を得ることができる. 後者の基礎行列math-eq と前述のmath-eq には次の関係がある.

math-eq (34)

また,定義より,math-eq であるから, 基礎行列math-eqmath-eq とエピ極math-eqmath-eq には次の関係が成立する.

math-eq (35)

したがって,基礎行列は正則ではない. 基礎行列は定数倍の不定性があること,そして,正則でないことからその自由度は7である.

基礎行列と射影復元

本節で基礎行列が射影座標系の取り方と独立な二視点の射影行列の表現であることを示す. 三次元空間中のmath-eq の射影行列math-eqmath-eq による像をそれぞれmath-eqmath-eq とするとき, これらは次の関係を満たす.

math-eq (36)

ただし,math-eqmath-eq は非零のスケールである. 方程式が満足される限り,左辺のmath-eq 係数行列の行列式は常に零であることから, これを展開することで以下を得る.

math-eq (37)

ただし,math-eqmath-eqmath-eq はそれぞれmath-eqmath-eq の第math-eq 行の要素を縦に積んだベクタである. 式(32)式(37)は等価であるから, 基礎行列math-eq は射影行列math-eqmath-eq を用いて次のように書くことができる.

math-eq (38)

また,式(5) を利用すると,画像math-eq と画像math-eq の光学中心を それぞれ,射影行列math-eqmath-eq の要素で記述できる. これらをそれぞれ,math-eqmath-eq で投影したものがエピ極 math-eqmath-eq であるから,式を整理することで以下の表現を得る.

math-eq (39)

式(38)式(39)はそれぞれ, 基礎行列math-eq ,エピ極math-eqmath-eq の Grassmann-Cayley 代数 [2] による表現と同一である.

図8:射影復元 (クリックすると拡大)
元の形状とカメラ配置 射影変換した形状とカメラ配置
(a) 元の形状とカメラ配置(b) 射影変換した形状とカメラ配置

ところで,射影行列と三次元空間中の点の対 math-eqmath-eq 射影変換行列math-eq を用いて, math-eqmath-eqmath-eq と変換した math-eq について, その投影像math-eqmath-eq は不変である. これはカメラの位置の変換にあわせて対象物体を変形することに相当する (図8). このとき,式(38)より, math-eqmath-eq に関する基礎行列math-eq は次のようになる.

math-eq (40)

基礎行列は射影変換math-eq の影響を受けないことから, ある射影行列の対を射影座標系の取り方と独立な形で表現したものであると言える. 実際,math-eqmath-eq がそれぞれ見掛け上11自由度を持つ一方で, 座標系の選択の任意性としてmath-eq 射影変換math-eq の不定性を含む. math-eq の自由度は15であるから, カメラの対の射影復元はmath-eq 自由度である. 事実,これは基礎行列の自由度に一致する. したがって,基礎行列を推定することはステレオカメラを射影的な意味で校正することに対応する. ここから復元した対象物体はもとの形状と射影変換の意味で等しい. このような三次元構造復元を 射影復元 (projective reconstruction) と呼ぶ. なお,基礎行列が既知なカメラの対のことを 弱校正済み (weakly calibrated) [5] であるという. 基礎行列math-eq に対応するカメラの対 math-eq は以下のように表現される [4]

math-eq (41)

ここで,math-eq は任意のmath-eq ベクタ,math-eq は任意のスカラーである.

基本行列と自己校正法

式(33)からも明らかなように, 射影行列の対math-eq の基礎行列math-eq は それぞれのカメラの内部パラメターと外部パラメターを含んでいる. そこで,本節では基礎行列を二つのカメラの内部パラメターと外部パラメターで 記述することを考える. まず,math-eq の光学中心と向きを基準に世界座標を設定することで, math-eq は以下で記述される.

math-eq (42)

ただし,math-eqmath-eq はそれぞれのカメラの内部パラメター行列, math-eqmath-eq はカメラmath-eq の外部パラメターである. このようなカメラの対に関する基礎行列は次のようになる.

math-eq (43)

さらに,任意の正則行列math-eq とベクタmath-eq に関して, math-eq が成立することを利用すると以下を得る.

math-eq (44)

ただし,math-eq を利用した. これはmath-eq がカメラmath-eq 基準で書いたカメラmath-eq の光学中心であることに よる. このとき,以下の行列math-eq を 基本行列 (essential matrix) と呼ぶ.

math-eq (45)

なお,基本行列を定義してから基礎行列を導くこともできるが, 本論文では一貫して射影座標系を基準とし, その特殊な場合としてユークリッド座標系を考えるため, 基礎行列を定義してから基本行列を導出した. 基本行列はカメラの対math-eq の 内部パラメターmath-eqmath-eq が既知の場合に画像間のエピポーラ幾何 を記述する. 基本行列の方程式は基礎行列の方程式(32) と同じ構造を持つことから,点対応から基本行列を推定することができる. ただし,点対応から得た基本行列は定数倍の不定性を持つことから, ここから得られる構造復元は元の構造と相似の関係になる. また,世界座標原点の任意性まで考慮すると構造復元は全体として相似 変換の不定性を持つことになる. このように,元の構造と相似変換の意味で等しい構造復元を 慣用的に ユークリッド復元 (Euclidean reconstruction) と呼ぶ(ただし,厳密には相似復元とすべきである).

なお,式(44)式(45)からも明らかなように, 基礎行列math-eq や基本行列math-eq はカメラの内部パラメターや外部パラメターを含んでいる. 何らかの方法で推定した基礎行列や基本行列を分解して, カメラのパラメターを得る方法は[3][4]が詳しい.

続いて,視点間の基礎行列からカメラの内部パラメターに関する制約を与える Kruppa 方程式を導く. この Kruppa 方程式を解くことで, 座標既知の点を利用せずにカメラの校正を行うことができる. 式(43)を用い,ここから回転行列math-eq を消去す ることで以下を得る.

math-eq (46)

ただし,math-eqmath-eq とおいた. 式(46)を Kruppa 方程式 (Kruppa equation) と呼ぶ.

古典的な自己校正法はカメラの内部パラメターが視点間で変化しないことを前提 としてKruppa 方程式を解いて行う. この条件の下ではmath-eq であるから,Kruppa 方程式は次のようになる.

math-eq (47)

この式の両辺はmath-eq の要素に関して線型であるから, 方程式を解いて推定した math-eqmath-eq と分解することで内部パラメターを得ることができる. このようなmath-eq を 双対絶対円錐曲線の像 (dual image of the absolute conic) と呼ぶ.

式(47)は両辺の半正定値対称行列の要素の比が等しいことを 意味するが,やや冗長な表現である. ここでは基礎行列の特異値分解を利用することでより簡略な表現を導く. まず,基礎行列を次のように特異値分解する.

math-eq (48)

ここで,math-eq であるから, math-eq である. 式(48)式(47)に代入することで以下を得る.

math-eq (49)

最後の式の両辺を比較することで以下の方程式を得る [4]

math-eq (50)

この方程式のうち,独立なものは2つあるから, 3視点以上の画像の基礎行列の対からmath-eq を推定できる.

まとめ

このページではピンホールカメラの投影を射影幾何学に基づいてモデル化し, その校正法について簡単に記述した. 前半では外界をmath-eq ,画像面をmath-eq と考え, 斉次座標系で線型変換を記述することでピンホールカメラの投影が 空間中のユークリッド変換,像面への射影変換,そして像面上のアフィン変換の合成で記述できることを示した. 後半ではカメラの結像特性や姿勢の決定方法であるカメラ校正についていくつかの手法を記述した. 最後に,ステレオカメラにおける点対応の数学的な記述として, エピポーラ幾何を扱い,これを記述する基礎行列に関していくつかの議論を行った. そして,基礎行列が座標系と独立なステレオカメラの射影復元であることを示した.

参考文献

  1. 出口光一郎. ロボットビジョンの基礎. コロナ社, 2000.
  2. Olivier D. Faugeras and Quang-Tuan Luong. The Geometry of Multiple Images : the laws that govern the formation of multiple images of a scene and some of their applications. The MIT Press, 2001.
  3. 金谷健一, 松永力. 基礎行列の分解 : 焦点距離の直接的表現. 情報処理学会研究報告, 2000-CVIM-120-7, pp. 49-56, Jul 2000.
  4. Richard I. Hartley and Andrew Zisserman. Multiple View Geometry in computer vision. Cambridge University Press, second edition, 2003.
  5. 佐藤淳. コンピュータビジョン-視覚の幾何学-. コロナ社, 1999.
  6. Bill Triggs. Autocalibration from Planar Scenes. In Proceedings of European Conference on Computer Vision, Freiburg, Germany, pp. 89-105, 1998.
  7. Juyang Weng, Paul Cohen, and MarcHerniou. Camera Calibraton with Distortion Models and Accuracy Evaluation. IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 14, No. 10, pp. 965-980, October 1992.
  8. Zhengyou Zhang. A flexible new technique for camera calibration. IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 11, pp. 1330-1334, Novenber 2000.
  9. 渋沢英次郎. 代数学的誤差の最小化に基づく未校正多視点画像からの三次元復元に関する研究. 博士学位論文, 電気通信大学 大学院 電気通信学研究科, March, 2010.