15. Object recognition
物体検出
gaze_line-depthモデルのステレオビジョンの二つ目の問題を 次の動画で説明します. この動画をよく見ると道路右手前の杭の頭が切れてしまって, 青い服の男性のすねが復元されています. その青い服の男性も頭から上が切れてしまって, その奥の壁が復元されています. また道路の左右の標識の棒は途中が透明になって 奥のものが立体としてきれいに復元されています. このように辻褄のある三次元構造のうち, gaze_line-depthモデルではより奥のものが優先されてしまうという問題があります. これは三次元復元として間違いではないのですが, 人の感覚としては手前を優先してほしいところです. pixel-disparityモデルではより深刻な問題が起こると思われますが, 確認はしていません. さてこれを解決するには物体の位置と形をより正確に判定する必要があります. 直方体領域を用意して,これを前後に移動させたときに 直方体領域のグラフカット値ができるだけ大きな極小となるように 直方体領域のサイズと位置を変化させるという方法で物体の位置と形を検出できます. 次の動画は検出が進んでいるときの様子を示しています. 緑の枠が検出中の直方体領域を表しています.検出が終わると次の位置へ進みます. 最初は道路右手前の杭です.上が高すぎるように見えますが,その位置に杭の頭があります. 次は自転車の男の子です. 次は自転車の女の子です. 次は道路標識の棒です. 次は青い服の男性です. 次は緑の服の男性です. 次は道路標識です. 最後は左の道路標識の棒です. 物体が検出できれば手前の物体を優先するように 表面存在仮説点の尤度を変更して全体をグラフカットすると のように分かりやすい三次元認識結果となります.