7. The KITTI Benchmark Suite
カラーステレオ画像の引用
ベンチマーク画像としてTSUKUBAステレオ画像ばかりを使ってきましたので, こんどはもっと新しいベンチマーク画像を使ってみたいと思います. The KITTI Vision Benchmark Suite では,自動車の自動運転技術のためのベンチマーク画像が提供されています. ライセンスは「The Creative Commons Attribution-NonCommercial-ShareAlike 3.0 License」です. ここでは膨大なデータの中から左右2枚の画像を引用します. この2枚の画像の再利用に関してはこのライセンスに従ってください. Stereo Evaluation 2012 ページの Download stereo/optical flow data set (2 GB) ボタンを押して入手できる. data_stereo_flow.zip ファイルを展開して得られるファイル群の中から
- quote training/colored_0/000000_10.png as L000000_10.png
- quote training/colored_1/000000_10.png as R000000_10.png
gaze_line-depth modelの適用結果
記事3のdepth_stereo.cppを適用した結果の視差ファイルは となりました.実行は
./depth_gpu R000000_10.png L000000_10.png 68 0 14 1023 1 3
としました.最後の3はscale factor値です.
最大視差が68なのは3d_stereo.cppを使って目視で見つけることができます.
非常に遠方の景色が映っているので最小視差は0となります.
次に3d_stereo.cppを適用した結果を動画にすると
となりました.3d_stereo.cppは記事3のものに以下の1文字キーコマンドを追加したものを使いました.
character | function |
---|---|
6 | video(result.avi) out |
H | eye move left |
J | eye move down |
K | eye move up |
L | eye move right |
F | eye move forward |
N | eye move back |
C | clear angle and position |
character | function |
---|---|
h | eye move left angle |
j | eye move down angle |
k | eye move up angle |
l | eye move right angle |
make 3d_g
と打ち込み,コンパイルと起動を行ってください.
makefileを見れば分かりますが,プログラムの起動は
./3d_gpu R000000_10.png L000000_10.png 68 0 14 1023 1
となっています.
動画を作るには,まず「,キー」でグラフカットを行います.
次に「6キー」で動画作成を指示します.
「6キー」では前に進んで,進みながら少し右を見て,
少し前に進んでそれから,
元に戻るという動画が記録されるようになっています.
「qキー」で終了です.
この動画ファイルresult.aviはサイズがちょっと大きいので
MacかWindowの機能を使って
m4vファイルにエンコードします.
グラフカットに時間がかかりますのでCPUではちょっと無理です.