トップへ
田村研究室

マルチメディア論および演習

2009年度

2009
6/1

画像処理とは

画像処理の目的

ビットマップ画像を,目的に応じて処理することを画像処理(image processing)と呼ぶ.狭義の意味では人間の視覚にとって見やすい画像に変換することであることが多い.特にこれを画像変換と呼ぶ.

また,画像中から特定の人物を取り出したり,顔の部分だけを取り出したりする処理も行われるが,これは画像解析と呼ばれる.また画像に移っている物の個数を数えたり,大きさなどを測定することを画像計測と呼ぶ.画像解析で得られた物体や物体の一部分や画像計測で得られた数量を画像特徴と呼ぶ.さらに取り出されたこの画像特徴を認識させて,例えばどんな顔の表情をしているかなどを判断させること画像識別と呼ぶ.識別された情報などからその意味を理解することを画像理解と呼ぶ.

  • 画像変換 見やすく,雑音除去など
  • 画像解析 画像から特徴抽出 (指の位置,目鼻の位置,特定な色の部分の座標など)
  • 画像計測 画像から計測 (物の数,物の大きさなど)
  • 画像認識 特徴の判別,テンプレートマッチングなど(道路標識の種類,顔の表情,手指の形状など)
  • 画像理解 認識結果の理解 (誰がどんな動作をしていてその意図は,どんな物体がどう動いているかなどを理解)

それぞれを単独ではなく,この流れで処理し,カメラに撮像されている状況を判断させようという研究が,コンピュータビジョン(computer vision)の研究である.類似するものとして次の分野がある.どれも同義語として使われることもある.

  • コンピュータビジョン
  • マシンビジョン: どちらかというと,工場のオートメーション(FA)に利用するための技術に偏っている.
  • ロボットビジョン: どちらかというと,ロボットの視覚認識を実現するための研究である.
  • コンピュータビジョンにおける画像変換の部分は,それに続く画像解析のときに特徴を抽出しやすくする目的で行われることになり,特に「前処理」と呼ばれる.

    画像変換

    画像変換の例としては,まず画像を見やすく(あるいは特徴を抽出しやすいように)変換するために,画像の明るさやコントラストを調整するための画像濃度変換がある.ここでいう濃度とは,画像の明度成分の量を示す.

    画像解析

    画像解析のための代表的な手法として,画像から特徴を抽出するためのデジタルフィルタが存在する.ここでいうフィルタとは,画像から必要な情報を濾 過して不必要なものを排除する動作を実現する手法のことを比喩的に表現したものである.デジタルフィルタには,有限インパルス応答を用いたFIRフィルタ や,周波数成分フィルタがある.

    FIRフィルタの代表的な例が,Sobelフィルタなどの微分フィルタである.画像に対する微分を簡単にいえば,画像から明度差の大きい部分だけを取り出すことに等しく,早い話が輪郭線抽出を行うことができる.また,ラプラシアンフィルタのような二次微分フィルタもある.二次微分フィルタの出力は,元の画像と足しあわせることで画像の鮮明化によく利用される.

    FFT(高速フーリェ変換)を用いて,画像から周波数成分を取り出し,周波数の観点から特徴を抽出することもある.特に,周波数成分に対してフィルタをかける周波数成分フィルタによって画像を加工することも行われる.周波数成分フィルタでは,低周波成分だけを残すローパスフィルタや,高周波成分だけを残すハイパスフィルタが代表的である.

    画像計測

    画像計測としては,画像から物体や領域の面積を求めたり,ステレオカメラを用いて撮影した右画像と左画像の間に生じた視差を計算することで,奥行き を求める.その他画像から何か量を計測することをいう.画像から面積を求めるには,単純にある領域に含まれる画素数を数え,実際の面積に置き換えられる. しかし,3次元的な奥行きを考慮する場合には,それに応じた変換を施す必要がある.

    画像認識

    画像解析,画像計測して得られた特徴や計測値から,撮像画像の中からある対象物体を抽出したり,撮像物体の識別を行う.

    画像理解

    画像認識の結果から得られた,撮像画像中に存在する様々な物体と物体がどのような関係にあるのか理解させる.例えば,人間と人間が接触したり,離れたりすることを認識し,その動作の意味を推定させる.