2012年9月26日水曜日

パターン認識とは

 パターン認識とは、観測されたデータを、幾つかのクラス(概念)の一つに対応づける処理のことです。人間を例に考えてみると、例えば、人の顔を見たとき、「あ、Aさんだ。」と、誰であるかを認識します。これは、人の顔というデータを、Aさんというクラスに対応づけたことになります。パターン認識は、これと同じ処理をコンピュータにやらせようというわけです。
 コンピュータに仕事をさせるには、もう少し細かくデータを与えないといけません。人の顔というデータの中には、顔の形、髪型、目の色や形、肌の色など、色んな特徴が含まれます。これらの特徴を使って、Aさんというクラスを導き出していきます。このパターン認識処理をコンピュータで行うために、パターン認識システムが構成されます。パターン認識システムはシステムですから、入力と出力があります。入力はデータで、出力はデータを分類したクラスです。
 パターン認識システムは、図1のように、前処理部、特徴抽出部、認識部から構成されます。


図1:パターン認識システムの構成
 
前処理部は、データをコンピュータで処理しやすいように、あるいは、次の特徴抽出がやりやすいように、データを加工します。例えば、コンピュータで処理しやすいようにするには、アナログ信号をデジタル信号に変換したり、雑音を取り除いたりします。特徴抽出がやりやすいようにするには、手書き文字認識ならば、手書き文字を領域に分割して、線の存在や傾きなどを特徴に設定します。どの特徴を設定すべきかは、認識対象によります。つまり、認識対象ごとに、パターン認識に適した特徴を設定することが重要となります。この特徴は数値で表され、特徴の組はパターンと呼ばれます。このように認識対象を数値で表現できるようにすることを、パターン化といいます。前処理部からの出力は、パターン空間になります。
 特徴抽出部は、次の識別部で、パターンの識別がやりやすい特徴を取り出す役割を担います。取り出される特徴は、パターンの変動に影響されにくいものでなくてはいけません。例えば、手書き文字認識ならば、Aさんが書いた「あ」でも、Bさんが書いた「あ」でも、文字「あ」として認識される必要があります。この場合、誰が書いたかという情報に関連した特徴は必要ありません。つまり、パターンに含まれる特徴の組から、パターン認識にとって真に重要な特徴を抽出するわけです。
 認識部は、入力パターンを、複数のクラスのうちの1つに対応させる処理を行います。このとき考慮する特徴は、パターンに含まれるすべての特徴ではなく、特徴収集部で取り出された特徴だけになります。識別部からは、認識結果として入力パターンが属するクラスが出力されます。

0 件のコメント:

コメントを投稿