機械学習への細道: 9月 2012

　パターン認識とは、観測されたデータを、幾つかのクラス（概念）の一つに対応づける処理のことです。人間を例に考えてみると、例えば、人の顔を見たとき、「あ、Aさんだ。」と、誰であるかを認識します。これは、人の顔というデータを、Aさんというクラスに対応づけたことになります。パターン認識は、これと同じ処理をコンピュータにやらせようというわけです。
　コンピュータに仕事をさせるには、もう少し細かくデータを与えないといけません。人の顔というデータの中には、顔の形、髪型、目の色や形、肌の色など、色んな特徴が含まれます。これらの特徴を使って、Aさんというクラスを導き出していきます。このパターン認識処理をコンピュータで行うために、パターン認識システムが構成されます。パターン認識システムはシステムですから、入力と出力があります。入力はデータで、出力はデータを分類したクラスです。
　パターン認識システムは、図1のように、前処理部、特徴抽出部、認識部から構成されます。

図1：パターン認識システムの構成

前処理部は、データをコンピュータで処理しやすいように、あるいは、次の特徴抽出がやりやすいように、データを加工します。例えば、コンピュータで処理しやすいようにするには、アナログ信号をデジタル信号に変換したり、雑音を取り除いたりします。特徴抽出がやりやすいようにするには、手書き文字認識ならば、手書き文字を領域に分割して、線の存在や傾きなどを特徴に設定します。どの特徴を設定すべきかは、認識対象によります。つまり、認識対象ごとに、パターン認識に適した特徴を設定することが重要となります。この特徴は数値で表され、特徴の組はパターンと呼ばれます。このように認識対象を数値で表現できるようにすることを、パターン化といいます。前処理部からの出力は、パターン空間になります。
　特徴抽出部は、次の識別部で、パターンの識別がやりやすい特徴を取り出す役割を担います。取り出される特徴は、パターンの変動に影響されにくいものでなくてはいけません。例えば、手書き文字認識ならば、Aさんが書いた「あ」でも、Bさんが書いた「あ」でも、文字「あ」として認識される必要があります。この場合、誰が書いたかという情報に関連した特徴は必要ありません。つまり、パターンに含まれる特徴の組から、パターン認識にとって真に重要な特徴を抽出するわけです。
　認識部は、入力パターンを、複数のクラスのうちの1つに対応させる処理を行います。このとき考慮する特徴は、パターンに含まれるすべての特徴ではなく、特徴収集部で取り出された特徴だけになります。識別部からは、認識結果として入力パターンが属するクラスが出力されます。

　このブログでは、機械学習やパターン認識について統計的扱いを中心に書いていきます。
　機械学習は人工知能研究の一種で、コンピュータに学習機能を構築します。機械学習における学習機能は、コンピュータの内的状態が変化することによって、新たな局面に対応する能力を備えることを意味します。つまり、知的活動ができるようになります。ただ、人間が可能とする知的活動と比較すると、そのレベルは限定的であり、その範囲には特徴があります。
　例えば、インターネット上には情報が溢れていますが、この大量の情報の中から規則性や法則を見つけ出し、有用な知識として抽出することはコンピュータの得意分野です。これは、データマイニングと呼ばれます。知識抽出の過程では、データから特徴を抽出する処理が含まれます。特徴が得られれば、その特徴からいくつかの概念に分類することができます。これが、パターン認識です。
　パターン認識には一般に統計的処理が含まれ、その理解には数学的に幅広い知識が要求されます。一つ一つ積み上げないと、なかなか自分のものにすることが難しい面があります。そこで、統計的にデータのバラツキを分析する方法から、パターン認識の基本的考え方やその応用まで、必要となる数理的扱いを説明しながら進めていきます。

機械学習への細道

2012年9月26日水曜日

パターン認識とは

2012年9月20日木曜日

はじめに