人間には卓越した学習能力が備わっている.人間は目で見たり,耳で聞いたものが何であるかをいとも簡単に認識できる.また,未知の環境に適応する能力も優れている.それに対し,コンピュータは,与えられた指示(プログラム)どおりに高速に計算を行う能力においては優れているが,学習能力という点においては,人間とは比較にならない.
そこで,人間のような学習能力をもった機械(モデル)を作るための学習理論が発達してきた.その代表的な成果の1つとして,多層パーセプトロンが挙げられる.多層パーセプトロンは1980年代に開発され,これまで多方面に応用されてきた.しかし,望ましくない局所最適解への収束,中間層の素子数の選択など,いくつかの問題点がある.
サポートベクターマシン(Support Vector Machine:SVM) は,このような問題を解決した学習機械として知られている.サポートベクターマシンとは,1995年に,AT&TのV.Vapnikによって統計的学習理論の枠組みで提案された学習機械のことである.SVMは,特にパターン認識の能力において,最も優秀な学習モデルの1つであることが知られている.そこで,本研究室ではサポートベクターマシンに注目し,これを用いた分類問題の解法に関する研究を行っている.
ここで,SVMについて説明するために,分類問題の中で最も簡単な,2種類のデータの分類を考える.すなわち,図1のように,□のデータと○のデータを分類する.ここでは,分類のようすをグラフィカルに表現するために,これらのデータは,
と表されるような2次元のデータとする.
![]() 図1:2次元データの分類 |
![]() 図2:マージン最大化 |
SVMの基本的な構造は,図2に示すような線形しきい素子である.しかし,これでは線形分離不可能なデータに適用することができず,SVMの応用範囲は非常に限られたものになってしまう.そこで,SVMによって非線形な分類を可能にする方法として,高次元化が挙げられる.これは,非線形写像Φによって,元の入力データを高次元特徴空間に写像し,特徴空間において線形分離を行うという方法である.そうすることによって,結果的に元の入力空間においては非線形な分類を行っていることになる(図3).
![]() 図3:非線形写像による高次元化 |
![]() 図4:SVMによる2次元データの分類の例 |