サポートベクターマシン

サポートベクターマシン

名前だけ見るとちょっとカッコイイ。

Support Vector Machineの頭文字をとって SVM とも呼ばれる。
画像中のパターン認識の分野でよく使われる。

簡単に言ってしまうと次のようなもの。

・データ群を2つのグループに分類するために使用される手法。
・2つのグループの境界(2次元なら境界線、3次元なら境界面)を決定して、個々のデータがどちらのグループに属するかを決定する。
・正解のわかっているデータを参考にして、境界を決める(学習する)。

詳しくは、リンク先のPDFでの説明がわかりやすくて参考になる。
・サポートベクターマシン入門(産業技術総合研究所 栗田多喜夫)


どのようにグループ分けをするか(=どのように境界線を決定するか)、を示すイメージは次の通り


(出展:上記PDF)

○と□で示されるようなデータが平面上に散らばっているときに、その2つのグループをうまく分離する境界線を決定することが目的になる。

黒塗りされた記号をサポートベクターと呼び(個々のデータは複数の変数を持つベクタと考えられる)、このサポートベクターからできるだけ離れた場所に境界線が設定される。

この境界線の位置は、正しい分類があらかじめわかっているデータ(訓練データ)を使って決定する。

これは、2つのグループを正しく分類し、かつ、サポートベクターからできるだけ離れた場所にある、という制約付き最適化問題の解として求めることができる。

サポートベクターマシン入門

サポートベクターマシン入門

わかりやすいパターン認識

わかりやすいパターン認識