このページは SVM(支持ベクトルマシン) の歴史的背景だけを、できるだけやさしい言葉でまとめたノートです。古典機械学習モデル全体の史 や AI モデル史(全体) より範囲を狭くし、マージン最大化・カーネル・実務での隆盛に焦点を当てています(厳密な年表ではありません)。
統計的学習理論と「汎化」の言語
SVM の背後には、有限データでも汎化性能を論じる枠組みとしての統計的学習理論があります。Vladimir Vapnik らの仕事(VC 次元などの概念と結びつけて説明されることが多い)が、後の SVM ブームの理論的ストーリーを支えました。「複雑すぎる境界は避け、マージンの観点で単純さと当たりやすさのバランスを取る」という直感と親和性があります。
1990 年代:カーネルとソフトマージンが実用形を固める
線形の最大マージン分類の考え方はそれ以前からも知られていましたが、実務で威力を発揮する形にまとまったのは 1990 年代が中心です。
- カーネル法:入力を明示的に高次元へ写像しなくても、内積さえ計算できれば 非線形境界を学習できる、という発想が定着しました(カーネルトリックと呼ばれる説明が一般的)。
- ソフトマージン:現実のデータはノイズや重なりがあるため、完全分離を強制しない拡張が標準になりました。誤分類の許し方とマージンの広さのトレードオフが、実務上の調整ポイントになります。
これらは Corinna Cortes と Vladimir Vapnik のソフトマージン SVM(1995 年発表、という説明が教科書でよく見られる)などとともに、古典機械学習の「強い分類器」としての地位を固めました。
2000 年代前半:ライブラリと表形式データの主役
LIBSVM などの実装が広く使われ、研究・業務の両方で SVM + RBF カーネルの組み合わせがデフォルト候補の一つになりました。テキスト分類(高次元の疎ベクトル)やバイオインフォマティクスなど、特徴量が高次元な問題で特によく語られます。
深層学習以降の位置づけ
画像や音声のような生データでは、特徴量をネットワークが学習する流れが主流になり、人手特徴+ SVM の構成は相対的に減りました。一方で、説明可能性・データ規模・学習コストの観点から、表形式や限られた特徴の問題ではいまも選択肢に入ります。