このページは、古典機械学習モデルを 手書きルールから統計的推定への移行 という大きな流れの中で学ぶための案内です。深層学習との対立ではなく、いまも実務で選ばれる理由(データが少ない・軽い・説明しやすい)を意識して読むと位置づけが見えやすくなります。
この領域で扱うテーマ
- 線形回帰・ロジスティック回帰のような、解釈しやすい基準線となるモデル
- 支持ベクトルマシン(SVM)に代表される、マージン最大化と統計学習理論
- 決定木とアンサンブル(バギング・ランダムフォレスト・ブースティング)の頑健化
- 業務知識を入力に反映する特徴量設計と前処理
- 学習データに過剰適合しない評価設計(交差検証・正則化・指標選定)
読み進め方の目安
- まず 歴史 で「人手ルール → 統計的推定 → 各モデル群の発展」という流れを掴む
- 次に基準線として 線形回帰とロジスティック回帰 を読む
- 続けて強い分類器の代表として SVM、頑健な選択肢として 決定木とアンサンブル を比較する
- モデル選択と並行して効く 特徴量設計 を確認する
- 最後に 評価と汎化 で、性能を本番で再現させるための前提条件を押さえる
読むときの視点
- ルールからパラメータへ:判断の本体が、
if-thenの規則列から、データで推定されるパラメータへ移った点を意識する - 特徴量と次元:データ行列は
N×dのまま、d(特徴数)が増えると「高次元」と呼ばれる。配列のネスト段数とは別概念 - モデル単体ではなく系として:特徴量設計と評価設計が決まらないと、どのモデルが良いかは判定できない
- 深層学習との使い分け:データ量、説明可能性、運用コストで選ぶ場面はいまも多い