このページは 決定木 と アンサンブル の歴史的背景だけを、できるだけやさしい言葉でまとめたノートです。古典機械学習モデル全体の史 や AI モデル史(全体) より範囲を狭くし、木による分割、アンサンブル化、表形式データでの定着に焦点を当てています(厳密な年表ではありません)。
ルールの木から「データが決める木」へ
手書きの if-then に近い見た目をしつつ、分岐条件を 過去データから学習する、という流れが決定木の核です。教科書や実装で名前が出やすい系統として、ID3、C4.5/C5.0、CART(Classification And Regression Trees) などがあります。ここでは細目より、「不純度を減らすように分割を選ぶ」系の木が、解釈可能性と非線形表現の両方を狙える枠として整備されていった、という理解で足ります。
1990 年代:不安定な単木と、ブースティングの登場
単体の木は、データの取り方や乱数で形が変わりやすく、不安定になりがちです。その弱点を逆手に取る発想の一つが、弱学習器を順番に重ねる ブースティング です。AdaBoost のような枠組みは 1990 年代に広く知られ、誤分類に重みを付け直しながら学習が進むイメージが定着しました。
1990 年代後半〜2000 年代:バギングとランダムフォレスト
Leo Breiman の Bagging(Bootstrap Aggregating) は、データを繰り返しサンプリングして複数学習器を作り、予測を平均する(分類なら多数決)という並列型のアンサンブルでした。決定木と組み合わせると、単木のばらつきを相殺しやすい、という実務的な発見が積み重なります。
さらに Breiman の Random Forest は、バギングに加えて 分割ごとに特徴を一部だけ候補にする といった仕掛けで、木同士の相関を下げ、集約の効きを高めました。表形式データの 強い既定候補 として、研究・業務の両方で長く使われ続けています。
2000 年代以降:勾配ブースティングと実装の成熟
ブースティングは 勾配ブースティング(Gradient Boosting) のように、残差や損失の勾配に沿って木を足していく説明が主流になりました。長らくは学習の逐次性や調整の難しさが実務の論点でしたが、XGBoost、LightGBM、CatBoost などのライブラリが普及し、大規模データや欠損・カテゴリ変数の扱いも含めて 表データコンペや業務の実戦兵器 として位置づけられました。
深層学習以降の位置づけ
画像などの生データでは深層学習が主流になりましたが、行列表現に落ちた業務データでは、木とアンサンブルはいまでも頻繁に選ばれます。学習・推論コスト、前処理との相性、特徴量重要度などの 説明用の出力、という実務上の理由が重なります。