リカレント接続の登場とは

このページは、リカレント接続の登場 を、初学者向けに短く整理するノートです。時系列の背景は 単純リカレントと誤差逆伝播史、系列・ステップの説明は 単純リカレントと誤差逆伝播とは の「系列とは」「まず『時間』とは」を参照してください。

1980〜1985 年代、単純 RNN の発想として、各ステップの 隠れ状態 が直前の状態に依存する接続が、系列データ向けに検討され始めました。表の1行1行が入れ替え可能なデータとは違い、順番付きの並び を先頭から読みながら内部メモを更新する、という設計の出発点です。

ざっくりいうと

  • 単純リカレント:出力や隠れ状態を、次のステップの計算に戻す ループ 接続。
  • 隠れ状態:これまで読んだ分を圧縮した 内部メモ((h_t))。
  • 系列:順番の付いたデータの並び(文、音声フレーム列など)。
  • 課題の萌芽:ステップが増えると、遠い過去への学習信号が弱くなる(のちの勾配消失)。

リカレント接続の登場で何をしているか

たとえば短い音の列を左から処理するとき、3 番目のフレームでは「1〜2 番目まで聞いたあと」という情報を (h_2) に持たせ、4 番目では (h_3) を使う、という流れです。当時は大規模データや GPU 学習の前で、小さな系列 で概念実証される段階でした。

  1. 系列をステップ 1, 2, 3, … に分ける。
  2. 各ステップで (h_t = f(h_{t-1}, x_t)) のようにメモを更新する。
  3. 必要なステップで分類・予測の出力を出す。
  4. 誤差から重みを更新する(のちに BPTT として体系化)。
  5. 長い系列では学習が不安定になりやすい、という経験が蓄積される。

強みと限界(短く)

強み

  • 順番が効くデータ を、固定長ベクトル化だけに頼らず扱う道を開いた。
  • 後の Elman・Jordan・LSTM への 共通の語彙(隠れ状態、ステップ)を用意した。

限界

  • 学習手続きはまだ発展途上で、長系列 では実用が限定的だった。
  • 並列化や大規模化の土台(データ・計算)は、この後に整う。

関連