リカレント接続の登場とは

このページは、リカレント接続の登場 を、初学者向けに短く整理するノートです。時系列の背景は単純リカレントと誤差逆伝播史、系列・ステップの説明は単純リカレントと誤差逆伝播とはの「系列とは」「まず『時間』とは」を参照してください。

1980〜1985 年代、単純 RNN の発想として、各ステップの 隠れ状態 が直前の状態に依存する接続が、系列データ向けに検討され始めました。表の1行1行が入れ替え可能なデータとは違い、順番付きの並び を先頭から読みながら内部メモを更新する、という設計の出発点です。

ざっくりいうと

単純リカレント：出力や隠れ状態を、次のステップの計算に戻す ループ 接続。
隠れ状態：これまで読んだ分を圧縮した 内部メモ（(h_t)）。
系列：順番の付いたデータの並び（文、音声フレーム列など）。
課題の萌芽：ステップが増えると、遠い過去への学習信号が弱くなる（のちの勾配消失）。

リカレント接続の登場で何をしているか

たとえば短い音の列を左から処理するとき、3 番目のフレームでは「1〜2 番目まで聞いたあと」という情報を (h_2) に持たせ、4 番目では (h_3) を使う、という流れです。当時は大規模データや GPU 学習の前で、小さな系列 で概念実証される段階でした。

系列をステップ 1, 2, 3, … に分ける。
各ステップで (h_t = f(h_{t-1}, x_t)) のようにメモを更新する。
必要なステップで分類・予測の出力を出す。
誤差から重みを更新する（のちに BPTT として体系化）。
長い系列では学習が不安定になりやすい、という経験が蓄積される。

強みと限界（短く）

強み

順番が効くデータ を、固定長ベクトル化だけに頼らず扱う道を開いた。
後の Elman・Jordan・LSTM への 共通の語彙（隠れ状態、ステップ）を用意した。

限界

学習手続きはまだ発展途上で、長系列 では実用が限定的だった。
並列化や大規模化の土台（データ・計算）は、この後に整う。

関連