このページは、Transformer への移行とハイブリッド を、初学者向けに短く整理するノートです。時系列の背景は リカレントと系列モデル史 を参照してください。
2017 年以降、大規模言語モデルでは Transformer と 自己注意 が主流になり、RNN は必須ではなく 選択肢の一つ へと位置づけが変わりました。一方で、ストリーミング音声、低レイテンシ推論、Conformer(畳み込み+注意)や状態空間モデル(SSM)との組み合わせなど、系列の順序を扱う設計は研究・実務で続いています。
ざっくりいうと
- Transformer への移行:並列学習と長距離依存の扱いで、多くの NLP タスクの主役が入れ替わった。
- RNN の残る役割:ストリーミング、小規模デバイス、状態を逐次更新する推論など。
- ハイブリッド:CNN+RNN+注意、Conformer など、タスクに応じた折衷案。
- SSM(状態空間モデル):近年、長系列を効率的に扱う系として RNN 的設計が再注目される場面がある。
Transformer への移行とハイブリッドで何をしているか
たとえばリアルタイム音声では、全フレームを一度に注意するより、因果的な RNN やストリーミング Transformer で遅延を抑える設計が選ばれることがあります。文書全体の理解では、大規模 Transformer が標準ですが、音声パイプラインの一部に RNN 層が残る、という ハイブリッド も現実的です。
- タスクの制約(レイテンシ、メモリ、長さ)を整理する。
- 大規模テキストなら Transformer 系を第一候補に検討する。
- ストリーミングやエッジでは RNN / SSM / 軽量畳み込みを比較する。
- 必要なら Conformer など 畳み込み+注意 の既存アーキテクチャを参照する。
- 評価はタスク指標と運用コストの両方で行う。
強みと限界(短く)
強み
- RNN 時代に培った 系列の語彙と実装ノウハウ が、ハイブリッド設計や教育に役立つ。
- 特定制約下では、Transformer より シンプルで速い 選択肢になり得る。
限界
- 汎用 NLP の主戦場では、大規模 Transformer が デフォルト になりつつある。
- ハイブリッドは設計と検証の負荷が増え、チームの習熟が必要。