従来のRAGの計算オーバーヘッドが大きく、推論能力に限界があるという問題をどう解決するか？

2025-09-10

1.7 K

直接リンクモバイルビュー

背景

従来の検索強化型生成（RAG）手法では、外部文書をリアルタイムで検索する必要があり、計算コストがかかるだけでなく、文脈長の制限によりモデルの推論能力にも影響する。

PRAGは次のような革新的なデザインでこの問題を解決している：

パラメトリック知識埋め込みリアルタイム検索の代替として、外部知識をLoRAパラメータモジュールに直接エンコードする。
3段階構造::
1. データ強化モジュールがドキュメントを構造化されたトレーニングデータに変換
2. パラメータ学習モジュールは、文書のベクトル化表現を生成する。
3. 推論中の複数の文書パラメータの動的融合

実証実験によれば、NQやTriviaQAなどのベンチマークデータセットにおいて、この手法は推論待ち時間を40%短縮し、精度を15-20%向上させた。