RAGとは？

RAGとは、Retrieval-Augmented Generationの略です。日本語では「検索拡張生成」と呼ばれることがあります。AIが回答を作る前に、社内文書やナレッジベース、データベースなどを検索し、その結果を参考にしながら回答を生成する仕組みです。

生成AIは便利ですが、モデルが学習していない社内情報や、最新の情報、企業独自のルールについては、そのままでは正しく答えられません。RAGは、この弱点を補うために使われます。

RAGの基本的な流れは？

たとえば「この製品の保証条件を教えて」と質問されたとき、AIが社内マニュアルや契約書テンプレートを検索し、該当箇所をもとに回答します。

RAGは、AIに社内文書を丸ごと覚えさせる方法ではありません。必要なときに必要な情報を探し、その情報を使って回答する方法です。そのため、文書が更新されても検索対象を更新すれば反映しやすく、モデルを再学習するより現実的です。

RAGは魔法の仕組みではありません。検索される文書の品質が低い、ファイル名や構造が整理されていない、古い資料と新しい資料が混在している場合、AIの回答も不安定になります。

また、検索結果をAIに渡すときには、権限管理が重要です。見てはいけない資料を検索対象に含めないこと、部署や役職に応じて参照範囲を変えること、回答に根拠を残すことが必要です。

RAGは、AIエージェントの「知識を取りに行く力」を支える技術です。一方、MCPはAIと外部データ・ツールをつなぐ接続の仕組みです。実務では、RAGで社内知識を検索し、MCPで業務システムと接続し、AIエージェントが複数ステップの業務を進める、という組み合わせが増えていきます。