RAGとは丨プロダクトマネージャー用語集
最終更新日:
2025年5月8日
ライター:
PM Career編集部
プロダクト開発

この記事の監修者
佐々木真
PM Career事業責任者(Xアカウント @shin_sasaki19)
株式会社リクルートにて「スタディサプリ」の初期メンバーとして事業開発・プロダクトマネージャー業を担当し全国展開を達成後、SmartHRのグループ会社としてToB向けSaaS「SmartMeeting」を立ち上げ2021年3月に退任。その後PMオンラインスクール「PM School」、プロダクト開発人材の転職サイト「PM Career」の事業を運営中。プロダクト開発の知見・人材の流動性を高め、日本のプロダクト作りをぶち上げるべく尽力中。個人としてもX(Twitter)アカウントのフォロワーは3万人超え、YouTubeやPodcastでもプロダクト開発のコンテンツを発信する日本で最も有名なプロダクト開発者の1人。
今すぐ転職をしたい人も、中長期的にしたい方も、PM Careerに無料会員登録をしておくことでキャリアに役立つ情報を定期的にキャッチアップすることが重要です。まだ登録されてない方はこちらからどうぞ。3分で完了します。
プロダクトマネージャー転職についての情報はこちらをご覧ください!
① RAGの定義
RAG(リトリーバル・オーグメンテッド・ジェネレーション) は、外部の信頼できるドキュメントを検索(Retrieval)し、その結果を大型言語モデル(LLM)のプロンプトに注入して生成(Generation)を行うアーキテクチャ です。2020 年の Meta AI 論文で提唱され 【Patrick Lewis ら】以降、ハルシネーション抑制と最新情報活用を両立できる手法として標準化が進んでいます。
② RAGの重要性/目的
効果 | 説明 | 代表データ/事例 |
---|---|---|
事実性の向上 | モデルが訓練データに含まない知識をリアルタイムで参照し、誤情報(ハルシネーション)を大幅削減 | OpenAI RAG ヘルプ:誤答率 −45 %(OpenAI Help Center) |
社内データの安全活用 | ベクトル検索はオンプレ運用でき、API へ機密が漏れない | 金融・医療で採用率 60 %超(Interconnections - The Equinix Blog) |
推論コスト削減 | LLM を再学習せず検索結果だけ追加 → ファインチューニング比で GPU コスト −50〜80 % | NVIDIA ブログ試算(NVIDIA Blog) |
説明責任の担保 | 生成テキストに出典 URL を自動添付し、根拠を検証可能 | Cohere RAG で全回答に引用付与(Time) |
WSJ によれば、チャットボットを超えた“裏方RAG”が 2025 年の企業 AI 投資先として急伸しています。(ウォール・ストリート・ジャーナル)
③ RAGの典型パイプラインと実装ポイント
フェーズ | 主なコンポーネント | 技術スタック例 | ベストプラクティス |
---|---|---|---|
1. インジェスト | 文書→テキスト→分割 | Apache Tika, pdfminer | セクション見出し単位で chunk = 300〜500 tokens |
2. エンコーディング | Embeddings 生成 | OpenAI | 多言語なら multilingualモデル |
3. ベクトルDB | 高速類似検索 | Pinecone, Weaviate, Qdrant | metadata フィルタで RAG 精度↑ |
4. Retriever | Top-k / Hybrid 検索 | BM25+Dense・HNSW |
|
5. Prompt Builder | System/Context/Question | LangChain, LlamaIndex | 出典URLを |
6. LLM | 回答生成 | GPT-4o, Claude 3, Gemini 1.5 | Token 制限内に収める圧縮アルゴ |
7. Post-process | 引用整形・フィルタ | Pydantic, Guardrails | 禁則語チェック+HTML サニタイズ |
評価指標:ハルシネーション率、BERTScore、一次解決率、P95レイテンシ ─ いずれも AI評価指標 ページ参照。
④ 実務例:SaaS ナレッジ Q&A ボット
ステップ | 実装内容 | 効果 |
---|---|---|
① 社内 Confluence 7,200 記事を VectorDB 化 | 2 日 | セットアップ完了 |
② RAG API → Zendesk Hook | LoRA 微調整なし | LLM 推論コスト −57 % |
③ A/B テスト | RAG 版 vs 従来 FAQ 検索 | 一次解決率 +19 pt/NPS +11 |
⑤ 関連用語
⑥ 外部参考リソース
出典 |
---|
NVIDIA Blog “What Is Retrieval-Augmented Generation?”(NVIDIA Blog) |
OpenAI Help “RAG & Semantic Search for GPTs”(OpenAI Help Center) |
Eden AI “2025 Guide to RAG”(エデンAI) |
Equinix Blog “Where Should You Do RAG?”(2025/4/30)(Interconnections - The Equinix Blog) |
LangChain Docs “Build a RAG App”(Introduction | 🦜️🔗 LangChain) |