RAGとは丨プロダクトマネージャー用語集

最終更新日:

2025年5月8日

ライター:

PM Career編集部

プロダクト開発

この記事の監修者

佐々木真
PM Career事業責任者（Xアカウント ＠shin_sasaki19）
株式会社リクルートにて「スタディサプリ」の初期メンバーとして事業開発・プロダクトマネージャー業を担当し全国展開を達成後、SmartHRのグループ会社としてToB向けSaaS「SmartMeeting」を立ち上げ2021年3月に退任。その後PMオンラインスクール「PM School」、プロダクト開発人材の転職サイト「PM Career」の事業を運営中。プロダクト開発の知見・人材の流動性を高め、日本のプロダクト作りをぶち上げるべく尽力中。個人としてもX（Twitter）アカウントのフォロワーは3万人超え、YouTubeやPodcastでもプロダクト開発のコンテンツを発信する日本で最も有名なプロダクト開発者の1人。

今すぐ転職をしたい人も、中長期的にしたい方も、PM Careerに無料会員登録をしておくことでキャリアに役立つ情報を定期的にキャッチアップすることが重要です。まだ登録されてない方はこちらからどうぞ。3分で完了します。

PM Careerに無料会員登録する

プロダクトマネージャー転職についての情報はこちらをご覧ください！

① RAGの定義

RAG（リトリーバル・オーグメンテッド・ジェネレーション） は、外部の信頼できるドキュメントを検索（Retrieval）し、その結果を大型言語モデル（LLM）のプロンプトに注入して生成（Generation）を行うアーキテクチャです。2020 年の Meta AI 論文で提唱され【Patrick Lewis ら】以降、ハルシネーション抑制と最新情報活用を両立できる手法として標準化が進んでいます。

② RAGの重要性／目的

効果	説明	代表データ／事例
事実性の向上	モデルが訓練データに含まない知識をリアルタイムで参照し、誤情報（ハルシネーション）を大幅削減	OpenAI RAG ヘルプ：誤答率 −45 %(OpenAI Help Center)
社内データの安全活用	ベクトル検索はオンプレ運用でき、API へ機密が漏れない	金融・医療で採用率 60 %超(Interconnections - The Equinix Blog)
推論コスト削減	LLM を再学習せず検索結果だけ追加 → ファインチューニング比で GPU コスト −50〜80 %	NVIDIA ブログ試算(NVIDIA Blog)
説明責任の担保	生成テキストに出典 URL を自動添付し、根拠を検証可能	Cohere RAG で全回答に引用付与(Time)

WSJ によれば、チャットボットを超えた“裏方RAG”が 2025 年の企業 AI 投資先として急伸しています。(ウォール・ストリート・ジャーナル)

③ RAGの典型パイプラインと実装ポイント

フェーズ	主なコンポーネント	技術スタック例	ベストプラクティス
1. インジェスト	文書→テキスト→分割	Apache Tika, pdfminer	セクション見出し単位で chunk ＝ 300〜500 tokens
2. エンコーディング	Embeddings 生成	OpenAI `text-embedding-3-small`, BGE, MiniLM	多言語なら multilingualモデル
3. ベクトルDB	高速類似検索	Pinecone, Weaviate, Qdrant	metadata フィルタで RAG 精度↑
4. Retriever	Top-k / Hybrid 検索	BM25＋Dense・HNSW	`k=3‒5` が過学習・冗長のバランス
5. Prompt Builder	System/Context/Question	LangChain, LlamaIndex	出典URLを`<reference/>`タグで埋め込む
6. LLM	回答生成	GPT-4o, Claude 3, Gemini 1.5	Token 制限内に収める圧縮アルゴ
7. Post-process	引用整形・フィルタ	Pydantic, Guardrails	禁則語チェック＋HTML サニタイズ

評価指標：ハルシネーション率、BERTScore、一次解決率、P95レイテンシ ─ いずれも AI評価指標 ページ参照。

④ 実務例：SaaS ナレッジ Q&A ボット

ステップ	実装内容	効果
① 社内 Confluence 7,200 記事を VectorDB 化	2 日	セットアップ完了
② RAG API → Zendesk Hook	LoRA 微調整なし	LLM 推論コスト −57 %
③ A/B テスト	RAG 版 vs 従来 FAQ 検索	一次解決率 +19 pt／NPS +11

⑤ 関連用語

プロダクトマネージャー用語集

LLM（Large Language Model）

ファインチューニング（Fine-tuning）

RAG（Retrieval-Augmented Generation）

生成AI / Generative AI

AIロードマップ / AI Roadmap

AI倫理 / AI Ethics

AI評価指標 / AI Evaluation Metrics

MLOps（Machine Learning Operations）

⑥ 外部参考リソース

出典
NVIDIA Blog “What Is Retrieval-Augmented Generation?”(NVIDIA Blog)
OpenAI Help “RAG & Semantic Search for GPTs”(OpenAI Help Center)
Eden AI “2025 Guide to RAG”(エデンAI)
Equinix Blog “Where Should You Do RAG?”（2025/4/30）(Interconnections - The Equinix Blog)
LangChain Docs “Build a RAG App”(Introduction \| 🦜️🔗 LangChain)