Embeddingとは丨生成AI 用語集
最終更新日:
2025年7月9日
ライター:
PM Career編集部
プロダクト開発

この記事の監修者
佐々木真
PM Career事業責任者(Xアカウント @shin_sasaki19)
株式会社リクルートにて「スタディサプリ」の初期メンバーとして事業開発・プロダクトマネージャー業を担当し全国展開を達成後、SmartHRのグループ会社としてToB向けSaaS「SmartMeeting」を立ち上げ2021年3月に退任。その後PMオンラインスクール「PM School」、プロダクト開発人材の転職サイト「PM Career」の事業を運営中。プロダクト開発の知見・人材の流動性を高め、日本のプロダクト作りをぶち上げるべく尽力中。個人としてもX(Twitter)アカウントのフォロワーは3万人超え、YouTubeやPodcastでもプロダクト開発のコンテンツを発信する日本で最も有名なプロダクト開発者の1人。
今すぐ転職をしたい人も、中長期的にしたい方も、PM Careerに無料会員登録をしておくことでキャリアに役立つ情報を定期的にキャッチアップすることが重要です。まだ登録されてない方はこちらからどうぞ。3分で完了します。
PM Careerに無料会員登録する
転職についての情報はこちらをご覧ください!
Embeddingとは?
Embedding(エンベディング)とは、単語や文章などの言語データを、コンピュータが処理しやすい数値ベクトル(多次元の数値の並び)に変換する技術を指します。生成AIや自然言語処理(NLP)において、言葉の意味や文脈を数値で表現するための基本的な仕組みとして使われています。
Embeddingの役割と目的
自然言語は、機械にとっては非常に曖昧で複雑な情報です。そのため、AIが文章を理解し、意味的な類似性や関係性を捉えるには、言葉を数学的な形式に変換する必要があります。Embeddingはこの変換を担う重要なステップで、以下のような役割を果たします。
- 意味的な近さの表現:似た意味の単語(例:「犬」と「猫」)は、Embedding空間上でも近い位置に配置される
- 文脈の保持:文脈に応じた意味の変化もEmbeddingによって扱えるようになる
- 構造化データとの橋渡し:非構造なテキストデータを、機械学習モデルに適した形式に変換する
Embeddingの種類と例
代表的なEmbeddingの手法としては、以下があります。
名称 | 特徴 |
---|---|
Word2Vec | 単語ベースのベクトル表現を学習 |
GloVe | 全体の共起統計をもとにしたベクトル化 |
BERT Embedding | 文脈を考慮した単語ベクトル |
Sentence Embedding | 文章全体を1つのベクトルで表現 |
特に近年では、LLM(大規模言語モデル)において、文全体の意味を1つのベクトルに圧縮するSentence Embeddingが注目されています。
Embeddingの活用例
Embeddingはさまざまな用途で活用されています。
- 文書検索:検索クエリと文書をEmbeddingし、類似度でマッチング
- チャットボット:ユーザー発話とFAQをEmbeddingし、最も近い回答を返す
- 推薦システム:ユーザーとアイテムをEmbeddingし、嗜好の近い組み合わせを提案
- RAG(Retrieval-Augmented Generation):外部知識ベースから関連情報をEmbeddingにより取得し、生成に活用
Embeddingと生成AIの関係
生成AIでは、Embeddingが入力と出力の橋渡しをします。ユーザーの質問をEmbeddingし、それに最も近い知識や文脈を探して回答を生成する、というプロセスにEmbeddingが欠かせません。
とくにRAGやベクトルデータベースといった仕組みでは、Embeddingを中心に情報検索と生成が結びついており、精度や応答品質に大きく関与しています。