YOLO Vision 2025にご期待ください!
2025年9月25日
10:00 — 18:00(英国夏時間)
ハイブリッドイベント
Yolo Vision 2024
用語集

Retrieval Augmented Generation (RAG)

Retrieval Augmented Generation(RAG)が、リアルタイムで信頼性の高い外部データを統合して正確で最新の応答を実現することにより、AIモデルを強化する様子をご覧ください。

Retrieval-Augmented Generation(RAG)は、大規模言語モデル(LLM)によって生成されるレスポンスの品質、精度、および関連性を向上させるように設計された高度なAIフレームワークです。これは、生成モデルを外部の最新の知識ベースに接続することによって機能します。これにより、モデルは回答を生成する前に、関連情報を「検索」し、その出力を検証可能な事実に効果的に基づかせ、ハルシネーションまたは古いレスポンスの可能性を減らすことができます。RAGは、トレーニングされていない専門的または独自の情報へのアクセスを提供することにより、知識集約型のタスクにおいてLLMをより信頼性の高いものにします。

Retrieval-Augmented Generation(検索拡張生成)はどのように機能するか

RAG(Retrieval-Augmented Generation)プロセスは、主に検索と生成の2つの段階に分けられます。この二段階のアプローチは、情報検索システムと生成モデルの強みを組み合わせたものです。

  1. Retrieval: ユーザーがプロンプトを提供したり、質問をしたりすると、RAGシステムはまずプロンプトを使用して、関連情報について知識ソースを検索します。このソースは通常、ドキュメント、記事、またはその他のデータの埋め込みを含むベクトルデータベースです。リトリーバーコンポーネントは、ユーザーのクエリに基づいて、最も関連性の高いテキストまたはデータのスニペットを識別してプルします。オプションですが強力なステップは、Rerankerを使用して、これらの取得された結果を絞り込み、コンテキスト上最も重要な情報のみが渡されるようにすることです。
  2. 拡張生成: 取得された情報は、元のユーザープロンプトと組み合わされます。この新しい、強化されたプロンプトは、生成AIモデル(LLM)に入力されます。モデルは、この追加されたコンテキストを使用して、包括的で正確、かつ関連性の高い応答を生成します。LangChainLlamaIndexのようなフレームワークは、これらの複雑なRAGパイプラインを構築および管理するために一般的に使用されます。

アプリケーションと例

RAGは、事実の正確さと、動的または特殊なデータへのアクセスを必要とするシナリオで特に役立ちます。

  • 高度な質問応答システム: 顧客サポートチャットボットは、RAGを使用して、製品マニュアル、トラブルシューティングガイド、ポリシー文書など、企業のナレッジベース全体にアクセスできます。顧客が「製品の保証ポリシーは何ですか?」と質問すると、システムは最新の保証書を取得し、それを使用して正確で最新の回答を提供します。これは、一般的な応答からの大幅な改善です。
  • コンテンツの作成と調査: 金融アナリストは、RAGを活用したツールを使用して、市場の概要を作成できます。このツールは、BloombergReutersのような信頼できるソースから、最新の財務報告書、市場ニュース、株価データを取得できます。次に、LLMはこの情報を引用とともに一貫したレポートに統合し、調査プロセスを大幅にスピードアップします。

RAGと関連概念

RAGをLLMのパフォーマンスを向上させるために使用される他の方法と区別すると役立ちます。

  • ファインチューニング: ファインチューニングは、より小さく、特殊化されたデータセットでトレーニングを継続することにより、事前トレーニングされたモデルを適応させ、モデルの内部重みを変更します。RAGとは異なり、推論中に外部データを参照しません。ファインチューニングは、モデルに新しいスタイルやスキルを教えるのに理想的ですが、RAGは事実の知識を組み込むのに適しています。これらのアプローチは、相補的にもなり得ます。
  • Prompt Engineering(プロンプトエンジニアリング): これは、LLMから目的の出力を得るために、プロンプトを注意深く設計する手動のプロセスです。RAGは、人間が手動ですべてのコンテキストを提供するのではなく、検索されたデータでプロンプトをプログラムで追加(「拡張」)することにより、この一部を自動化します。
  • Prompt Enrichment(プロンプトエンリッチメント): RAGと同様に、プロンプトエンリッチメントはより広範な用語です。これには、ユーザーの履歴または会話の流れからコンテキストを追加することが含まれる場合があります。RAGは、モデルの応答の根拠となる外部知識ベースから事実情報を取得することに焦点を当てた、特定のタイプのエンリッチメントです。

コンピュータビジョンにおけるRAG

RAGは主に自然言語処理(NLP)で使用されていますが、そのコアコンセプトはコンピュータビジョン(CV)タスクで検討されています。たとえば、システムは関連する視覚情報を取得して、画像の生成または分析をガイドできます。これには、Ultralytics YOLOのような物体検出モデルのパフォーマンスを向上させるために、大規模なデータセットから類似の画像を見つけることが含まれる場合があります。これらの複雑なモデルとデータセットの管理は、Ultralytics HUBのようなプラットフォームで効率化され、RAGを使用する将来のマルチモーダルモデルアプリケーションの基盤として機能する可能性があります。関連する実装については、AIをRAGとコンピュータビジョンで強化するブログをご覧ください。

Ultralyticsコミュニティに参加しませんか?

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加
クリップボードにコピーしました