Yolo 深圳
深セン
今すぐ参加
用語集

Retrieval Augmented Generation (RAG)

Retrieval Augmented Generation(RAG)が、リアルタイムで信頼性の高い外部データを統合して正確で最新の応答を実現することにより、AIモデルを強化する様子をご覧ください。

Retrieval Augmented Generation(RAG)は、大規模言語モデル(LLM)の出力を最適化するために設計された高度なフレームワークです。 大規模言語モデル(LLM)の出力を最適化するために設計された先進的なフレームワークである。 元の学習データ以外の権威ある知識ベースを参照することによって、大規模言語モデル(LLM)の出力を最適化するために設計された高度なフレームワークである。標準的な 標準的な生成AIシステムでは、モデルは学習中に学習した静的な情報のみに依存する。 標準的な生成AIシステムでは、モデルは訓練中に学習した静的な情報のみに依存するため、時代遅れの回答や、幻覚として知られる事実誤認につながる可能性がある。 幻覚RAGはこのギャップを次のように埋める。 信頼できる外部ソースから関連する最新の情報を取得し、それをコンテキストとしてモデルに与えることで、このギャップを埋める。 としてモデルに与える。このプロセスは、AIを効果的にグラウンディングさせ、高い精度と関連性を保証する。 高価なモデルの再トレーニングを必要とすることなく、高い精度と関連性を確保することができます。 モデルの再トレーニングを必要としません。

検索拡張世代の仕組み

RAGワークフローは、検索システムと生成モデルという2つの主要コンポーネントを統合している。この相乗効果により どのように 自然言語処理(NLP) タスクの実行方法を変革する。

  1. 検索:ユーザーがクエリーを送信すると、システムはまず、通常 知識ベースを検索する。 ベクトル・データベースに格納されている。このデータベースには 埋め込み-テキストやデータの数値表現-が含まれている。 このデータベースには、効率的なセマンティック検索を可能にする、テキストやデータの数値表現であるエンベッディングが含まれている。 リトリーバーは、ユーザーのリクエストに最も意味的に近い文書やデータスニペットを特定する。
  2. 補強:検索された情報は、プロンプトエンジニアリング技術を使って、元のユーザークエリと組み合わされる。 プロンプトエンジニアリング技術。この 「補強された」プロンプトは、最初に欠けていた必要な事実のコンテキストをモデルに提供する。
  3. 生成される:最後に、エンリッチされたプロンプトがLLMに渡される。モデルは提供された文脈 を利用して、首尾一貫した事実に基づいた回答を生成する。のような先進的なフレームワークは LangChainのような先進的なフレームワークは、これらのステップをシームレスにオーケストレーションするためによく使われる。

実際のアプリケーション

RAGは、データが頻繁に変更される業界や精度が重要な業界では不可欠である。

  • 企業知識管理:組織はRAGを使用して、従業員を支援する社内 チャットボットで従業員を支援します。例えば、人事 アシスタントは、会社のサーバーから最新のポリシー文書を取得し、福利厚生に関する質問に答えることができます。これにより AIが一般的なインターネットの知識ではなく、特定の会社のプロトコルを遵守することを保証します。
  • 臨床判断支援:医療分野における 医療分野におけるAIは RAG。システムは、最新の医学研究論文や特定の患者の病歴記録を検索し、医師の診断を支援することができる。 医師の診断を支援することができる。 予測モデリングが最新の科学に基づいていることを保証する。 予測モデリングが、モデルの締め切り日ではなく、最新の科学に基づいていることを保証する。

コンピュータビジョンにおけるRAG

従来はテキストベースであったが、RAGのコンセプトはコンピュータ・ビジョン(CV)へと拡大している。 コンピュータ・ビジョン(CV)に拡大している。マルチモーダルモデルでは マルチモーダルモデルでは、システムが類似画像や視覚的メタデータを検索して 類似画像や視覚的メタデータを取得し、物体検出や分類を支援する。 オブジェクトの検出や分類を支援する。例えば のようなモデルが実行する視覚分析を補強するために、科学データベースから参照画像を検索することで、希少な生物学的標本の識別を向上させることができる。 のようなモデルによって実行される視覚分析を補強することができる。 Ultralytics YOLO11.

RAG対微調整

RAGと微調整を区別することは重要である。 RAGとファインチューニングを区別することは重要である:

  • RAGは、モデルを動的な外部の事実に接続します。最新の情報と検証可能性を必要とするアプリケーションに最適である。 情報と検証可能性を必要とするアプリケーションに最適である。モデルの内部パラメータを変更することはありません。
  • ファインチューニングでは、特定のデータセットでモデルをさらに訓練し モデルの重みを調整するため モデルの重みを調整する。これは、モデルに特定のスタイル これは、特定のスタイル、トーン、または特殊なタスクの動作をモデルに教えるには理想的ですが、急速に変化する事実の知識ベースを維持するにはあまり効果的ではありません。 急速に変化する事実の知識ベースを維持するには、あまり効果的ではありません。多くの場合、開発者は 最適なパフォーマンスを得るために 最適なパフォーマンスを得るために。

例検出データによるプロンプトの補足

このPython 例では、基本的なRAGワークフローをシミュレートする。 を "取得 "する。これらのファクトは、テキストプロンプトを補強し、検証されたビジュアルデータに説明を基づかせます。

from ultralytics import YOLO

# Load the YOLO11 model acting as our 'retrieval' mechanism for visual facts
model = YOLO("yolo11n.pt")

# Run inference to retrieve content information from the image
results = model("https://ultralytics.com/images/bus.jpg")

# Extract detected classes to augment the prompt
detected_objects = [model.names[int(cls)] for cls in results[0].boxes.cls]
context_string = ", ".join(set(detected_objects))

# Construct the augmented prompt (RAG concept)
prompt = f"Based on the verified presence of {context_string} in the scene, describe the traffic situation."
print(f"Augmented Prompt: {prompt}")

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加