Yolo 비전 선전
선전
지금 참여하기
용어집

검색 증강 생성(RAG)

검색 증강 생성(RAG)이 정확하고 최신 응답을 위해 실시간의 신뢰할 수 있는 외부 데이터를 통합하여 AI 모델을 어떻게 향상시키는지 알아보세요.

검색 증강 생성(RAG)은 다음의 출력을 최적화하도록 설계된 고급 프레임워크입니다. 대규모 언어 모델(LLM)의 출력을 최적화하도록 설계된 고급 프레임워크입니다. 원래 학습 데이터 외부의 권위 있는 지식 베이스를 참조하여 LLM의 출력을 최적화하도록 설계된 고급 프레임워크입니다. 표준 생성형 AI 시스템에서는 모델이 학습 중에 학습한 학습하는 동안 학습한 정적 정보에만 의존하기 때문에 오래된 답변이나 사실 오류가 발생할 수 있습니다. 환각. RAG는 다음과 같은 방법으로 이러한 격차를 해소합니다. 신뢰할 수 있는 외부 소스에서 관련성 있는 최신 정보를 검색하여 모델에 컨텍스트로 제공합니다. 컨텍스트로 모델에 제공함으로써 이러한 격차를 해소합니다. 이 프로세스는 AI에 효과적으로 근거를 제공하여 별도의 작업 없이도 높은 높은 정확도와 관련성을 보장합니다. 모델 재교육 없이도 높은 정확도와 관련성을 보장합니다.

검색 증강 생성의 작동 방식

RAG 워크플로에는 검색 시스템과 생성 모델이라는 두 가지 주요 구성 요소가 통합되어 있습니다. 이러한 시너지 효과는 어떻게 자연어 처리(NLP) 작업이 실행되는 방식을 변화시킵니다.

  1. 검색: 사용자가 쿼리를 제출하면 시스템은 먼저 전문 지식 베이스를 검색합니다. 일반적으로 벡터 데이터베이스에 저장된 벡터 데이터베이스에 저장되어 있습니다. 이 데이터베이스에는 다음이 포함됩니다. 임베딩(텍스트나 데이터)를 포함하고 있어 효율적인 의미론적 검색이 가능합니다. 검색기는 사용자의 요청과 의미적으로 가장 유사한 문서 또는 데이터 스니펫을 식별합니다.
  2. 증강: 검색된 정보는 프롬프트 엔지니어링 기법을 사용하여 원래 사용자 쿼리와 결합됩니다. 프롬프트 엔지니어링 기법을 사용합니다. 이 "증강된" 프롬프트는 모델에 처음에 부족했던 필요한 사실적 맥락을 제공합니다.
  3. 세대를 선택합니다: 마지막으로 강화된 프롬프트가 LLM으로 전달됩니다. 모델은 제공된 컨텍스트를 사용하여 를 사용하여 일관성 있고 사실에 근거한 답변을 생성합니다. 다음과 같은 주요 프레임워크 같은 선도적인 프레임워크가 이러한 단계를 원활하게 조율하는 데 자주 사용됩니다.

실제 애플리케이션

RAG는 데이터가 자주 변경되거나 정밀도가 중요한 산업에서 필수적입니다.

  • 엔터프라이즈 지식 관리: 조직은 RAG를 사용하여 내부 챗봇을 강화하는 데 사용합니다. 예를 들어, HR 어시스턴트는 회사 서버에서 최신 정책 문서를 검색하여 복리후생에 대한 질문에 답변할 수 있습니다. 이는 인공지능이 일반적인 인터넷 지식이 아닌 특정 회사 프로토콜을 준수하도록 보장합니다.
  • 임상 의사 결정 지원: 의료 분야 의료 분야의 AI는 RAG. 시스템은 가장 최근의 의학 연구 논문이나 특정 환자 병력 기록을 검색하여 의사의 진단에 도움을 줄 수 있습니다. 예측 모델링은 최신 과학을 기반으로 과학에 기반한 예측 모델링을 보장합니다.

컴퓨터 비전에서의 RAG

전통적으로 텍스트 기반이었던 RAG 개념은 이제 컴퓨터 비전(CV)으로 확장되고 있습니다. 멀티모달 모델에서 멀티모달 모델에서 시스템은 유사한 이미지나 시각적 메타데이터를 유사한 이미지 또는 시각적 메타데이터를 검색하여 객체 감지 또는 분류. 예를 들어 과학 데이터베이스에서 참조 이미지를 검색하여 희귀한 생물 표본의 식별을 개선할 수 있습니다. 다음과 같은 모델에 의해 수행되는 시각적 분석을 보강할 수 있습니다. Ultralytics YOLO11.

RAG 대 미세 조정

RAG와 미세 조정을 구별하는 것이 중요합니다. 서로 다른 문제를 해결하기 때문입니다:

  • RAG는 모델을 동적인 외부 사실에 연결합니다. 최신 정보와 검증이 필요한 애플리케이션에 가장 적합합니다. 최신 정보 및 검증 가능성이 필요한 애플리케이션에 가장 적합합니다. 모델의 내부 매개변수는 변경하지 않습니다.
  • 미세 조정에는 특정 데이터 세트에 대한 모델 가중치를 조정하기 위해 특정 데이터 세트에 대한 모델에 대한 모델 가중치를 조정합니다. 이 방법은 모델에 특정 스타일, 어조 또는 특정 스타일, 어조 또는 전문화된 작업 동작을 가르치는 데는 이상적이지만 빠르게 변화하는 사실에 대한 지식 기반을 유지하는 데는 덜 효과적입니다. 개발자는 종종 두 가지 접근 방식을 결합하는 전이 학습을 두 가지 접근 방식을 결합하는 경우가 많습니다.

예시: 탐지 데이터로 프롬프트 보강하기

이 Python 예제에서는 객체 감지 모델을 사용하여 이미지에 대한 "검색" 이미지에 대한 사실을 "검색"합니다. 그런 다음 이러한 사실을 바탕으로 텍스트 프롬프트를 보강하여 검증된 시각적 데이터에 설명을 추가합니다.

from ultralytics import YOLO

# Load the YOLO11 model acting as our 'retrieval' mechanism for visual facts
model = YOLO("yolo11n.pt")

# Run inference to retrieve content information from the image
results = model("https://ultralytics.com/images/bus.jpg")

# Extract detected classes to augment the prompt
detected_objects = [model.names[int(cls)] for cls in results[0].boxes.cls]
context_string = ", ".join(set(detected_objects))

# Construct the augmented prompt (RAG concept)
prompt = f"Based on the verified presence of {context_string} in the scene, describe the traffic situation."
print(f"Augmented Prompt: {prompt}")

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기