Yolo 비전 선전
선전
지금 참여하기
용어집

행위적 RAG

자율적 추론을 통해 AI를 강화하는 에이전틱 RAG(Retrieval-Augmented Generation)를 살펴보세요. Ultralytics Ultralytics 어떻게 지능형 검색 및 비전 기능을 지원하는지 알아보세요.

에이전트 기반 검색 강화 생성(Agentic RAG)은 자율적 AI 에이전트를 통합하여 기존 검색 시스템을 향상시키는 고급 인공 지능(AI)아키텍처입니다. 표준 RAG 파이프라인이 선형적인 "검색-생성" 순서로 작동하는 반면, 에이전트 기반 RAG는 대규모 언어 모델(LLM) 이 지능형 조정자 역할을 수행할 수 있도록 합니다. 이 에이전트는 사용자의 프롬프트를 독립적으로 분석하고, 외부 정보가 필요한지 판단하며, 여러 검색 쿼리를 구성하고, 검색된 데이터를 평가하며, 포괄적이고 정확한 답변을 작성할 때까지 연구를 반복적으로 개선합니다. 함수 호출 및 도구 사용 기능을 활용함으로써 이러한 시스템은 다양한 데이터베이스, API 및 분석 도구를 통해 쿼리를 동적으로 라우팅하여 복잡한 다단계 문제를 처리할 때 LLM의 환각 현상을 크게 줄입니다.

에이전트형 RAG 시스템의 작동 방식

에이전트형 RAG의 핵심 혁신은 반복 및 추론 능력에 있습니다. 선도적인 에이전트형 AI 프레임워크 는이 과정을 동적이며 자율적인 워크플로로 구조화합니다:

  • 쿼리 계획 및 라우팅: 에이전트는 복잡한 질문을 더 작고 관리 가능한 하위 작업으로 분해하여 각각을 가장 적합한 도구 또는 벡터 데이터베이스로 라우팅합니다.
  • 반복적 검색: 정적 검색과 달리 에이전트는 검색된 문서를 검토합니다. 컨텍스트가 불충분할 경우 검색 전략을 재구성하고 다시 쿼리를 실행합니다.
  • 도구 통합: 에이전트는 코드를 작성 및 실행하고, 수학적 연산을 수행하거나 머신 러닝(ML) 모델을 트리거하여 즉석에서 새로운 데이터를 생성할 수 있습니다.

행위자 기반 RAG 대 표준 RAG

강력한 생성 파이프라인을 구현하기 위해서는 에이전트 기반 RAG(Reference Answer Generation)를 그 기초 개념들과 구분하는 것이 중요하다:

  • 표준 검색 강화 생성(RAG): 단일 패스로 작동합니다. 의미적 유사성에 기반하여 문서를 검색하고 응답을 생성합니다. 복잡한 논리를 처리하는 데 어려움을 겪으며, 이는 여러 단계에 걸쳐 서로 다른 데이터 소스를 종합해야 하는 경우를 의미합니다.
  • 에이전트 기반 RAG: 의사 결정과 반복 과정을 도입합니다. 에이전트는 검색 결과의 품질을 평가하고, 최종 생성 전에 후속 검색이나 다른 도구를 실행할 수 있습니다.
  • 다중 모달 RAG: 다양한 데이터 유형(이미지, 텍스트, 비디오) 검색에 중점을 둠. 에이전트 기반 RAG는 다중 모달 RAG 파이프라인을 제어하여 시각적 데이터베이스와 텍스트 문서 중 어느 것을 검색할지 결정할 수 있음.

실제 애플리케이션

에이전틱 RAG는 인간의 분석적 추론을 모방하는 심층 연구 및 복잡한 문제 해결 작업을 자동화함으로써 산업을 변화시키고 있습니다.

  • 기업 지식 통합: 기업 환경에서 에이전트는 "3분기 실적을 요약하고 주요 경쟁사의 최근 실적과 비교하라"는 프롬프트를 받을 수 있습니다. 에이전트는 자율적으로 내부 재무 데이터베이스를 조회하고, 경쟁사 제출 자료를 실시간으로 웹 검색하며, 계산기 도구를 사용해 수치를 분석한 후 포괄적인 브리핑 초안을 작성합니다.
  • 자율 품질 검사: 제조 현장에서 에이전트는 조립 실패의 근본 원인을 식별하는 임무를 수행할 수 있습니다. 이는 컴퓨터 비전(CV) 모델을 트리거하여 실시간 카메라 영상을 검사하고, 과거 유지보수 기록을 조회하며, 시각적 및 텍스트 증거를 기반으로 진단 보고서를 생성할 수 있습니다.

비전 AI를 에이전트 기반 워크플로에 통합하기

비전 모델은 물리적 세계와 상호작용하는 에이전트형 RAG 시스템의 강력한 감각 도구 역할을 합니다. 예를 들어, 에이전트는 Ultralytics 활용하여 이미지나 동영상 스트림에서 시각적 컨텍스트를 동적으로 추출해 사용자 질의에 응답할 수 있습니다. 개발자는 Ultralytics 통해 이러한 맞춤형 비전 도구의 데이터 주석 작업 및 훈련을 관리할 수 있습니다.

다음 Python AI 에이전트가 프로그래밍 방식으로 YOLO26을 호출하여 이미지에서 구조화된 관측값을 추출하고, 다음 추론 단계를 위한 사실적 맥락을 수집하는 방법을 보여줍니다.

from ultralytics import YOLO

# Initialize YOLO26 for the agent's visual retrieval tool
model = YOLO("yolo26n.pt")

# The agent invokes the model on an image to gather visual facts
results = model("https://ultralytics.com/images/bus.jpg")

# The agent parses the detected objects to formulate its next query or action
visual_context = [model.names[int(c)] for c in results[0].boxes.cls]
print(f"Agent Observation: I currently see {', '.join(visual_context)}.")

고성능 비전 모델을 추론 엔진에 연결함으로써, 에이전틱 RAG는 정적 지식 검색과 동적 현실 세계 공간 지능 간의 격차를 해소합니다. 자율 시스템의 진화하는 환경을 심층적으로 살펴보려면 스탠퍼드 AI 지수 보고서가 에이전틱 역량에 대한 포괄적인 추적 자료를 제공합니다.

Ultralytics YOLO 파워업

프로젝트에 필요한 고급 AI 비전을 확보하세요. 오늘 목표에 맞는 라이선스를 찾아보세요.

라이선스 옵션 살펴보기