자율적 추론을 통해 AI를 강화하는 에이전틱 RAG(Retrieval-Augmented Generation)를 살펴보세요. Ultralytics Ultralytics 어떻게 지능형 검색 및 비전 기능을 지원하는지 알아보세요.
에이전트 기반 검색 강화 생성(Agentic RAG)은 자율적 AI 에이전트를 통합하여 기존 검색 시스템을 향상시키는 고급 인공 지능(AI)아키텍처입니다. 표준 RAG 파이프라인이 선형적인 "검색-생성" 순서로 작동하는 반면, 에이전트 기반 RAG는 대규모 언어 모델(LLM) 이 지능형 조정자 역할을 수행할 수 있도록 합니다. 이 에이전트는 사용자의 프롬프트를 독립적으로 분석하고, 외부 정보가 필요한지 판단하며, 여러 검색 쿼리를 구성하고, 검색된 데이터를 평가하며, 포괄적이고 정확한 답변을 작성할 때까지 연구를 반복적으로 개선합니다. 함수 호출 및 도구 사용 기능을 활용함으로써 이러한 시스템은 다양한 데이터베이스, API 및 분석 도구를 통해 쿼리를 동적으로 라우팅하여 복잡한 다단계 문제를 처리할 때 LLM의 환각 현상을 크게 줄입니다.
에이전트형 RAG의 핵심 혁신은 반복 및 추론 능력에 있습니다. 선도적인 에이전트형 AI 프레임워크 는이 과정을 동적이며 자율적인 워크플로로 구조화합니다:
강력한 생성 파이프라인을 구현하기 위해서는 에이전트 기반 RAG(Reference Answer Generation)를 그 기초 개념들과 구분하는 것이 중요하다:
에이전틱 RAG는 인간의 분석적 추론을 모방하는 심층 연구 및 복잡한 문제 해결 작업을 자동화함으로써 산업을 변화시키고 있습니다.
비전 모델은 물리적 세계와 상호작용하는 에이전트형 RAG 시스템의 강력한 감각 도구 역할을 합니다. 예를 들어, 에이전트는 Ultralytics 활용하여 이미지나 동영상 스트림에서 시각적 컨텍스트를 동적으로 추출해 사용자 질의에 응답할 수 있습니다. 개발자는 Ultralytics 통해 이러한 맞춤형 비전 도구의 데이터 주석 작업 및 훈련을 관리할 수 있습니다.
다음 Python AI 에이전트가 프로그래밍 방식으로 YOLO26을 호출하여 이미지에서 구조화된 관측값을 추출하고, 다음 추론 단계를 위한 사실적 맥락을 수집하는 방법을 보여줍니다.
from ultralytics import YOLO
# Initialize YOLO26 for the agent's visual retrieval tool
model = YOLO("yolo26n.pt")
# The agent invokes the model on an image to gather visual facts
results = model("https://ultralytics.com/images/bus.jpg")
# The agent parses the detected objects to formulate its next query or action
visual_context = [model.names[int(c)] for c in results[0].boxes.cls]
print(f"Agent Observation: I currently see {', '.join(visual_context)}.")
고성능 비전 모델을 추론 엔진에 연결함으로써, 에이전틱 RAG는 정적 지식 검색과 동적 현실 세계 공간 지능 간의 격차를 해소합니다. 자율 시스템의 진화하는 환경을 심층적으로 살펴보려면 스탠퍼드 AI 지수 보고서가 에이전틱 역량에 대한 포괄적인 추적 자료를 제공합니다.