Agentic RAG
자율적 추론으로 AI를 향상하기 위해 Agentic RAG를 탐구해 보십시오. Ultralytics YOLO26과 Ultralytics Platform이 지능형 검색과 비전을 어떻게 강화하는지 알아보십시오.
Agentic Retrieval-Augmented Generation (Agentic RAG) is an advanced artificial intelligence (AI) architecture that enhances traditional retrieval systems by integrating autonomous AI agents. While standard RAG pipelines operate in a linear "retrieve-and-generate" sequence, Agentic RAG empowers a Large Language Model (LLM) to act as an intelligent orchestrator. This agent can independently analyze a user's prompt, determine if external information is needed, formulate multiple search queries, evaluate the retrieved data, and iteratively refine its research until it compiles a comprehensive and accurate answer. By leveraging function calling and tool use capabilities, these systems dynamically route queries across various databases, APIs, and analytical tools, significantly reducing hallucinations in LLMs when dealing with complex, multi-step problems.
Link to this sectionAgentic RAG 시스템 작동 원리#
Agentic RAG의 핵심 혁신은 반복하고 추론하는 능력에 있습니다. 선도적인 에이전트 AI 프레임워크는 이 프로세스를 동적이고 자율적인 워크플로우로 구성합니다:
- 쿼리 계획 및 라우팅: 에이전트는 복잡한 질문을 더 작고 관리하기 쉬운 하위 작업으로 분해하고 각 작업을 가장 적합한 도구 또는 벡터 데이터베이스로 라우팅합니다.
- 반복적 검색: 정적 검색과 달리, 에이전트는 가져온 문서를 검토합니다. 컨텍스트가 충분하지 않으면 검색 전략을 수정하고 다시 쿼리합니다.
- 도구 통합: 에이전트는 코드를 작성 및 실행하거나, 수학 계산을 수행하거나, 머신 러닝(ML) 모델을 트리거하여 즉석에서 새로운 데이터를 합성할 수 있습니다.
Link to this sectionAgentic RAG와 표준 RAG 비교#
강력한 생성 파이프라인을 구현하려면 Agentic RAG를 그 기반 개념과 구별하는 것이 중요합니다:
- 표준 검색 증강 생성(RAG): 단일 패스로 작동합니다. 의미론적 유사성을 기반으로 문서를 가져와 응답을 생성합니다. 여러 단계에 걸쳐 서로 다른 데이터 소스를 합성해야 하는 복잡한 논리 처리에 어려움을 겪습니다.
- Agentic RAG: 의사 결정과 루프를 도입합니다. 에이전트는 검색된 결과의 품질을 평가하며, 생성을 완료하기 전에 후속 검색이나 다른 도구를 트리거할 수 있습니다.
- 멀티모달 RAG: 다양한 데이터 유형(이미지, 텍스트, 비디오)을 검색하는 데 중점을 둡니다. Agentic RAG는 멀티모달 RAG 파이프라인을 제어하여 텍스트 문서와 시각적 데이터베이스 중 언제 검색할지 결정할 수 있습니다.
Link to this section실제 애플리케이션 사례#
Agentic RAG는 인간의 분석적 추론을 모방하는 심층 연구 및 복잡한 문제 해결 작업을 자동화함으로써 산업을 변화시키고 있습니다.
- 기업 지식 합성: 기업 환경에서 에이전트는 "3분기 성과를 요약하고 주요 경쟁사의 최신 실적과 비교하라"는 프롬프트를 받을 수 있습니다. 에이전트는 내부 재무 데이터베이스를 자율적으로 쿼리하고, 경쟁사 보고서에 대해 실시간 웹 검색을 수행하며, 계산기 도구를 사용하여 수치를 분석하고, 포괄적인 브리핑 문서를 작성합니다.
- 자율 품질 검사: 제조 분야에서 에이전트는 조립 실패의 근본 원인을 파악하는 임무를 수행할 수 있습니다. 컴퓨터 비전(CV) 모델을 트리거하여 실시간 카메라 피드를 검사하고, 과거 유지보수 로그를 쿼리하며, 시각적 및 텍스트 증거를 기반으로 진단 보고서를 합성할 수 있습니다.
Link to this section비전 AI를 Agentic 워크플로우에 통합하기#
비전 모델은 물리적 세계와 상호 작용하는 Agentic RAG 시스템을 위한 강력한 감각 도구 역할을 합니다. 예를 들어, 에이전트는 Ultralytics YOLO26을 사용하여 이미지나 비디오 스트림에서 시각적 컨텍스트를 동적으로 검색하여 사용자 질문에 답변할 수 있습니다. 개발자는 Ultralytics Platform을 사용하여 이러한 맞춤형 비전 도구의 데이터 어노테이션 및 학습을 관리할 수 있습니다.
다음 Python 예제는 AI 에이전트가 프로그래밍 방식으로 YOLO26을 호출하여 이미지에서 구조화된 관찰 결과를 추출하고, 다음 추론 단계를 위한 사실적 컨텍스트를 수집하는 방법을 보여줍니다.
from ultralytics import YOLO
# Initialize YOLO26 for the agent's visual retrieval tool
model = YOLO("yolo26n.pt")
# The agent invokes the model on an image to gather visual facts
results = model("https://ultralytics.com/images/bus.jpg")
# The agent parses the detected objects to formulate its next query or action
visual_context = [model.names[int(c)] for c in results[0].boxes.cls]
print(f"Agent Observation: I currently see {', '.join(visual_context)}.")고성능 비전 모델을 추론 엔진에 연결함으로써, Agentic RAG는 정적 지식 검색과 동적인 실제 세계의 공간 지능 사이의 격차를 메웁니다. 자율 시스템의 진화하는 환경에 대해 더 깊이 알아보려면 Stanford AI Index Report에서 에이전트 기능에 대한 포괄적인 추적 정보를 확인할 수 있습니다.






