Agentic RAG

Исследуй агентный RAG для улучшения ИИ с помощью автономного рассуждения. Узнай, как Ultralytics YOLO26 и платформа Ultralytics обеспечивают интеллектуальный поиск и работу со зрением.

Агентная генерация с дополненной выборкой (Agentic RAG) — это передовая архитектура искусственного интеллекта (ИИ), которая расширяет возможности традиционных систем поиска за счет интеграции автономных ИИ-агентов. В то время как стандартные RAG-конвейеры работают по линейной схеме «поиск-генерация», Agentic RAG позволяет большой языковой модели (LLM) выступать в роли интеллектуального координатора. Этот агент может самостоятельно анализировать запрос пользователя, определять, нужна ли внешняя информация, формулировать несколько поисковых запросов, оценивать полученные данные и итеративно уточнять свое исследование, пока не составит исчерпывающий и точный ответ. Используя возможности вызова функций и использования инструментов, такие системы динамически направляют запросы к различным базам данных, API и аналитическим инструментам, значительно сокращая галлюцинации в LLM при решении сложных многоэтапных задач.

Link to this sectionКак работают системы Agentic RAG#

Основное новшество Agentic RAG заключается в способности к циклическому процессу и рассуждению. Ведущие фреймворки агентного ИИ структурируют этот процесс в динамические, автономные рабочие процессы:

Планирование и маршрутизация запросов: Агент разбивает сложные вопросы на более мелкие, управляемые подзадачи и направляет каждую к наиболее подходящему инструменту или векторной базе данных.
Итеративный поиск: В отличие от статического поиска, агент проверяет полученные документы. Если контекста недостаточно, он переформулирует стратегию поиска и делает запрос снова.
Интеграция инструментов: Агент может писать и исполнять код, выполнять математические вычисления или запускать модели машинного обучения (ML) для оперативного синтеза новых данных.

Link to this sectionAgentic RAG против стандартного RAG#

Для реализации надежных генеративных конвейеров важно отличать Agentic RAG от его фундаментальных концепций:

Стандартная генерация с дополненной выборкой (RAG): Работает за один проход. Система извлекает документы на основе семантического сходства и генерирует ответ. Ей трудно справляться со сложной логикой, требующей синтеза разрозненных источников данных за несколько шагов.
Agentic RAG: Вводит принятие решений и циклы. Агент оценивает качество поиска и может запускать последующие поисковые запросы или использовать другие инструменты перед завершением генерации.
Мультимодальный RAG: Фокусируется на извлечении различных типов данных (изображения, текст, видео). Agentic RAG может управлять конвейером мультимодального RAG, решая, когда выполнять поиск по визуальной базе данных, а когда — по текстовому документу.

Link to this sectionРеальные приложения#

Agentic RAG трансформирует отрасли, автоматизируя глубокие исследования и сложные задачи по поиску и устранению неисправностей, которые имитируют человеческое аналитическое мышление.

Синтез корпоративных знаний: В корпоративной среде агент может получить запрос: «обобщи показатели за третий квартал и сравни их с последними финансовыми результатами нашего главного конкурента». Агент автономно опрашивает внутренние финансовые базы данных, выполняет веб-поиск отчетности конкурентов в реальном времени, анализирует цифры с помощью калькулятора и составляет подробную справку.
Автономный контроль качества: В производстве агент может получить задачу по выявлению первопричины сбоя сборки. Он может запустить модель компьютерного зрения (CV) для проверки потока с камер в реальном времени, запросить журналы технического обслуживания и составить диагностический отчет на основе визуальных и текстовых данных.

Link to this sectionИнтеграция ИИ зрения в агентные рабочие процессы#

Модели зрения служат мощными сенсорными инструментами для систем Agentic RAG, взаимодействующих с физическим миром. Например, агент может использовать Ultralytics YOLO26 для динамического извлечения визуального контекста из изображения или видеопотока, чтобы отвечать на запросы пользователей. Разработчики могут управлять аннотированием данных и обучением этих специализированных инструментов компьютерного зрения с помощью Ultralytics Platform.

Следующий пример на Python демонстрирует, как ИИ-агент может программно вызывать YOLO26 для извлечения структурированных наблюдений из изображения, собирая фактический контекст для следующего шага рассуждения.

from ultralytics import YOLO

# Initialize YOLO26 for the agent's visual retrieval tool
model = YOLO("yolo26n.pt")

# The agent invokes the model on an image to gather visual facts
results = model("https://ultralytics.com/images/bus.jpg")

# The agent parses the detected objects to formulate its next query or action
visual_context = [model.names[int(c)] for c in results[0].boxes.cls]
print(f"Agent Observation: I currently see {', '.join(visual_context)}.")

Подключая высокоэффективные модели зрения к механизмам рассуждения, Agentic RAG преодолевает разрыв между статическим поиском знаний и динамическим пространственным интеллектом в реальном мире. Для более глубокого понимания развивающегося ландшафта автономных систем отчет Stanford AI Index Report предоставляет комплексный мониторинг агентных возможностей.