Изучите Agentic RAG, чтобы усовершенствовать ИИ с помощью автономного мышления. Узнайте, как Ultralytics и Ultralytics обеспечивают интеллектуальный поиск и зрение.
Agentic Retrieval-Augmented Generation (Agentic RAG) — это передовая архитектура искусственного интеллекта (ИИ) , которая улучшает традиционные системы поиска за счет интеграции автономных ИИ-агентов. В то время как стандартные конвейеры RAG работают в линейной последовательности «поиск-генерация», Agentic RAG позволяет большой языковой модели (LLM) действовать в качестве интеллектуального координатора. Этот агент может независимо анализировать запрос пользователя, определять, нужна ли внешняя информация , формулировать несколько поисковых запросов, оценивать найденные данные и итеративно уточнять свои исследования, пока не составит исчерпывающий и точный ответ. Используя возможности вызова функций и использования инструментов, эти системы динамически направляют запросы по различным базам данных, API и аналитическим инструментам, значительно сокращая галлюцинации в LLM при решении сложных многоэтапных задач.
Основная инновация Agentic RAG заключается в его способности к циклическому повторению и рассуждению. Ведущие агентные ИИ-фреймворки структурируют этот процесс в динамичные, автономные рабочие процессы:
Для реализации надежных генеративных конвейеров крайне важно отличать агентский RAG от его основополагающих концепций:
Agentic RAG трансформирует отрасли, автоматизируя глубокие исследования и сложные задачи по устранению неполадок, которые имитируют человеческое аналитическое мышление.
Модели зрительного восприятия служат мощными сенсорными инструментами для систем Agentic RAG, взаимодействующих с физическим миром. Например , агент может использовать Ultralytics для динамического извлечения визуального контекста из изображения или видеопотока, чтобы ответить на запросы пользователей. Разработчики могут управлять аннотацией данных и обучением этих настраиваемых инструментов зрительного восприятия с помощью Ultralytics .
Следующий Python демонстрирует, как агент искусственного интеллекта может программно вызвать YOLO26 для извлечения структурированных наблюдений из изображения, собирая фактический контекст для следующего шага рассуждения.
from ultralytics import YOLO
# Initialize YOLO26 for the agent's visual retrieval tool
model = YOLO("yolo26n.pt")
# The agent invokes the model on an image to gather visual facts
results = model("https://ultralytics.com/images/bus.jpg")
# The agent parses the detected objects to formulate its next query or action
visual_context = [model.names[int(c)] for c in results[0].boxes.cls]
print(f"Agent Observation: I currently see {', '.join(visual_context)}.")
Соединяя высокопроизводительные модели машинного зрения с механизмами логического вывода, Agentic RAG устраняет разрыв между статическим поиском знаний и динамической, реальной пространственной интеллектуальной обработкой. Для более глубокого изучения развивающейся сферы автономных систем, отчет Stanford AI Index Report предоставляет всесторонний обзор возможностей агентов .