Agentic Workflows
Узнай, как агентные рабочие процессы позволяют автономным агентам ИИ решать сложные задачи. Научись интегрировать передовые инструменты компьютерного зрения, такие как Ultralytics YOLO26.
Агентные рабочие процессы представляют собой трансформационный подход в искусственном интеллекте (ИИ), где несколько автономных сущностей взаимодействуют, принимают решения и выполняют многоэтапные задачи с минимальным вмешательством человека. В отличие от традиционных конвейеров машинного обучения, следующих строгим, линейным путям выполнения, агентный рабочий процесс крайне динамичен. Он позволяет интеллектуальному агенту или скоординированной сети агентов воспринимать окружающую среду, рассуждать над сложными проблемами и использовать внешние инструменты для достижения предопределенных целей. По мере масштабирования инициатив в области ИИ организациями корпоративные агентные рабочие процессы приходят на смену разрозненным скриптам, обеспечивая надежную и масштабируемую автоматизацию в различных отраслях.
Понимание агентных рабочих процессов
По своей сути агентный рабочий процесс переключает ИИ с пассивной генерации на активное решение проблем. Это требует перехода от однократных взаимодействий по подсказке к итеративному циклу планирования, выполнения и наблюдения. Оркестрируя эти циклы, ты можешь создавать системы, способные справляться с неожиданными граничными случаями и исправлять собственные ошибки.
Чтобы четко разграничить близкие концепции: ИИ-агент — это отдельная автономная сущность (часто работающая на базе большой языковой модели (LLM)), которая рассуждает и действует. Напротив, агентный рабочий процесс — это общий архитектурный процесс, определяющий, как эти агенты сотрудничают, используют общую память и выстраивают последовательность своих действий. Кроме того, в то время как генеративный ИИ в основном создает контент за один линейный проход на основе пользовательского запроса, агентные системы используют шаблоны агентного проектирования, такие как саморефлексия, планирование и обсуждение между несколькими агентами, для непрерывного уточнения результатов, пока цель не будет полностью достигнута.
Основные компоненты
Несколько фундаментальных элементов обеспечивают успех этих рабочих процессов:
- LLM-бэкенды: центральные механизмы рассуждения рабочего процесса. Фреймворки оркестрируют современные модели, такие как GPT-4o от OpenAI, для интерпретации намерений пользователя и динамического создания планов выполнения.
- Вызов функций и использование инструментов: агенты оснащены специфическими инструментами для взаимодействия с внешним миром. Это включает в себя запросы к базам данных, выполнение кода или вызов моделей компьютерного зрения для анализа визуальных данных. Документация от таких провайдеров, как OpenAI по вызову функций, описывает, как модели форматируют выводы для надежного запуска внешних API.
- Фреймворки оркестрации: библиотеки, такие как LangGraph, CrewAI, и Microsoft AutoGen, предоставляют критически важную инфраструктуру для соединения агентов, управления состояниями диалога и интеллектуальной маршрутизации задач.
- Управление памятью и контекстом: чтобы предотвратить галлюцинации и поддерживать согласованность в многоэтапных процессах, рабочие процессы сохраняют кратковременную память (текущее окно контекста диалога) и долгосрочную память (постоянные базы данных) для обучения на прошлых взаимодействиях.
Реальные применения
Агентные рабочие процессы активно решают сложные, открытые задачи в реальном мире:
-
Автономная визуальная инспекция: В производстве агентная система может автоматизировать обнаружение дефектов. Агент-оркестратор активирует инструмент камеры для захвата изображения, обрабатывает его с помощью модели обнаружения объектов и анализирует результат. Если обнаружен дефект, агент автономно регистрирует заявку на техническое обслуживание и направляет продукт на ручную проверку, управляя всем процессом реагирования на заводе.
-
Интеллектуальный парсинг документов: В финансовом и юридическом секторах рабочие процессы разработаны для извлечения структурированных данных из неструктурированных PDF-файлов. Агенты итеративно применяют детектирование макета, используя целевой промпт-инжиниринг для самокоррекции и проверки извлеченных таблиц на соответствие ожидаемым финансовым схемам.
-
Динамические маркетинговые операции: Передовые маркетинговые команды переосмысливают маркетинговые рабочие процессы, развертывая агентов, которые автономно анализируют текущие тренды, создают рекламные материалы, тестируют варианты текстов объявлений и корректируют бюджетные стратегии на основе метрик производительности в реальном времени.
Пример: Создание рабочего процесса Vision-Agent
Интегрировать визуальный интеллект в агентный рабочий процесс просто с помощью Ultralytics Platform и Python-пакета ultralytics. В этом концептуальном примере агентная система использует YOLO26 как инструмент восприятия для контроля производственной линии, позволяя базовой логике рабочего процесса автономно принимать решение о следующем действии на основе результатов режима предсказания.
from ultralytics import YOLO
# Load the recommended Ultralytics YOLO26 model
model = YOLO("yolo26n.pt")
# Agentic workflow step 1: Vision tool gathers environmental data
results = model.predict("factory_line.jpg")
# Agentic workflow step 2: Agent logic evaluates the visual detections
def decision_agent(detections):
for obj in detections:
# Check if the model detected a specific class, e.g., 'defect'
if obj.names[int(obj.cls)] == "defect":
return "Action: Trigger immediate maintenance alert."
return "Action: Continue production line smoothly."
# Execute the agent's decision logic based on bounding box data
action = decision_agent(results[0].boxes)
print(action)Используя такие фреймворки, как PyTorch, эти инструменты зрения передают высокоточное пространственное понимание в общую логику ИИ. По мере того как агентные организации продолжают развиваться, сочетание передовых моделей рассуждения и возможностей компьютерного зрения в реальном времени будет стимулировать следующее поколение интеллектуальной, самокорректирующейся автоматизации. Благодаря непрерывному улучшению посредством активного обучения и сложной оркестрации, агентные рабочие процессы гарантируют, что ИИ-системы надежно выполняют сложные стратегии от начала до конца.






