Agentic Workflows

Узнай, как агентные рабочие процессы позволяют автономным ИИ-агентам решать сложные задачи. Научись интегрировать передовые инструменты визуализации, такие как Ultralytics YOLO26.

Агентные рабочие процессы представляют собой трансформационный подход в искусственном интеллекте (ИИ), где несколько автономных сущностей взаимодействуют, принимают решения и выполняют многоэтапные задачи с минимальным вмешательством человека. В отличие от традиционных конвейеров машинного обучения, которые следуют строгим, линейным путям выполнения, агентный рабочий процесс является высокодинамичным. Он позволяет интеллектуальному агенту или скоординированной сети агентов воспринимать окружающую среду, рассуждать над сложными проблемами и использовать внешние инструменты для достижения заранее определенных целей. По мере того как организации масштабируют свои инициативы в области ИИ, корпоративные агентные рабочие процессы заменяют изолированные скрипты, обеспечивая надежную и масштабируемую автоматизацию в различных отраслях.

Link to this sectionПонимание агентных рабочих процессов#

По своей сути, агентный рабочий процесс переводит ИИ от пассивной генерации к активному решению проблем. Это требует перехода от взаимодействий на основе одиночных промптов к итеративному циклу планирования, выполнения и наблюдения. Оркестрируя эти циклы, разработчики могут создавать системы, способные справляться с непредвиденными граничными случаями и самостоятельно исправлять свои ошибки.

Чтобы четко разграничить близкие понятия: ИИ-агент — это индивидуальная автономная сущность (часто работающая на базе большой языковой модели (LLM)), которая рассуждает и действует. Напротив, агентный рабочий процесс — это всеобъемлющий архитектурный процесс, который управляет тем, как эти агенты взаимодействуют, делятся памятью и выстраивают последовательность своих действий. Более того, в то время как генеративный ИИ в основном создает контент за один линейный проход на основе пользовательского запроса, агентные системы используют шаблоны агентного проектирования — такие как саморефлексия, планирование и многоагентное обсуждение — для постоянного улучшения результатов до тех пор, пока цель не будет полностью достигнута.

Link to this sectionОсновные компоненты#

Успех этих рабочих процессов обеспечивается несколькими фундаментальными элементами:

LLM-бэкенды: центральные механизмы рассуждения в рабочем процессе. Фреймворки оркестрируют современные модели, такие как GPT-4o от OpenAI, для интерпретации намерений пользователя и динамического создания планов выполнения.
Вызов функций и использование инструментов: агенты оснащены специфическими инструментами для взаимодействия с внешним миром. Это включает в себя запросы к базам данных, выполнение кода или вызов моделей компьютерного зрения для анализа визуальных данных. Документация от поставщиков, например OpenAI о вызове функций, описывает, как модели форматируют выходные данные для надежного запуска внешних API.
Фреймворки оркестрации: библиотеки, такие как LangGraph, CrewAI и Microsoft AutoGen, предоставляют критически важную инфраструктуру для соединения агентов, управления состояниями диалога и интеллектуальной маршрутизации задач.
Управление памятью и контекстом: Чтобы предотвратить галлюцинации и обеспечить согласованность в многоэтапных процессах, рабочие процессы сохраняют кратковременную память (текущее окно диалогового контекста) и долгосрочную память (постоянные базы данных) для обучения на основе прошлых взаимодействий.

Link to this sectionРеальные приложения#

Агентные рабочие процессы активно решают сложные, открытые задачи в реальном мире:

Автономный визуальный контроль: В производстве агентная система может автоматизировать обнаружение дефектов. Агент-оркестратор активирует инструмент камеры для захвата изображения, обрабатывает его с помощью модели обнаружения объектов и анализирует результат. Если обнаружен дефект, агент автономно регистрирует заявку на техническое обслуживание и направляет продукт на ручную проверку, управляя всей реакцией завода.
Интеллектуальный парсинг документов: В финансовом и юридическом секторах рабочие процессы разрабатываются для извлечения структурированных данных из неструктурированных PDF-файлов. Агенты итеративно применяют обнаружение макета, используя целенаправленный промпт-инжиниринг для самокоррекции и проверки извлеченных таблиц на соответствие ожидаемым финансовым схемам.
Динамические маркетинговые операции: Дальновидные маркетинговые команды переосмысливают маркетинговые рабочие процессы, развертывая агентов, которые автономно анализируют текущие тренды, создают рекламные материалы, тестируют вариации рекламных текстов и корректируют бюджетные стратегии на основе показателей производительности в реальном времени.

Link to this sectionПример: построение рабочего процесса Vision-Agent#

Интеграция визуального интеллекта в агентный рабочий процесс проста с использованием Ultralytics Platform и Python-пакета ultralytics. В этом концептуальном примере агентная система использует YOLO26 в качестве инструмента восприятия для контроля заводской линии, позволяя базовой логике рабочего процесса автономно принимать решение о следующем действии на основе результатов режима predict.

from ultralytics import YOLO

# Load the recommended Ultralytics YOLO26 model
model = YOLO("yolo26n.pt")

# Agentic workflow step 1: Vision tool gathers environmental data
results = model.predict("factory_line.jpg")


# Agentic workflow step 2: Agent logic evaluates the visual detections
def decision_agent(detections):
    for obj in detections:
        # Check if the model detected a specific class, e.g., 'defect'
        if obj.names[int(obj.cls)] == "defect":
            return "Action: Trigger immediate maintenance alert."
    return "Action: Continue production line smoothly."


# Execute the agent's decision logic based on bounding box data
action = decision_agent(results[0].boxes)
print(action)

Используя фреймворки вроде PyTorch под капотом, эти инструменты зрения передают высокоточное пространственное понимание в общую логику ИИ. По мере того как агентные организации продолжают развиваться, сочетание передовых моделей рассуждения и возможностей зрения в реальном времени станет драйвером следующего поколения интеллектуальной, самокорректирующейся автоматизации. Благодаря непрерывному совершенствованию посредством активного обучения и сложной оркестрации, агентные рабочие процессы обеспечивают надежное выполнение сложных стратегий ИИ-системами от начала до конца.