Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

AI Agent

Узнайте, что такое агент ИИ и как эти автономные системы обеспечивают современную автоматизацию. Откройте для себя их цикл «восприятие-мышление-действие» и роль в компьютерном зрении и робототехнике.

Агент искусственного интеллекта - это автономная система, предназначенная для восприятия окружающей среды, рассуждения о том, как достичь конкретных целей и предпринимать действия для достижения этих целей. В отличие от статичной модели ИИ, которая просто обрабатывает входные данные для получения выходных, агент ИИ работает в непрерывном цикле, собирая данные, принимая решения на их основе и выполняя задачи без постоянного участия человека. и выполняет задачи без постоянного вмешательства человека. Эта способность делает агентов "исполнителями" в мире искусственного интеллекта, преодолевая разрыв между абстрактным анализом данных и реальным воздействием.

Петля "восприятие - мышление - действие

Основная функциональность агента ИИ определяется его операционным циклом, часто называемым Цикл "восприятие-действие". Этот непрерывный процесс позволяет агенту адаптироваться к изменяющимся условиям окружающей среды и совершенствоваться с течением времени.

  1. Воспринимать (Sensing): Агент собирает информацию о своем окружении с помощью сенсоров. В в контексте компьютерного зрения (КВ) такими "глаза" - это камеры или системы LiDAR, которые фиксируют визуальные данные.
  2. Мышление (обработка и принятие решений): Агент обрабатывает сенсорный вход, используя "мозга" - как правило, это модель машинного обучения (ML) или Большая языковая модель (LLM). Он анализирует текущее состояние в соответствии со своими целями и определяет наилучший курс действий. Продвинутые агенты могут использовать обучение с подкреплением, чтобы выработать оптимальную оптимальных стратегий методом проб и ошибок.
  3. Действие (исполнение): Агент выполняет выбранное решение с помощью исполнительных механизмов. В робототехнике это может перемещение механической руки; в программном обеспечении это может означать отправку API-запроса, запись файла или запуск оповещения оповещение.

Агенты ИИ против моделей ИИ

Очень важно различать агента ИИ и модель ИИ, поскольку эти термины часто путают.

  • Модель ИИ: Математический движок (например YOLO11), обученный распознавать закономерности или делать прогнозы. Она пассивна; она ждет ввода и возвращает результат. Думайте о нем как о сложном инструменте, таком же, как цифровая энциклопедии или высокоскоростной камеры.
  • Агент искусственного интеллекта: Автономная система, использующая одну или несколько моделей в качестве инструментов для достижения цели. Агент управляет рабочим процессом, запоминает прошлые взаимодействия и активно взаимодействует с миром. Если модель - это двигатель, то агент - водитель.

Применение в реальном мире

ИИ-агенты преобразуют отрасли, автоматизируя сложные рабочие процессы, которые раньше требовали человеческого контроля.

Умное производство и робототехника

В промышленности искусственный интеллект в робототехнике позволяет агентов, которые следят за контролем качества. Агент визуального контроля, оснащенный моделью обнаружения объектов, может контролировать конвейерную ленту. При обнаружении дефекта он не просто регистрирует ошибку, а запускает роботизированную руку (исполнительный механизм) для немедленного удаления чтобы немедленно удалить неисправный предмет. Этот автономный цикл повышает эффективность и сокращает количество отходов.

Автономные транспортные средства

Самоуправляемые автомобили - один из самых Это один из самых сложных примеров агентов ИИ. Они используют набор датчиков для восприятия разметки полосы движения, дорожных знаков и пешеходов. пешеходов. Бортовой агент обрабатывает этот поток данных в режиме реального времени, принимая важные для жизни решения - рулевое управление, ускорение или торможение для безопасного перемещения из точки А в точку Б. Такие компании, как Waymo, находятся на переднем крае внедрения этих автономных автомобилей на дорогах общего пользования.

Создание простого агента видения

Разработчики могут создавать агентов на основе зрения, используя в качестве перцептивного движка такие модели, как YOLO11 . Следующий пример на Python пример демонстрирует простой "Агент безопасности", который воспринимает изображение, проверяет наличие неавторизованных лиц и действует, вызывая имитацию тревоги.

from ultralytics import YOLO

# Load the YOLO11 model (The Agent's "Brain" for perception)
model = YOLO("yolo11n.pt")

# 1. Perceive: The agent captures/receives visual data
results = model("secure_zone.jpg")

# 2. Think & 3. Act: The agent evaluates the scene and takes action
for result in results:
    # Check if a 'person' (class ID 0) is detected with high confidence
    if 0 in result.boxes.cls and result.boxes.conf.max() > 0.5:
        print("ACTION: Security Alert! Person detected in restricted area.")
    else:
        print("ACTION: Log entry - Area secure.")

Связанные понятия

  • Обучение с подкреплением: A Метод обучения, при котором агенты учатся принимать решения, получая вознаграждение или наказание. агентов и сложной робототехники.
  • Edge AI: развертывание агентов непосредственно на локальных устройствах (например, камерах или дронах), а не в облаке, что позволяет быстрее более быстрых выводов и действий в реальном времени.
  • Искусственный интеллект общего назначения (ИОНИ): Теоретическое будущее состояние, в котором агент обладает способностью понимать, обучаться и применять знания в широком спектре задач, подобно человеку. широкого спектра задач, подобно человеку.

Для более подробного ознакомления с архитектурой интеллектуальных агентов можно воспользоваться ресурсами IBM и Стэнфордского университета, предлагающие глубокие академические и отраслевые взгляды.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас