深圳Yolo 视觉
深圳
立即加入
词汇表

AI 代理

探索AI智能体的世界。了解这些自主系统如何利用 Ultralytics YOLO26 进行实时感知、推理和行动,以解决复杂任务。

一个 AI 智能体 是一个自主系统,能够感知其环境,通过复杂逻辑进行推理以做出决策,并采取特定行动以实现既定目标。与被动处理输入以产生输出的静态 机器学习 模型不同,智能体在连续的工作流中动态运行。这些系统构成了 人工智能 的“主动”层,弥合了数字预测与现实世界执行之间的鸿沟。通过利用记忆和自适应学习,智能体可以在无需持续人工干预的情况下处理从软件自动化到物理导航的各种任务。

感知-推理-行动循环

AI 代理的功能依赖于一个通常被称为 感知-行动循环 的循环过程。这种架构使代理能够有意义地与其环境互动。

  1. 感知(Sensing):智能体从世界中收集信息。在 计算机视觉 应用中,智能体使用摄像头作为“眼睛”。它采用 YOLO26 等高速模型执行 object detect 或segment,将原始像素转换为结构化数据。
  2. 推理(Thinking):智能体根据其目标处理感知到的数据。此阶段通常集成 大型语言模型(LLMs) 以实现语义理解,或 强化学习 算法以优化决策策略。高级智能体可以提前规划多步,就像国际象棋棋手预测未来走法一样。
  3. 行动(执行): 基于其推理,代理执行一项任务。这可能是一个数字行动,例如查询数据库或发送警报,或者机器人技术中的物理行动,例如机械臂从传送带上拾取特定物品。

AI代理与AI模型

区分智能体和模型很重要,因为它们在技术栈中扮演着不同的角色。

  • AI模型:模型是一个数学引擎,例如 神经网络,经过训练以识别模式。它是一个提供预测(例如,“这是一辆车”)的工具,但本身不会对其采取行动。
  • AI智能体:智能体是一个包罗万象的系统,它将模型作为工具使用。它拥有能动性——即发起改变的能力。例如,当模型识别出红灯时,智能体决定踩刹车。

实际应用

AI 智能体通过自动化需要认知灵活性的工作流,正在改变各行各业。

  • 智能制造:工业自动化中,视觉智能体监控生产线。如果质量控制系统识别出缺陷,智能体可以自主停止机器并记录事件,从而防止浪费。
  • 自动物流:仓库利用智能机器人进行库存管理。这些智能体使用SLAM(同步定位与建图)和视觉模型在动态环境中导航,以高效地定位、拣选和运输包裹。

构建简单的视觉代理

开发者可以通过结合感知模型和条件逻辑来构建基本智能体。以下 python 示例演示了一个使用 ultralytics 包。该代理 detect 一个人,并根据模型的置信度决定是否触发警报。

from ultralytics import YOLO

# Load the YOLO26 model (The Agent's Perception)
model = YOLO("yolo26n.pt")

# 1. Perceive: The agent analyzes an image
results = model("bus.jpg")

# 2. Reason & 3. Act: Decision logic based on perception
for result in results:
    # Check if a 'person' (class 0) is detected with high confidence
    if 0 in result.boxes.cls and result.boxes.conf.max() > 0.5:
        print("ACTION: Person detected! Initiating security protocol.")
    else:
        print("ACTION: Area clear. Continuing surveillance.")

相关概念

  • 边缘AI为了实时响应,智能体通常在NVIDIA Jetson等硬件上本地运行,通过在数据源而非云端处理数据来最小化延迟。
  • 通用人工智能 (AGI)虽然当前的智能体是专用的(狭义人工智能),但AGI指的是能够执行人类可以完成的任何智力任务的假设智能体。
  • 生成式AI现代智能体经常使用生成式AI来创建动态响应或代码,作为可以在其工作流程中生成内容的助手。

对于希望为其智能体训练底层模型的用户,Ultralytics Platform 提供了一个简化的环境,用于标注数据集和管理训练运行。有关智能体架构的更多阅读材料可在 Stanford HAIDeepMind 等组织的研究中找到。

让我们一起共建AI的未来!

开启您的机器学习未来之旅