深圳Yolo 视觉
深圳
立即加入
词汇表

AI 代理

了解什么是 AI 代理,以及这些自主系统如何驱动现代自动化。探索它们的感知-思考-行动循环以及在计算机视觉和机器人技术中的作用。

人工智能代理是一种自主系统,旨在感知环境、推理如何实现特定目标 特定目标,并采取行动实现这些目标。与静态的人工智能模型不同,后者只是 处理输入以产生输出的静态人工智能模型不同,人工智能代理在一个连续的循环中运行--收集数据,根据数据做出决策,并执行任务,而无需持续不断地处理数据。 收集数据,根据数据做出决策,并在没有人类持续干预的情况下执行任务。这种能力使代理成为人工智能世界中的 这种能力使代理成为人工智能世界的 "实干家",在抽象数据分析与现实影响之间架起了一座桥梁。

感知-思考-行动环路

人工智能代理的核心功能由其运行周期定义,通常称为 感知-行动循环。这一持续的过程能让人工智能代理适应不断变化的环境,并随着时间的推移不断改进。 并随着时间的推移不断改进。

  1. 感知(传感):代理利用传感器收集周围环境的信息。在 在计算机视觉(CV)中,这些 "眼睛 "就是捕捉视觉数据的摄像头或激光雷达系统。 "眼睛 "是捕捉视觉数据的摄像头或激光雷达系统。
  2. 思考(处理与决策):代理使用 "大脑 "处理感官输入 "大脑"--通常是 机器学习(ML)模型或 大型语言模型(LLM)。它根据目标分析 根据其目标分析当前状态,并确定最佳行动方案。高级代理可采用 强化学习来学习最佳 策略。
  3. 行动(执行):代理使用执行器执行所选择的决策。在机器人技术中,这可能 在软件中,这可能意味着发送 API 请求、写入文件或触发警报。 警报。

人工智能代理与人工智能模型

区分人工智能代理和人工智能模型至关重要,因为这两个术语经常被混淆。

  • 人工智能模型:数学引擎(如 YOLO11)训练有素,可识别模式或进行预测。 它是被动的,等待输入并返回结果。把它想象成一个复杂的工具,就像数字百科全书或高速照相机。 百科全书或高速相机。
  • 人工智能代理: 使用一个或多个模型作为工具来实现目标的自主系统。 该代理负责管理工作流程,记忆过去的互动,并积极与世界互动。如果模型是 引擎,那么代理就是驾驶员。

实际应用

人工智能代理正通过将以前需要人工监督的复杂工作流程自动化,改变着各行各业。

智能制造与机器人技术

在工业领域,机器人技术中的人工智能为 监督质量控制的代理。视觉检测代理配备了 物体检测模型,可以监控传送带 传送带。当它发现缺陷时,不仅会记录错误,还会触发机械臂(执行器)立即移除故障物品。 立即移除故障物品。这种自主循环提高了效率,减少了浪费。

自动驾驶车辆

自动驾驶汽车是最复杂的 自动驾驶汽车是人工智能代理最复杂的例子之一。它们利用一套传感器来感知车道标记、交通标志和行人。 行人。车载代理实时处理这些数据流,从而做出对生命至关重要的决策--转向、加速或制动--以安全导航、 转向、加速或刹车,从而安全地从 A 点导航到 B 点。 Waymo这样的公司在公共道路上部署这些 自动驾驶汽车

构建简单的视觉代理

开发人员可以使用YOLO11 等模型作为感知引擎,构建基于视觉的代理。下面的Python 示例演示了一个简单的 "安全代理",它能感知图像,检查是否有未经授权的人员,并通过触发模拟警报来采取行动。 通过触发模拟警报来采取行动。

from ultralytics import YOLO

# Load the YOLO11 model (The Agent's "Brain" for perception)
model = YOLO("yolo11n.pt")

# 1. Perceive: The agent captures/receives visual data
results = model("secure_zone.jpg")

# 2. Think & 3. Act: The agent evaluates the scene and takes action
for result in results:
    # Check if a 'person' (class ID 0) is detected with high confidence
    if 0 in result.boxes.cls and result.boxes.conf.max() > 0.5:
        print("ACTION: Security Alert! Person detected in restricted area.")
    else:
        print("ACTION: Log entry - Area secure.")

相关概念

  • 强化学习A 强化学习:一种训练方法,代理通过接受奖励或惩罚来学习决策。 代理和复杂机器人所必需的。
  • 边缘人工智能直接在本地设备(如摄像头或无人机)而不是云上部署代理 本地设备(如摄像头或无人机)上直接部署代理,而不是云端,从而实现更快的 实时推理和行动。
  • 人工通用智能(AGI) 一种理论上的未来状态,在这种状态下,代理拥有理解、学习和应用知识的能力,可以完成各种任务,就像人类一样。 的能力,就像人类一样。

有关智能代理架构的更多信息,请参阅 IBM斯坦福大学的资源提供了深入的学术和行业观点。

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入