了解什么是 AI 代理,以及这些自主系统如何驱动现代自动化。探索它们的感知-思考-行动循环以及在计算机视觉和机器人技术中的作用。
人工智能代理是一种自主系统,旨在感知环境、推理如何实现特定目标 特定目标,并采取行动实现这些目标。与静态的人工智能模型不同,后者只是 处理输入以产生输出的静态人工智能模型不同,人工智能代理在一个连续的循环中运行--收集数据,根据数据做出决策,并执行任务,而无需持续不断地处理数据。 收集数据,根据数据做出决策,并在没有人类持续干预的情况下执行任务。这种能力使代理成为人工智能世界中的 这种能力使代理成为人工智能世界的 "实干家",在抽象数据分析与现实影响之间架起了一座桥梁。
人工智能代理的核心功能由其运行周期定义,通常称为 感知-行动循环。这一持续的过程能让人工智能代理适应不断变化的环境,并随着时间的推移不断改进。 并随着时间的推移不断改进。
区分人工智能代理和人工智能模型至关重要,因为这两个术语经常被混淆。
人工智能代理正通过将以前需要人工监督的复杂工作流程自动化,改变着各行各业。
在工业领域,机器人技术中的人工智能为 监督质量控制的代理。视觉检测代理配备了 物体检测模型,可以监控传送带 传送带。当它发现缺陷时,不仅会记录错误,还会触发机械臂(执行器)立即移除故障物品。 立即移除故障物品。这种自主循环提高了效率,减少了浪费。
自动驾驶汽车是最复杂的 自动驾驶汽车是人工智能代理最复杂的例子之一。它们利用一套传感器来感知车道标记、交通标志和行人。 行人。车载代理实时处理这些数据流,从而做出对生命至关重要的决策--转向、加速或制动--以安全导航、 转向、加速或刹车,从而安全地从 A 点导航到 B 点。 Waymo这样的公司在公共道路上部署这些 自动驾驶汽车。
开发人员可以使用YOLO11 等模型作为感知引擎,构建基于视觉的代理。下面的Python 示例演示了一个简单的 "安全代理",它能感知图像,检查是否有未经授权的人员,并通过触发模拟警报来采取行动。 通过触发模拟警报来采取行动。
from ultralytics import YOLO
# Load the YOLO11 model (The Agent's "Brain" for perception)
model = YOLO("yolo11n.pt")
# 1. Perceive: The agent captures/receives visual data
results = model("secure_zone.jpg")
# 2. Think & 3. Act: The agent evaluates the scene and takes action
for result in results:
# Check if a 'person' (class ID 0) is detected with high confidence
if 0 in result.boxes.cls and result.boxes.conf.max() > 0.5:
print("ACTION: Security Alert! Person detected in restricted area.")
else:
print("ACTION: Log entry - Area secure.")