遇见 YOLO26: 下一代视觉 AI。
Ultralytics
视觉 AI

智能体 AI 与计算机视觉:自动化的未来

探索智能体 AI 系统如何利用计算机视觉模型自主分析视觉数据、从经验中学习并适应不断变化的环境。

ABAbirami Vina
4 min read
智能体 AI 和计算机视觉推动自主自动化

人工智能 (AI) 和计算机视觉正帮助机器观察并理解世界。得益于近期的进展,我们正在见证一场飞跃——AI 创新不仅能感知,还能独立思考、规划和行动。在之前的文章中,我们讨论了 vision agents 如何能够处理视觉数据、进行分析并采取行动。

今天,我们将探讨一个类似的概念:Agentic AI。Agentic AI 系统旨在独立运行,并具备类似人类的推理和解决问题能力,以实现既定目标。与专注于通过预定义指令完成单个任务的传统 AI 系统不同,Agentic AI 可以自主规划并执行任务。这些智能体甚至可以从之前的交互中学习,并在无需任何人工干预的情况下做出决定。

在计算机视觉方面,Agentic AI 系统可以利用诸如使用 computer vision models(例如 Ultralytics YOLO11)进行目标检测等技术,实时分析视觉数据、识别物体、理解空间关系并基于环境做出自主决策。

Link to this section什么是 Agentic AI?#

其核心在于,Agentic AI 系统在设计上具备自主的、面向目标的思维、自适应的问题解决能力以及持续学习能力。它们使用 AI 智能体来理解环境、做出决策并执行任务。这些 AI 智能体利用计算机视觉模型、强化学习技术和大型语言模型 (LLMs) 来执行复杂任务。这使得它们非常适合自动化业务工作流程并增强决策制定。

例如,在仓库中,配备了 computer vision 的 Agentic AI 系统可以在无需人工干预的情况下检测包裹、跟踪库存并绕过障碍物。利用强化学习,它可以随着时间推移提高移动效率,学习避开拥堵的最佳路线。与此同时,基于 LLM 的聊天机器人可以通过回答查询和建议运营改进来协助工作人员,使整个工作流程更加高效。

代理 AI 工作原理概览

Fig 1. Agentic AI 工作原理概述。

传统 AI 解决方案与 Agentic AI 解决方案之间的关键区别在于,Agentic AI 能够预见未来并适应不断变化的情况。传统的计算机视觉系统非常擅长识别物体或分类图像,但它们无法动态调整行为。它们需要人工介入并帮助重新训练或微调模型。与此同时,Agentic AI 使用先进的机器学习技术,通过与环境交互来随着时间推移不断改进。

Link to this section比较 Agentic AI 与其他先进的 AI 创新#

AI 发展迅速,generative AI、Agentic 自动化和计算机视觉等新概念正被各行各业迅速采用。让我们比较一下这些技术,以更好地理解 Agentic AI 的独特之处。

Link to this section生成式 AI 与 Agentic AI 之间的区别#

如果你使用过 ChatGPT 之类的工具,那么你对生成式 AI 已经很熟悉了。该 AI 分支专门根据用户提示创建内容,例如文本、图像或代码。虽然生成式 AI 增强了创造力和想法探索,但它遵循学习到的模式,并在预定义的约束内运行,缺乏做出自主决策或追求独立目标的能力。

相比之下,Agentic AI 积极主动地追求目标。它可以在不需要持续人工输入的情况下动态适应环境。它不仅是生成内容,还能自主采取行动并解决问题。

Link to this sectionAgentic 自动化与 Agentic AI 密切相关#

Agentic 自动化和 Agentic AI 相辅相成,Agentic AI 提供支持自动化的智能。以基于计算机视觉的安防系统为例。

Agentic AI 系统分析情况,决定最佳响应,并自行采取行动。例如,如果一台集成了计算机视觉的 AI security camera 发现了入侵者,Agentic AI 系统不仅会发送警报;它还会检查该人员是否为员工、在需要时锁定门禁、跟踪其移动,甚至派出无人机进行监控。

Agentic 自动化确保所有这些操作顺利配合。它连接了不同的系统,如安防摄像头、门锁和无人机,以便它们能够自动且同步地做出响应。虽然 Agentic AI 负责决策,但 Agentic 自动化确保这些决策能够在无需人工干预的情况下高效执行。

代理 AI 与代理自动化对比

Fig 2. Agentic AI 与 Agentic 自动化的比较。图片由作者提供。

Link to this sectionAgentic AI 的工作原理#

既然我们对 Agentic AI 有了更好的了解,让我们探索一下它是如何工作的。

Agentic AI 系统通过感知、决策、行动和适应的循环过程运行,帮助它们随着时间推移学习和改进。这种持续循环使这些系统能够独立运作并实现复杂目标。

以下是该持续循环中所涉及步骤的简要回顾:

  • 感知:Agentic AI 系统收集并分析来自摄像头、传感器和用户交互的数据,以更好地了解周围环境。
  • 决策:系统评估不同的选项,预测可能的结果,并根据推理和风险评估选择最佳行动方案。
  • 行动:一旦做出决定,系统通过控制物理设备、与其他系统交互或生成输出来执行任务。
  • 适应:系统利用反馈从经验中学习,应用机器学习和 reinforcement learning 来提高性能,特别是在处理更复杂的任务时。

代理 AI 感知、决策、行动和自适应循环示意图

Fig 3. 了解 Agentic AI 的工作原理。

Link to this sectionAgentic AI 的现实应用#

接下来,让我们看看一些 Agentic AI 的实际应用示例。这些系统正在各行各业中使用,帮助机器分析数据并做出独立决策以改善结果。

Link to this section药物研发中的 Agentic AI#

Drug discovery 涉及几个关键阶段,从确定与疾病相关的生物靶点到筛选潜在化合物、优化其化学结构以及进行临床前测试。这是一个复杂且耗时的过程,需要进行大量的数据分析和实验才能找到有效且安全的治疗方法。

Agentic AI 集成了计算机视觉,正在帮助自动化化学合成等关键步骤,使流程更快、更高效。化学合成是通过受控反应将不同化学化合物结合以产生新物质(如医药产品)的过程。传统上,科学家必须通过反复试验手动调整温度、溶剂组成和结晶时间等因素。

现在,Agentic AI 系统可以实时监控反应,分析诸如颜色变化或晶体形成等视觉变化,并当场做出决策。例如,如果系统检测到反应没有按预期进行,它可以立即调整温度或添加必要的化学物质来优化过程。通过不断从过去的反应中学习,系统随着时间的推移提高了准确性,减少了手动干预的需要并加快了药物开发速度。

自动化实验室设置

Fig 4. 自动化实验室设置示例。

Link to this section用 Agentic AI 重塑电子商务#

Agentic AI 正在改变我们的在线购物方式,使体验更加个性化、高效和自动化。Agentic AI 不仅仅是根据过去的购买记录推荐产品,还能分析浏览习惯,预测客户下一步可能想要什么,并实时调整产品建议。

在计算机视觉的帮助下,Agentic AI 还可以分析视觉搜索,识别产品图像以提供更准确的建议。例如,如果某人经常查看运动鞋,Agentic AI 系统可以突出显示流行款式、提供折扣或建议搭配的配饰。它还可以根据需求优化定价和促销活动,使购物更加动态。

除了推荐之外,Agentic AI 还通过管理库存、预测补货和自动化订单履行来改善电子商务 logistics。计算机视觉使 Agentic AI 系统能够实时跟踪库存水平、识别放错位置的商品并确保产品分类正确。如果某种商品售罄速度很快,系统可以触发补货或建议替代品。通过不断学习和适应,Agentic AI 正在使在线购物对客户和企业来说都变得更快、更智能、更顺畅。

Link to this section如何构建 Agentic AI 系统#

既然我们已经了解了 Agentic AI 的现实示例,让我们讨论一下如何构建它。

如果你正在开发基于计算机视觉的应用程序,使用最新的模型(如 Ultralytics YOLO11)可以帮助你的 Agentic AI 系统更好地了解其周围环境。凭借对各种 computer vision tasks 的支持,YOLO11 可以让 Agentic AI 系统准确分析视觉数据成为可能。

以下是如何使用 YOLO11 构建 Agentic AI 系统的方法:

  • 定义目标: 明确概述 AI 智能体的目的、目标以及它为实现预期功能所需执行的具体任务。

  • 训练 YOLO11: 收集相关的图像和视频数据,进行标注,并根据你的具体应用程序对 YOLO11 进行 custom-train

  • 集成 YOLO11: 将 YOLO11 连接到一个能够根据检测到的视觉数据进行实时分析和决策的 AI 框架中。

  • 启用自主决策: 设置逻辑或机器学习模型,允许 AI 智能体根据 YOLO11 的检测结果采取行动,例如触发警报、调整设置或引导机器人系统。

  • 纳入反馈循环: 实现一个自学习系统,其中 YOLO11 通过使用新数据进行重训练来优化其准确性,从而随着时间推移提高模型性能。

使用 YOLO11 构建代理 AI 系统的步骤

Fig 5. 如何使用 YOLO11 构建 Agentic AI 系统。图片由作者提供。

Link to this sectionAgentic AI 系统的优缺点#

以下是 Agentic AI 系统能为各行各业带来的一些主要益处:

  • 效率提高: Agentic AI 系统可以自动化复杂、耗时的任务,减少错误并释放人工劳动力,使其能够从事更高价值的工作。

  • 可扩展性: 这些系统可以轻松适应不同行业,并根据需要扩展以处理更大的工作负载。

  • 成本降低: 通过减少对人工劳动的需求并优化运营,Agentic AI 帮助企业削减开支并更有效地利用资源。

虽然 Agentic AI 在不同领域提供了许多好处,但意识到伴随而来的潜在限制也很重要。以下是一些需要牢记的关键担忧:

  • Bias in AI Agentic AI 系统可能会继承训练数据中的偏差,从而导致不公平或不准确的结果,尤其是在招聘和执法等领域。

  • 缺乏透明度: 许多 AI 模型像“黑匣子”一样工作,使得难以理解它们如何做出决策,这在医疗保健和金融等行业可能是一个问题。

  • 监管挑战: Agentic AI 的发展速度快于监管,这造成了法律上的不确定性和全球范围内不一致的合规标准。

总的来说,虽然 Agentic AI 系统有很多优势,但在确保它们被负责任地使用时,平衡其益处与伦理考量、透明度和适当的监管非常重要。

Link to this section关键要点#

当与 YOLO11 等视觉 AI 模型结合使用时,Agentic AI 系统可以改变自动化的工作方式。从自动驾驶汽车到在线购物和医疗保健,这些系统正在帮助企业实现自主运作并提高工作速率。

然而,偏差、缺乏透明度和不明确的监管等挑战仍需解决。随着 Agentic AI 系统的改进,找到创新与责任之间的正确平衡将是充分利用这些创新的关键。

加入我们的 communityGitHub repository 以了解更多关于 AI 的信息。在我们的解决方案页面上探索 AI in manufacturingcomputer vision in healthcare 的各种应用。查看我们的 Ultralytics YOLO licenses 以立即开始使用计算机视觉!

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅