深圳尤洛视觉
深圳
立即加入

Agentic AI 和计算机视觉:自动化的未来

Abirami Vina

4 分钟阅读

2025年2月12日

探索 Agentic AI 系统如何使用计算机视觉模型自主分析视觉数据、从经验中学习并适应不断变化的环境。

人工智能 (AI) 和计算机视觉帮助机器看到和理解世界。 感谢最近的进步,我们现在正在见证一个飞跃——AI 创新不仅可以感知,还可以独立思考、计划和行动。 在之前的一篇文章中,我们讨论了视觉代理如何处理视觉数据、分析数据并采取行动。 

今天,我们将探讨一个类似的概念:Agentic AI。 Agentic AI 系统旨在独立运行,并具有类似人类的推理和解决问题的能力,以实现既定目标。 与专注于使用预定义指令完成单个任务的传统 AI 系统不同,Agentic AI 可以自主计划和行动以执行任务。 这些代理甚至可以从以前的交互中学习,并在没有任何人为干预的情况下执行决策。 

在计算机视觉方面,Agentic AI 系统可以利用诸如使用像 Ultralytics YOLO11 这样的计算机视觉模型进行目标检测等技术来实时分析视觉数据、识别对象、理解空间关系,并根据其环境做出自主决策。

什么是 Agentic AI?

Agentic AI 系统的核心设计理念是自主、目标导向的思维、自适应问题解决和持续学习能力。 它们使用 AI 代理来理解其环境、做出决策和执行任务。 这些 AI 代理使用计算机视觉模型、强化学习技术和大型语言模型 (LLM) 来执行复杂的任务。 这使得它们非常适合自动化业务工作流程和增强决策能力。

例如,在仓库中,配备计算机视觉的 Agentic AI 系统可以检测包裹、跟踪库存并在没有人工干预的情况下避开障碍物。 通过使用强化学习,它可以随着时间的推移提高其移动效率,学习避免拥堵的最佳路线。 同时,由 LLM 驱动的聊天机器人可以通过回答查询和提出运营改进建议来协助工人,从而使整个工作流程更加高效。

__wf_reserved_inherit
图 1. Agentic AI 的工作原理概述。

传统 AI 解决方案和 Agentic AI 解决方案之间的主要区别在于,Agentic AI 可以提前思考并适应不断变化的情况。 传统的计算机视觉系统非常适合识别对象或分类图像,但它们无法动态调整其行为。 它们需要人工干预来帮助重新训练或微调模型。 同时,Agentic AI 使用先进的机器学习技术,通过与其环境交互来随着时间的推移进行改进。

将 Agentic AI 与其他先进的 AI 创新进行比较

AI 正在快速发展,生成式 AI、Agentic 自动化和计算机视觉等新概念正在各个行业中迅速采用。 让我们比较这些技术,以更好地了解 Agentic AI 的独特之处。

生成式 AI 和 Agentic AI 之间的区别

如果您使用过像 ChatGPT 这样的工具,您就已经熟悉生成式 AI。 这个 AI 分支专门根据用户提示创建内容,例如文本、图像或代码。 虽然生成式 AI 增强了创造力和想法探索,但它遵循学习到的模式并在预定义的约束范围内运行,缺乏做出自主决策或追求独立目标的能力。

相比之下,Agentic AI 积极追求目标。 它可以动态地适应其环境,而无需持续的人工输入。 它不仅生成内容,还采取行动并自主解决问题。

自主自动化和自主 AI 密切相关。

自主自动化和自主 AI 相辅相成,自主 AI 为自动化提供智能支持。以基于计算机视觉的安全系统为例。 

自主 AI 系统分析情况,决定最佳响应,并自行采取行动。例如,如果集成了计算机视觉的 AI 安全摄像头 发现入侵者,自主 AI 系统不仅仅是发送警报,还会检查此人是否为员工,必要时锁定门,跟踪他们的移动,甚至发送无人机来监视他们。

自主自动化确保所有这些操作协同工作。它连接不同的系统,如安全摄像头、门锁和无人机,以便它们可以自动且同步地响应。虽然自主 AI 做出决策,但自主自动化确保这些决策在无需人工干预的情况下高效执行。 

__wf_reserved_inherit
图 2. 自主 AI 和自主自动化对比。图片由作者提供。

自主 AI 的工作原理

既然我们对自主 AI 有了更好的了解,接下来让我们探讨一下它的工作原理。 

自主 AI 系统通过感知、决策、行动和适应的循环过程运作,帮助它们随着时间的推移进行学习和改进。这种持续的循环使这些系统能够独立运作并实现复杂的目标。

以下是持续循环中涉及的步骤的快速浏览:

  • 感知:自主 AI 系统从摄像头、传感器和用户交互中收集和分析数据,以更好地了解其周围环境。
  • 决策:系统评估不同的选项,预测可能的结果,并根据推理和风险评估选择最佳行动方案。
  • 行动:一旦做出决定,系统通过控制物理设备、与其他系统交互或生成输出来执行任务。
  • 适应:系统通过使用反馈从经验中学习,应用机器学习和强化学习来提高性能,尤其是在更复杂的任务上。
__wf_reserved_inherit
图 3. 了解自主 AI 的工作原理。

自主 AI 的实际应用

接下来,让我们来看一些自主 AI 在实际应用中的例子。这些系统被应用于不同的行业,帮助机器分析数据并做出独立的决策,从而提高结果。

自主 AI 在药物发现中的应用

药物发现涉及几个关键阶段,从识别与疾病相关的生物靶点到筛选潜在化合物、优化其化学结构以及进行临床前测试。这是一个复杂且耗时的过程,需要大量的数据分析和实验才能找到有效且安全的治疗方法。

与计算机视觉集成的自主 AI 正在帮助自动化化学合成等关键步骤,从而使过程更快、更高效。化学合成是通过受控反应将不同的化合物组合起来以创造新物质(如药物)的过程。传统上,科学家必须通过反复试验手动调整温度、溶剂组成和结晶时间等因素。

现在,自主 AI 系统可以实时监控反应,分析颜色变化或晶体形成等视觉变化,并当场做出决策。例如,如果系统检测到反应未按预期进行,它可以立即调整温度或添加必要的化学物质以优化过程。通过不断从过去的反应中学习,系统可以提高其准确性,减少人工干预的需要并加快药物开发。

__wf_reserved_inherit
图 4. 自动化实验室设置示例。

利用自主 AI 重塑电子商务

自主 AI 正在通过使体验更加个性化、高效和自动化来改变我们在线购物的方式。自主 AI 不仅仅是根据过去的购买情况推荐产品,还可以分析浏览习惯,预测客户接下来可能想要什么,并实时调整产品建议。 

在计算机视觉的帮助下,自主 AI 还可以分析视觉搜索,识别产品图像以提供更准确的推荐。例如,如果有人经常查看运动鞋,自主 AI 系统可以突出显示潮流款式、提供折扣或推荐搭配的配饰。它还可以根据需求优化定价和促销活动,使购物更具活力。

除了推荐之外,自主 AI 还在通过管理库存、预测补货和自动化订单履行来改善电子商务物流。计算机视觉使自主 AI 系统能够实时跟踪库存水平,识别放错位置的商品,并确保产品得到正确分类。如果某个商品销售迅速,系统可以触发补货或建议替代品。通过不断学习和适应,自主 AI 正在使在线购物对于客户和企业而言都更加快速、智能和无缝。

如何构建自主AI系统 

既然我们已经了解了自主AI的实际应用案例,接下来让我们讨论如何构建一个。 

如果您正在开发基于计算机视觉的应用程序,使用最新的模型(如Ultralytics YOLO11)可以帮助您的自主AI系统更好地理解周围环境。凭借其对各种计算机视觉任务的支持,YOLO11可以使自主AI系统能够准确地分析视觉数据。

以下是如何使用YOLO11构建自主AI系统:

  • 定义目标:清晰地概述AI代理的目的、目标以及它需要执行的特定任务,以实现其预期功能。
  • 训练YOLO11:收集相关的图像和视频数据,对其进行标注,并根据您的特定应用自定义训练YOLO11。
  • 集成YOLO11:将YOLO11与AI框架连接,从而能够基于检测到的视觉数据进行实时分析和决策。
  • 实现自主决策:设置逻辑或机器学习模型,使AI代理能够根据YOLO11的检测结果采取行动,例如触发警报、调整设置或引导机器人系统。
  • 加入反馈循环:实施一个自学习系统,YOLO11可以通过使用新数据重新训练来提高其准确性,从而随着时间的推移提高其模型性能。
__wf_reserved_inherit
图5. 如何使用YOLO11构建自主AI系统。图片由作者提供。

自主AI系统的优缺点

以下是自主AI系统可以为各个行业带来的一些主要优势:

  • 提高效率:自主AI系统可以自动执行复杂的、耗时的任务,减少错误,并将人类员工解放出来,从事更高价值的工作。
  • 可扩展性:这些系统可以轻松适应不同的行业,并根据需要扩展以处理更大的工作负载。
  • 降低成本:通过减少对人工的需求和优化运营,自主AI有助于企业削减开支并更有效地利用资源。

虽然自主AI在不同领域提供了许多好处,但了解它可能存在的局限性也很重要。以下是一些需要注意的关键问题:

  • AI中的偏见自主AI系统可能会从训练数据中继承偏见,从而导致不公平或不准确的结果,尤其是在招聘和执法等领域。
  • 缺乏透明度:许多AI模型的工作方式类似于“黑盒”,使得难以理解它们如何做出决策,这在医疗保健和金融等行业中可能是一个问题。
  • 监管挑战:自主AI的发展速度快于监管,造成了法律上的不确定性和不一致的全球合规标准。

总的来说,虽然自主AI系统有很多优势,但重要的是要在其益处与道德考量、透明度和适当的监管之间取得平衡,以确保它们得到负责任的使用。

主要要点

当与YOLO11等视觉AI模型结合使用时,自主AI系统可以改变自动化的工作方式。从自动驾驶汽车到在线购物和医疗保健,这些系统帮助企业以自主和更快的速度工作。 

然而,诸如偏见、缺乏透明度和不明确的法规等挑战仍然需要解决。随着自主AI系统的改进,在创新和责任之间找到适当的平衡将是充分利用这些创新的关键。

加入我们的社区GitHub存储库,以了解更多关于AI的信息。在我们的解决方案页面上探索AI在制造业中的各种应用计算机视觉在医疗保健中的应用。查看我们的Ultralytics YOLO许可,立即开始使用计算机视觉!

让我们一起构建人工智能的未来!

开启您的机器学习未来之旅

免费开始
链接已复制到剪贴板