敬请关注 YOLO Vision 2025!
2025年9月25日
英国夏令时 10:00 - 18:00
混合活动
Yolo Vision 2024

将计算机视觉与 Ultralytics YOLO11 集成到机器人技术中

Abirami Vina

5 分钟阅读

2025年3月18日

仔细了解像Ultralytics YOLO11这样的计算机视觉模型如何使机器人更智能,并塑造机器人技术的未来。

自 20 世纪 50 年代发明的第一台工业机器人 Unimate 以来,机器人已经走过了漫长的道路。最初是预编程的、基于规则的机器,现在已经发展成为能够执行复杂任务并与现实世界无缝交互的智能系统。 

如今,机器人被用于从制造业和医疗保健到农业的各个行业,用于各种流程自动化。机器人技术发展的关键因素是 AI 和 计算机视觉,它是 AI 的一个分支,可帮助机器理解和解释视觉信息。

例如,像 Ultralytics YOLO11 这样的计算机视觉模型正在提高机器人系统的智能化水平。当集成到这些系统中时,视觉 AI 使机器人能够识别物体、导航环境并做出实时决策。

在本文中,我们将了解 YOLO11 如何通过先进的计算机视觉功能增强机器人,并探讨其在各个行业的应用。

人工智能和计算机视觉在机器人技术中的概述

机器人的核心功能取决于它对周围环境的理解程度。这种感知将其物理硬件与智能决策联系起来。没有它,机器人只能遵循固定的指令,并且难以适应不断变化的环境或处理复杂的任务。正如人类依靠视觉来导航一样,机器人使用计算机视觉来解释其环境,了解情况并采取适当的行动。

__wf_reserved_inherit
图 1. 一个机器人正在玩井字游戏,它使用计算机视觉来解释棋盘并做出战略性移动。

事实上,计算机视觉是大多数机器人任务的基础。它可以帮助机器人在移动时检测物体并避开障碍物。然而,仅仅看到世界是不够的;机器人还必须能够快速反应。在现实世界中,即使是轻微的延迟也可能导致代价高昂的错误。像 Ultralytics YOLO11 这样的模型使机器人能够实时收集信息并立即做出响应,即使在复杂或不熟悉的情况下也是如此。

了解 Ultralytics YOLO11

在深入探讨YOLO11如何集成到机器人系统之前,我们先来了解一下YOLO11的主要特性。

Ultralytics YOLO 模型支持各种计算机视觉任务,有助于提供快速的实时洞察。特别是,Ultralytics YOLO11 提供了更快的性能、更低的计算成本和更高的准确性。例如,它可以用于高精度地检测图像和视频中的对象,使其非常适合机器人、医疗保健和制造业等领域的应用。 

以下是一些有影响力的功能,使 YOLO11 成为机器人技术的绝佳选择:

  • 易于部署:它易于部署,并且可以无缝集成到各种软件和硬件平台中。
  • 适应性:YOLO11 在不同的环境和硬件设置中都能很好地工作,即使在动态条件下也能提供一致的性能。

用户友好: YOLO11 易于理解的 文档 和界面有助于减少学习曲线,使其易于集成到机器人系统中。

__wf_reserved_inherit
图 2. 使用 YOLO11 分析图像中人物姿态的示例。

探索 YOLO11 支持的计算机视觉任务

以下是 YOLO11 支持的一些计算机视觉任务的详细介绍: 

  • 物体检测:YOLO11 的实时物体检测能力使机器人能够立即识别和定位其视野范围内的物体。这有助于机器人避开障碍物,执行动态路径规划,并在室内和室外环境中实现自动导航。
  • 实例分割:通过识别单个对象的精确边界和形状,YOLO11 使机器人能够执行精确的抓取和放置操作以及复杂的组装任务。
  • 姿势估计:YOLO11 对姿势估计的支持使机器人能够识别和解释人体动作和手势。这对于协作机器人 (cobot) 与人类安全地协同工作至关重要。
  • 物体跟踪YOLO11 可以跟踪移动物体随时间的变化,使其成为与需要实时监控周围环境的自主机器人相关的应用的理想选择。
  • 图像分类:YOLO11 可以对图像中的对象进行分类,从而使机器人能够对物品进行分类、检测异常或根据对象类型做出决策,例如在医疗保健环境中识别医疗用品。
__wf_reserved_inherit
图 3. YOLO11 支持的计算机视觉任务。

机器人技术应用中的人工智能:由 YOLO11 驱动

从智能学习到工业自动化,像 YOLO11 这样的模型可以帮助重新定义机器人可以做什么。它与机器人的集成展示了计算机视觉模型如何推动自动化领域的进步。让我们探讨一下 YOLO11 可以产生重大影响的一些关键领域。

使用计算机视觉教机器人 

计算机视觉广泛应用于 人形机器人 中,使它们能够通过观察环境来学习。像 YOLO11 这样的模型可以通过提供先进的目标检测和姿势估计来帮助加强这一过程,这有助于机器人准确地解释人类的动作和行为。

通过实时分析细微的动作和交互,可以训练机器人复制复杂的人工任务。这使他们能够超越预先设定的程序并学习任务,例如仅通过观看人来使用遥控器或螺丝刀。

__wf_reserved_inherit
图 4. 机器人模仿人类的动作。

这种类型的学习在不同的行业中都很有用。例如,在农业中,机器人可以观察人类工人学习诸如种植、收割和管理作物等任务。通过复制人类完成这些任务的方式,机器人可以适应不同的农业条件,而无需为每种情况进行编程。

与医疗机器人相关的应用

同样,在医疗保健领域,计算机视觉正变得越来越重要。例如,YOLO11 可用于医疗设备中,以帮助外科医生进行复杂的手术。借助目标检测和实例分割等功能,YOLO11 可以帮助机器人发现身体内部结构、管理手术工具并进行精确的移动。

虽然这听起来可能像是科幻小说中的情节,但最近的研究表明了计算机视觉在外科手术中的实际应用。在一项关于用于胆囊切除术(胆囊移除)的自主机器人解剖的有趣研究中,研究人员集成了用于组织分割的 YOLO11(对图像中的不同组织进行分类和分离)和手术器械关键点检测(识别工具上的特定地标)。 

该系统能够准确区分不同的组织类型——即使组织在手术过程中变形(改变形状)——并动态地适应这些变化。这使得机器人仪器可以沿着精确的解剖(外科切割)路径进行操作。

智能制造和工业自动化

可以拾取和放置物体的机器人在自动化制造运营和优化供应链方面发挥着关键作用。它们的速度和准确性使它们能够以最少的人工输入来执行任务,例如识别和分类物品。 

借助 YOLO11 精确的实例分割功能,可以对机械臂进行训练,以检测和分割在传送带上移动的物体,准确地拾取它们,并根据其类型和尺寸将它们放置在指定的位置。

例如,流行的汽车制造商正在使用基于视觉的机器人来组装不同的汽车零件,从而提高装配线的速度和精度。像YOLO11这样的计算机视觉模型可以使这些机器人与人类工人协同工作,确保自动化系统在动态生产环境中无缝集成。这种进步可以缩短生产时间、减少错误并提高产品质量。

__wf_reserved_inherit
图 5. 基于视觉的机械臂正在组装汽车。

在机器人技术中集成 Ultralytics YOLO11 的优势

YOLO11 具有多项关键优势,使其非常适合无缝集成到自主机器人系统中。以下是一些主要优点:

  • 推理延迟:即使在动态环境中,YOLO11 也能以低延迟提供高度准确的预测。
  • 轻量级模型:YOLO11 的轻量级模型专为性能优化而设计,使处理能力较弱的较小型机器人能够拥有先进的视觉功能,而不会牺牲效率。
  • 能源效率: YOLO11在设计上注重能源效率,使其成为需要节省电力同时保持高性能的电池供电机器人的理想选择。

机器人技术中视觉 AI 的局限性

虽然计算机视觉模型为机器人视觉提供了强大的工具,但在将其集成到实际机器人系统中时,仍需考虑一些限制。这些限制包括:

  • 昂贵的数据收集:为特定于机器人的任务训练有效的模型通常需要大量、多样且良好标记的数据集,而这些数据集的获取成本很高。
  • 环境变化:机器人工作在不可预测的环境中,光照条件或杂乱的背景等因素会影响视觉模型的性能。
  • 校准和对齐问题: 确保视觉系统经过适当校准并与机器人的其他传感器对齐,这对于准确的性能至关重要,而未对齐可能会导致决策错误。

机器人和人工智能进步的未来

计算机视觉系统不仅仅是当今机器人的工具,它们还是机器人自主运行的未来基石。凭借其实时检测能力和对多任务的支持,它们非常适合下一代机器人技术

事实上,当前的市场趋势表明,计算机视觉在机器人技术中正变得越来越重要。行业报告强调,计算机视觉是全球 AI 机器人市场中第二大广泛使用的技术。 

__wf_reserved_inherit
图 6. 全球人工智能机器人按技术划分的市场份额。

主要要点

凭借其处理实时视觉数据的能力,YOLO11可以帮助机器人更准确地检测、识别和与其周围环境交互。这在制造业等领域产生了巨大的影响,在这些领域中,机器人可以与人类协作;在医疗保健领域,机器人可以协助完成复杂的手术。 

随着机器人技术的不断进步,将计算机视觉集成到此类系统中对于使机器人能够更有效地处理各种任务至关重要。 机器人技术的未来看起来充满希望,人工智能和计算机视觉将推动更智能、更适应性强的机器。

加入我们的社区,并查看我们的GitHub仓库,以了解更多关于人工智能的最新进展。在我们的解决方案页面上探索人工智能在医疗保健领域计算机视觉在农业领域的各种应用。查看我们的许可计划,以构建您自己的计算机视觉解决方案。

让我们一起构建人工智能的未来!

开启您的机器学习未来之旅

免费开始
链接已复制到剪贴板