敬请关注 YOLO Vision 2025!
2025年9月25日
英国夏令时 10:00 - 18:00
混合活动
Yolo Vision 2024

如何使用 Ultralytics YOLO11 进行目标检测

Abirami Vina

3 分钟阅读

2024年11月29日

探索如何使用新的 Ultralytics YOLO11 模型进行目标检测,从而在各个行业的一系列应用中实现更高的精度。

计算机视觉是人工智能 (AI) 的一个领域,可帮助机器解释和理解视觉信息,从而实现物体检测等基本任务。与图像分类不同,物体检测不仅可以识别图像中的物体,还可以精确定位它们的确切位置。这使其成为视觉人工智能应用(如自动驾驶汽车、实时安全系统和仓库自动化)的关键工具。

随着时间的推移,对象检测技术变得更加先进和易于使用。Ultralytics在年度混合活动YOLO Vision 2024 (YV24)上宣布了一项重大进展,推出了Ultralytics YOLO11模型。YOLO11提高了准确性和性能,同时支持与YOLOv8相同的任务,从而使以前的模型的用户可以轻松地无缝过渡。

图 1. 使用 Ultralytics YOLO11 模型进行目标检测的示例。

在本文中,我们将分解什么是目标检测,它与其他计算机视觉任务有何不同,并探讨它的实际应用。我们还将引导您了解如何将 YOLO11 模型与 Ultralytics Python 包Ultralytics HUB 平台 结合使用。让我们开始吧!

​​什么是目标检测?

物体检测 是计算机视觉中的一项核心任务,它不仅仅是识别图像中的物体。 与仅确定是否存在特定物体的图像分类不同,物体检测可以识别多个物体,并使用边界框精确定位它们的确切位置。 

例如,它可以识别和定位集体照中的人脸、繁忙街道上的汽车或商店货架上的产品。目标识别和定位的结合使其特别适用于监控、人群监控和自动化库存管理等应用。

图 2. 使用 YOLO11 检测人脸。

与其他任务(如语义或 实例分割)相比,目标检测的独特之处在于其关注的焦点和效率。 

语义分割标记图像中的每个像素,但不区分同一类型的各个对象(例如,照片中的所有人脸都将归为“人脸”)。实例分割 通过分离每个对象并勾勒出其确切形状(即使对于同一类别的对象)来进一步实现这一点。 

然而,物体检测提供了一种更简化的方法,通过识别和分类物体,同时标记它们的位置。这使其成为实时任务的理想选择,例如检测安全录像中的人脸或识别自动驾驶汽车的障碍物。

YOLO11 和目标检测的应用

YOLO11 先进的目标检测功能使其在许多行业中都非常有用。让我们看一些例子。

使用 YOLO11 进行零售分析

YOLO11 和对象检测正在通过提高库存管理和货架监控的效率和准确性来重新定义零售分析。该模型快速可靠地检测对象的能力有助于零售商跟踪库存水平、整理货架并减少库存盘点中的错误。

例如,YOLO11 可以检测商店货架上的特定商品,例如太阳镜。但是,零售商为什么要监控货架呢?保持货架库存充足和井井有条对于确保顾客能够找到他们需要的商品至关重要,这直接影响销售额。通过实时监控货架,零售商可以快速发现商品何时短缺、错放或过度拥挤,从而帮助他们保持有条不紊且具有吸引力的展示,从而改善购物体验。

图 3. 使用 YOLO11 检测货架上商品的示例。

YOLO11 在智慧城市应用中的应用

一个繁华的城市依靠畅通的交通和安全的街道才能高效运作,而 YOLO11 可以帮助实现这一目标。 事实上,许多智慧城市应用都可以与 YOLO11 集成。 

一个有趣的案例是使用对象检测来识别移动车辆上的车牌。通过这样做,YOLO11 可以支持更快的收费、更好的交通管理和更快的法规执行。 

图 4. 使用目标检测和 YOLO11 检测车牌。

通过视觉 AI 系统对道路进行监控所获得的洞察,可以在交通违规或拥堵升级为更大问题之前,提醒有关部门。YOLO11 还可以检测行人和骑自行车的人,使街道对每个人来说更安全、更高效。 

事实上,YOLO11 处理视觉数据的能力使其成为改善城市基础设施的强大工具。例如,它可以通过分析车辆和行人的移动来帮助优化交通信号灯的配时。它还可以通过检测儿童并提醒驾驶员减速来提高学校区域的安全性。借助 YOLO11,城市可以采取积极措施来应对挑战,并为每个人创造更高效的环境。

基于 YOLO11 的实时视频检测:提高可访问性

实时目标检测是指系统在实时视频流中识别和分类物体的能力。YOLO11 专为卓越的实时性能而设计,并擅长支持此功能。它的应用不仅限于简化流程,还可以帮助创建一个更具包容性和可访问性的世界。

例如,YOLO11 可以通过实时识别物体来帮助视力受损的人。根据检测结果,可以提供音频描述,这有助于用户更加独立地导航周围环境。

考虑一个视力受损的人购买杂货。挑选合适的商品可能具有挑战性,但 YOLO11 可以提供帮助。当他们将商品放入购物车时,与 YOLO11 集成的系统可以用于识别每件商品——如香蕉、鳄梨或一盒牛奶——并提供实时音频描述。这使他们能够确认自己的选择并确保他们拥有所需的一切。通过识别日常用品,YOLO11 可以简化购物流程。

图 5. 目标检测可以帮助视障人士更轻松地访问世界。

使用 YOLO11 进行目标检测的分步指南 

既然我们已经介绍了目标检测的基础知识及其各种应用,现在让我们深入了解如何开始使用 Ultralytics YOLO11 模型来执行目标检测等任务。

使用 YOLO11 有两种直接的方式:通过 Ultralytics Python 包或 Ultralytics HUB。让我们从 Python 包开始,探索这两种方法。

使用 YOLO11 运行推理

推理是指 AI 模型分析新的、未见过的数据,以根据其在训练期间学到的知识进行预测、分类信息或提供见解。对于目标检测而言,这意味着识别和定位图像或视频中的特定目标,在它们周围绘制边界框,并根据模型的训练对其进行标记。

要使用 YOLO11 目标检测模型进行推理,您首先需要通过 pip、conda 或 Docker 安装 Ultralytics Python 包。如果您遇到任何安装问题,请查看故障排除指南,获取帮助您解决问题的技巧和窍门。安装完成后,您可以使用以下代码加载 YOLO11 目标检测模型并对图像进行预测。

图 6. 使用 YOLO11n 在图像上运行推理。

训练自定义 YOLO11 模型

YOLO11 还支持 自定义训练,以更好地适应您的特定用例。通过微调模型,您可以定制它来检测与您的项目相关的对象。例如,在医疗保健领域使用计算机视觉时,可以利用经过自定义训练的 YOLO11 模型来检测医学图像中的特定异常情况,例如 MRI 扫描中的肿瘤或 X 射线中的骨折,从而帮助医生做出更快、更准确的诊断。

下面的代码片段展示了如何加载和训练用于目标检测的 YOLO11 模型。您可以从 YAML 配置文件或预训练模型开始,迁移权重,并在诸如 COCO 之类的数据集上进行训练,以获得更精细的目标检测能力。

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.yaml")  # build a new model from YAML
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)
model = YOLO("yolo11n.yaml").load("yolo11n.pt")  # build from YAML and transfer weights

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

训练模型后,您还可以将训练好的模型导出为各种格式,以便在不同的环境中部署。

Ultralytics HUB 上的 YOLO11 目标检测

对于那些寻找无代码替代方案的人,Ultralytics HUB 提供了一个易于使用的视觉 AI 平台,用于训练和部署 YOLO 模型,包括 YOLO11。

要在图像上运行对象检测,只需创建一个帐户,导航到“模型”部分,然后选择 YOLO11 对象检测模型变体。 上传您的图像,平台将在预览部分显示检测到的对象。

图 7. 在 Ultralytics HUB 上运行推理。

通过将Python包的灵活性与HUB的易用性相结合,YOLO11使开发人员和企业能够轻松利用先进的目标检测技术。

主要要点

YOLO11 树立了目标检测的新标准,它将高精度与多功能性相结合,以满足各行各业的需求。从增强零售分析到管理智慧城市基础设施,YOLO11 专为各种应用的实时、可靠性能而打造。

通过自定义训练选项和 Ultralytics HUB 提供的易于使用的界面,将 YOLO11 集成到您的工作流程中从未如此简单。无论您是探索计算机视觉的开发人员,还是希望通过 AI 进行创新的企业,YOLO11 都能为您提供成功所需的工具。

要了解更多信息,请查看我们的GitHub存储库,并与我们的社区互动。 在我们的解决方案页面上探索自动驾驶汽车农业计算机视觉中的AI应用。 🚀

让我们一起构建人工智能的未来!

开启您的机器学习未来之旅

免费开始
链接已复制到剪贴板