深圳Yolo 视觉
深圳
立即加入

利用计算机视觉数据集定制培训Ultralytics YOLO11

Abirami Vina

4 分钟阅读

2025年1月7日

了解Roboflow 集成如何通过轻松访问开源计算机视觉数据集来简化定制培训Ultralytics YOLO11 。

训练计算机视觉模型,如 Ultralytics YOLO11训练计算机视觉模型(如 Ultralytics YOLO11)通常需要为数据集收集图像、注释图像、准备数据并微调模型以满足特定要求。虽然Ultralytics Python 软件包使这些步骤变得简单明了且用户友好,但视觉人工智能的开发仍可能非常耗时。

当您的工作时间紧迫或正在开发原型时,这种情况尤为明显。 在这种情况下,拥有能够简化部分流程(如简化数据集准备或自动执行重复性任务)的工具或集成就能发挥巨大作用。通过减少所需的时间和精力,这些解决方案可以帮助您专注于构建和完善模型。这正是Roboflow 集成所能提供的。

通过Roboflow 集成,您可以轻松访问来自Roboflow Universe 的数据集,这是一个大型开源计算机视觉数据集库。您无需花费数小时来收集和整理数据,而是可以快速找到并使用现有数据集来启动YOLO11 训练流程。这种集成使计算机视觉模型开发的实验和迭代变得更快、更简单。

在本文中,我们将深入探讨如何利用Roboflow 集成加快模型开发。让我们开始吧!

什么是Roboflow Universe?

Roboflow Universe 是一个由Roboflow 维护的平台,Roboflow 是一家致力于简化计算机视觉开发的公司。它包含 3.5 亿多幅图像、50 万个数据集和 10 万个微调模型,可用于物体检测、图像分类和分割等任务。Roboflow Universe 有来自世界各地的开发人员和研究人员的贡献,是任何希望启动或加强计算机视觉项目的人的协作中心。

图 1.Roboflow Universe 上的物体检测数据集示例。

Roboflow Universe 包括以下主要功能:

  • 数据集探索工具:探索、筛选和可视化数据集,以快速找到符合您项目要求的资源。
  • 出口选项:
  • 数据集分析:通过分析工具深入了解各种数据集,这些工具提供标签分布、类别不平衡和数据集质量的可视化。 
  • 版本跟踪:查看和访问贡献者上传的数据集的不同版本,让您可以track 更新、比较变更,并选择最适合您项目需求的版本。 

Roboflow 集成可帮助您找到正确的数据

找到合适的数据集通常是构建计算机视觉模型最具挑战性的部分之一。创建数据集通常涉及收集大量图像,确保它们与您的任务相关,然后准确地标记它们。 

这个过程会占用大量的时间和资源,特别是当你在短时间内尝试不同的方法时。即使是寻找现有的数据集也很棘手,因为它们通常分散在不同的平台上,没有适当的文档记录,或者缺乏你需要的特定注释。

例如,如果您正在构建一个计算机视觉应用程序来detect 农田中的杂草,您可能想测试不同的视觉人工智能方法,如对象检测与实例分割。这样,您就可以在花费时间和精力收集和标注自己的数据集之前,先进行试验,找出哪种方法最有效。

图 2.使用YOLO11 检测汽车零件。

使用Roboflow 集成,您可以浏览各种与农业相关的数据集,包括那些专注于杂草检测、作物健康或田间监测的数据集。这些随时可用的数据集可让您尝试不同的技术并完善您的模型,而无需创建自己的数据。 

如何进行Roboflow 集成

现在,我们已经讨论了如何使用Roboflow 集成来找到正确的数据集,让我们来看看它是如何融入您的工作流程的。从Roboflow Universe 中选择数据集后,您可以导出或下载YOLO11 格式的数据集。数据集导出后,您可以使用Ultralytics Python 软件包对YOLO11 进行自定义训练。 

在下载数据集时,您可能会注意到,Roboflow Universe 还支持其他格式,用于训练不同的模型。那么,为什么要选择自定义训练Ultralytics YOLO11 呢? 

YOLO11 是Ultralytics YOLO 模型的最新版本,旨在提供更快、更准确的物体检测。与YOLOv8m 相比,它使用的参数(模型在训练过程中为进行预测而调整的内部值)减少了 22%,但在COCO 数据集上实现了更高的平均精度mAP)。这种速度与精度的平衡使YOLO11 成为广泛计算机视觉应用的多功能选择,尤其是在定制训练模型以适应特定任务时。

下面我们来看看定制培训YOLO11是如何运作的:

  • 数据输入
    YOLO11
  • 预测与反馈:模型对图像中的对象进行预测,并将其与数据集中提供的正确答案进行比较。
  • 性能跟踪:监控诸如精确率(正确检测)、召回率(漏检)和损失(预测误差)等指标,以评估进度。
  • 迭代学习:模型在多轮(epoch)中调整其参数,以提高检测精度并最大限度地减少误差。
  • 最终模型输出: 训练后,保存优化后的模型并准备好进行部署。

其他专注于计算机视觉开发的集成

在探索Roboflow 集成的过程中,您会注意到Ultralytics 文档中提到的其他集成。我们支持与计算机视觉开发不同阶段相关的各种集成。 

这是为了向我们的社区提供一系列选择,以便您可以选择最适合您特定工作流程的方案。

图 3. Ultralytics 支持的集成概述。

除了数据集之外,Ultralytics其他集成还侧重于计算机视觉过程的各个部分,如训练、部署和优化。以下是我们支持的其他集成的几个例子:

  • 培训集成: Amazon SageMaker 和Paperspace Gradient 等集成可为高效的模型开发和测试提供基于云的平台,从而简化培训工作流程。
  • 工作流和实验跟踪集成: ClearML、MLFlow 和Weights & Biases (W&B) 可帮助实现工作流自动化、track 实验和改进协作,从而更轻松地管理机器学习项目。
  • 优化和部署集成: CoreML、ONNX 和OpenVINO 可实现跨各种设备和框架的优化部署,确保在苹果硬件和Intel CPU 等平台上实现高效性能。
  • 监控和可视化集成: TensorBoard 和Weights & Biases 提供了可视化训练进度和监控性能的工具,为完善模型提供了详细的见解。

YOLO11 应用和集成的作用

支持计算机视觉开发的集成与YOLO11 的可靠功能相结合,使解决现实世界的挑战变得更加容易。考虑到计算机视觉在制造业中的创新,视觉人工智能可用于detect 生产线上的缺陷,如金属部件上的划痕或丢失的组件。为此类任务收集正确的数据通常既缓慢又具有挑战性,需要进入专门的环境。 

它通常涉及沿生产线设置摄像头或传感器来捕获产品的图像。这些图像需要大量拍摄,通常在一致的光照和角度下进行,以确保清晰度和均匀性。 

图像捕获后,必须使用精确的标签对每种缺陷(如划痕、凹痕或缺失的组件)进行细致的标注。这个过程需要大量的时间和资源,以及专业知识,以确保数据集准确地反映真实世界的各种变化。必须考虑不同缺陷的大小、形状和材料等因素,以创建强大而可靠的数据集。

提供现成数据集的集成可促进工业质量控制等任务,而借助YOLO11的实时检测能力,制造商可以监控生产线,即时发现缺陷并提高效率。

图 4.使用Ultralytics YOLO11 detect 和计数正在生产的易拉罐的示例。

除制造业外,与数据集相关的集成还可用于许多其他行业。通过将YOLO11的速度和准确性与易于访问的数据集相结合,企业可以快速开发和部署符合其特定需求的解决方案。以医疗保健为例,数据集集成有助于开发解决方案,分析医疗图像,detect 肿瘤等异常情况。同样,在自动驾驶领域,这种集成可以帮助识别车辆、行人和交通标志,从而提高安全性。

主要要点

寻找合适的数据集通常是建立计算机视觉模型最耗时的部分之一。然而,Roboflow 集成可以让您更轻松地找到最佳数据集,用于定制训练您的Ultralytics YOLO 模型,即使您是计算机视觉领域的新手也不例外。 

Roboflow Universe 可以访问大量用于计算机视觉任务(如物体检测、图像分类或实例分割)的数据集,让数据发现过程不再麻烦。它能帮助您快速上手,专注于构建模型,而不是花时间收集和整理数据。这种简化的方法使开发人员能够更高效地构建原型、迭代和开发计算机视觉解决方案。

要了解更多信息,请访问我们的 GitHub 存储库并与我们的社区互动。在我们的解决方案页面上探索自动驾驶汽车中的 AI农业中的计算机视觉等领域的创新。🚀

让我们一起构建人工智能的未来!

开启您的机器学习未来之旅

免费开始