遇见 YOLO26: 下一代视觉 AI。
Ultralytics
Ultralytics 平台

使用 Ultralytics Platform 更快地训练 YOLO 模型

了解如何使用 Ultralytics Platform 更快地训练 YOLO 模型,这是一个旨在加速从数据到部署路径的端到端环境。

ABAbirami Vina
7 min read
使用 Ultralytics Platform 更快地训练 YOLO 模型

上周,Ultralytics 推出了 Ultralytics Platform,这是一个统一的工作空间,旨在简化团队构建、训练和部署计算机视觉模型的方式。无需再东拼西凑使用多种工具,该平台将所有一切汇集于一处。从构思到部署视觉 AI 模型变得轻松无忧。

这一点至关重要,因为计算机视觉正在迅速成为各行各业的核心组成部分。它为制造检测、零售分析和自动导航等应用提供了动力。

将这些具备视觉功能的应用转化为可靠的系统,取决于模型的训练效果。模型训练涉及从标注数据中学习,以便模型能够识别模式并做出准确预测。通常情况下,训练有素的模型在现实应用中会带来更好的性能和更可靠的结果。

然而,训练计算机视觉模型并不总是直截了当的。它包含多个方面,例如设置环境、选择合适的计算资源、调整超参数以及跟踪多个训练实验。当这些步骤分散在不同的工具和系统中时,训练工作流很快就会变得复杂且难以管理。

Ultralytics Platform 通过将整个训练过程统一到一个单一的仪表板中解决了这个问题。无论你是在云端、本地还是 Google Colab 上工作,都可以在一个地方配置、运行和监控训练任务。

Ultralytics Platform 内的模型训练

图 1. Ultralytics Platform 内模型训练的一瞥 (来源)

在本文中,我们将探讨 Ultralytics Platform 如何简化 模型训练,以及为什么它能为你的视觉 AI 项目提供优势。让我们开始吧!

Link to this section计算机视觉模型通过模型训练从数据中学习#

在深入了解模型训练如何在 Ultralytics Platform 上工作之前,让我们先退后一步,了解什么是模型训练以及它包含哪些内容。

模型训练是计算机视觉模型学习解读视觉数据的过程。它分析图像或视频,并逐渐调整其内部参数,以准确执行 视觉任务,如目标检测、图像分类和实例分割。随着时间的推移,模型通过直接从所见数据中学习模式来不断改进。

训练的质量在很大程度上取决于数据集。你可以将数据集看作老师用来训练学生的一套抽认卡,其中的每个示例都能帮助模型学习观察重点。

一个典型的计算机视觉数据集包含图像(通常为 JPG 或 PNG 格式)和描述每张图像内容的标注。这些标注通常以 JSON 或 TXT 文件形式存储,提供了模型有效学习所需的标签和上下文。

但训练不仅仅是将数据输入模型。它涉及几个关键步骤,从准备数据集到选择合适的模型,再到配置训练过程。接下来,让我们仔细看看其中几个步骤。

Link to this section数据集准备过程概览#

看起来一旦你有了数据集,就可以立即开始训练模型,但你首先需要采取几个步骤,例如拆分数据集。

通常,数据集分为三个部分:训练集、验证集和测试集。训练图像用于教模型数据中的模式,而验证集有助于在训练期间监控和微调性能。

测试集在最后用于评估模型在全新的、未见过的数据上的表现。这种设置有助于确保模型不仅仅是记忆数据,而是能够泛化到现实世界的场景中。

Link to this section为训练选择合适的模型#

训练前的另一个重要步骤是选择你要使用的模型。在许多情况下,这意味着选择一个预训练模型。像 Ultralytics YOLO 模型这类模型已经在大型数据集上进行了训练,并学习了通用的视觉模式,这使它们成为一个强大的起点。

使用这些模型是迁移学习的一个例子,即你在现有知识的基础上构建,并使模型适应你的特定任务。这种方法有助于加快训练速度并提高结果,特别是在数据有限的情况下。

这些模型也有不同的大小,每个模型都在速度和准确性之间提供了权衡。较小的模型更快、更高效,而较大的模型往往能提供更高的准确性,但需要更多的计算资源。

Link to this section配置视觉模型的训练参数#

在准备好数据集并选择了模型之后,下一步就是配置模型的学习方式。

计算机视觉模型通过一组参数进行训练,这些参数决定了它如何处理数据、更新权重以及随时间改进。这些设置直接影响训练速度和最终准确性,因此对于获得强大的结果至关重要。

以下是一些最常用的训练参数:

  • Epochs(轮次):它代表模型在训练期间遍历整个数据集的次数。增加轮次可以让模型有更多机会从数据中学习模式。
  • Batch size(批大小):这是在单个训练步骤中一起处理的图像数量。较大的批大小可以加快训练速度,但需要更多的内存。
  • Image size(图像大小):它指定了训练期间使用的输入图像的分辨率。更高的分辨率可能会提高检测准确性,但会增加计算成本。
  • Learning rate(学习率):这是模型在训练期间更新其内部参数的比率。过高或过低的值都会使训练变得不稳定。
  • Optimizer(优化器):这是负责根据每次训练迭代中计算出的误差来更新模型参数的算法。

在基于 Ultralytics YOLO 的工作流中,这些配置通常在 YAML 文件中定义。该文件指定了数据集路径、类名称以及数据拆分方式。它作为一种中心化配置,告诉模型如何解读数据集。

Link to this section从零散的工作流到 Ultralytics Platform 的统一体验#

我们刚刚讨论了训练计算机视觉模型涉及的一些关键步骤,从准备数据集到选择模型和配置训练参数。在实践中,这个过程通常会进一步深入,包括跟踪实验、比较多个训练运行以及随着时间的推移持续改进模型。

这些步骤很少在同一个地方完成。数据集可能在一个工具中准备,训练任务在另一个环境中执行,实验跟踪又单独管理。随着项目的增长,这种碎片化增加了复杂性,降低了迭代速度,并使保持一切井井有条变得更加困难。

Ultralytics Platform 通过将整个训练工作流带入一个环境来消除这种复杂性。你无需在不同工具之间切换,可以在一个地方管理数据集、配置训练、运行实验并监控结果。

接下来,让我们深入了解 Ultralytics Platform 如何让模型训练变得更智能。

Link to this sectionUltralytics Platform 支持的训练选项#

在现实应用中,训练计算机视觉模型通常需要灵活的环境。根据数据集的大小、模型的复杂性以及可用硬件的情况,你可以选择在云端、本地机器或通过外部笔记本环境进行训练。

Ultralytics Platform 支持以下训练选项以满足这些需求:

  • 云训练:训练在 Ultralytics 管理的云端 GPU 上运行。此选项非常适合需要大量计算资源的大型数据集或更复杂的模型。
  • 本地训练:此选项使用你机器上可用的硬件,非常适合快速实验、测试配置或处理较小的数据集。对于更具扩展性的工作负载,也可以在你自己的云环境(例如 AWS 或 GCP)中进行训练。
  • Google Colab:使用 Ultralytics Platform,你可以在 Google Colab 的托管笔记本环境中运行训练,从而实现灵活的、基于浏览器的、无需配置本地机器的工作流。

Link to this section探索 Ultralytics Platform 上的云训练#

在计算机视觉项目中,本地训练模型或通过笔记本环境训练模型并不总是那么容易。

例如,在本地训练时,性能完全取决于你的硬件,这可能会限制计算能力并减慢实验速度。GPU 对于高效训练至关重要,但并非所有设置都能可靠地访问它们。

虽然像 Google Colab 这样的笔记本环境通过提供云端 GPU 提供了替代方案,但会话通常是临时的,可能会中断较长的训练任务。随着数据集的增长和工作流变得更加复杂,这些限制会迅速成为瓶颈,使训练变得更慢且可靠性降低。

Ultralytics Platform 通过其云训练选项解决了这个问题。它提供了一个现成的环境,其中预配置了 Python 依赖项和像 PyTorch 这样的框架,使你无需额外设置即可开始训练。

从一个单一的仪表板,你可以启动训练任务并实时监控进度。这使你能够更容易地专注于改进模型,而不是管理基础设施。

现在,让我们看看如何开始在 Ultralytics Platform 上使用云训练。

Link to this section第一步:选择基础模型#

第一步是为你的训练任务选择一个基础模型。你可以选择一个预训练的 Ultralytics YOLO 模型,克隆一个社区模型,或者上传你自己的预训练权重以满足自定义需求。

该平台支持所有 Ultralytics YOLO 模型,包括 Ultralytics YOLO26Ultralytics YOLO11Ultralytics YOLOv8Ultralytics YOLOv5,每种模型都提供不同的尺寸变体,如 nano (n)、small (s)、medium (m)、large (l) 和 extra-large (x)。由于不同的模型变体在速度和准确性之间提供了权衡,你可以选择一个符合你的性能和计算要求的模型。

这些模型支持 Ultralytics YOLO 用户已经熟悉的各种计算机视觉任务,包括目标检测、实例分割、图像分类、定向包围盒 (OBB) 检测和姿态估计。

如果你有自定义需求,也可以上传自己的预训练模型权重。这意味着你可以在平台内继续训练或微调现有的模型(如目标检测器),而不是从头开始。如果你已经在其他地方训练过模型,或者想让模型适应更具体的用例,这将特别有用。

Link to this section第二步:选择数据集#

下一步是选择用于训练的数据集。在 Ultralytics Platform 上,你可以使用现有的数据集(如 COCO 数据集)、从社区克隆数据集,或者上传为你特定应用量身定制的自定义数据集。

该平台支持常见的标注格式,如 Ultralytics YOLO 和 COCO,如果你打算直接在平台上 标注自定义数据,它还可以处理原始图像上传。

上传后,数据集会被自动处理,包括验证、归一化、标签解析和统计数据生成。这让你能够即时了解数据情况,包括类分布和数据集结构,并有助于确保一切准备就绪,可供训练使用。

数据集也会自动链接到训练任务,让你能够跟踪每个模型使用了哪些数据,并保持实验之间的一致性。

Link to this section第三步:配置训练参数#

选择数据集后,你可以配置控制模型学习方式的训练参数。这些包括轮次、批大小、图像大小以及训练日志的运行名称。许多这些参数会影响训练持续时间和模型的最终性能。

为了进行更可控的训练,该平台还允许你调整高级参数,例如学习率、优化器类型、颜色增强设置以及其他训练选项。这些设置可以微调训练过程,以提高模型的准确性和稳定性。

Link to this section第四步:选择 GPU#

接下来,你可以为训练任务选择 GPU 配置。选择正确的 GPU 取决于数据集大小、批大小、图像分辨率和模型复杂性等因素。找到合适的平衡点有助于保持训练效率,同时避免使用超过所需的计算资源。

Ultralytics Platform 提供 22 种 GPU 选项,具有不同级别的 VRAM(GPU 上的内存)和计算能力,支持从小型任务到大规模工作负载的一切需求。

通过此功能,你可以根据自己的特定需求匹配硬件,无论你是训练轻量级模型还是处理大型复杂数据集。要了解更多信息,请查看 Ultralytics 平台训练文档 页面上提供的 GPU 列表。

通过 Ultralytics Platform 可用的 GPU 选项

图 2. 通过 Ultralytics Platform 启用的部分 GPU 选项 (来源)

Link to this section第五步:开始云训练#

一旦你选择了模型、数据集、训练参数和计算选项,启动训练任务非常快捷。从仪表板上,你可以一键启动训练,平台负责处理剩下的工作,包括初始化环境并在所选 GPU 上运行任务。

训练开始后,你可以直接在平台内监控进度。Train(训练)选项卡提供关键指标的实时可见性,包括性能指标、损失曲线、系统使用情况和实时训练日志。

要了解有关本地训练或在 Ultralytics Platform 上使用 Google Colab 的更多信息,你可以浏览官方 Ultralytics 平台文档 中的更多教程。

Link to this section在 Ultralytics Platform 上评估和比较模型#

训练完成后,下一步是评估模型的性能。在 Ultralytics Platform 上,你可以在一个项目内比较多个训练任务,从而清楚地了解不同实验的执行效果。

在开发模型时,训练通常会使用不同的设置(例如更改学习率、批大小或模型大小)重复多次,以改善结果。这些运行中的每一个都会产生一个略有不同的模型,这就是为什么比较它们至关重要。

项目充当了一个中心枢纽,将模型和实验组织在一起。你可以跟踪进度、查看结果,并在无需切换不同工具或视图的情况下保持专注。

从这个统一视图中,你还可以分析关键性能指标,如精确率、召回率和 mAP(平均精度均值),以了解模型在不同类别上的表现。你还可以并排比较训练任务,以确定哪些配置能提供最好的结果。

为了补充这些指标,你可以使用 Predict(预测)选项卡快速在样本图像或数据上测试训练后的模型,这有助于你直观地验证性能并发现潜在问题。

有了这些洞察,你可以选择性能最好的模型(通常保存为“best.pt”检查点)并进入下一个阶段,无论是进一步评估、使用该模型运行推理,还是通过平台进行模型部署。

在 Ultralytics Platform 上查看训练指标

图 3. 在 Ultralytics Platform 上查看指标的示例 (来源)

Link to this section在 Ultralytics Platform 内估算训练成本#

在云端训练目标检测模型会产生计算成本,特别是当你使用高性能 GPU 时。为了提供更多便利,Ultralytics Platform 在训练开始前提供成本估算。

它为你提供了对预期使用量的清晰可见性,帮助你在启动训练任务前规划工作负载、管理预算并避免意外支出。以下是你如何在开始训练前查看预估成本的方法。

Link to this section训练时间是如何估算的#

为了准确估算成本,平台首先会计算单个训练轮次需要多长时间。这取决于数据集大小、模型大小、图像分辨率、批大小以及所选 GPU 的速度等因素。

使用这些输入,它确定每轮的预估时间并将其缩放到完整的训练运行中。总持续时间是通过将所有轮次的时间与少量的启动开销相结合来计算的。

开销占用了初始化环境、加载数据集和准备 GPU 等任务的时间,确保估算结果反映了完整的训练过程,而不仅仅是训练循环。

Link to this section训练成本是如何计算的#

一旦预估出总训练时间,平台就会使用所选 GPU 的小时费率将其转换为成本。

通过将训练持续时间与 GPU 定价相结合,我们可以在任务开始前就得到一份关于运行成本的明确估算。

拥有前期可见性可以让你轻松调整设置,例如微调训练参数或选择不同的 GPU,这样你就可以更有效地平衡性能和成本。

在 Ultralytics Platform 内设置训练并估算成本

图 4. 在 Ultralytics Platform 内设置模型训练并估算成本 (来源)

Link to this section使用 Ultralytics Platform 进行模型训练的主要优势#

到目前为止,我们已经介绍了训练计算机视觉模型涉及的关键步骤,以及它们如何在 Ultralytics Platform 上整合在一起。

除了这些核心功能之外,还有其他功能可以增强训练工作流。以下是使用 Ultralytics Platform 进行模型训练的一些主要好处的概述:

  • 内置实验可重复性:每次训练运行都会自动记录其完整配置,包括模型、数据集、参数和计算设置。这使得重新访问实验并可靠地重现结果变得很简单。
  • 随时间变化的训练洞察:你不仅可以查看最终结果,还能跟踪性能在各个 epoch 中的演变,从而帮你更好地理解模型在训练过程中的表现。
  • 降低运营开销:通过在后台处理环境设置、依赖管理和基础设施,该平台让你能更专注于模型开发,减少对配置的投入。
  • 集中化的实验组织:项目充当了管理模型、数据集和训练运行的单一位置,有助于在工作流变得复杂时保持实验的条理性。

Link to this section关键要点#

训练是机器学习模型生命周期中最重要的阶段之一。它决定了模型识别和解释视觉数据的准确程度。

通过在一个环境中整合训练数据配置、监控、实验对比和成本估算,Ultralytics Platform 简化了构建高性能计算机视觉模型并为其部署做准备的过程。

查看我们不断壮大的 社区GitHub 仓库 以了解更多关于计算机视觉的信息。如果你正在寻找构建视觉解决方案,请查看我们的 许可选项。浏览我们的解决方案页面以了解更多关于 制造业中的计算机视觉农业中的 AI 的好处。

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅