深圳Yolo 视觉
深圳
立即加入
词汇表

机器学习运维 (MLOps)

探索 MLOps 要点,以简化AI部署。学习如何结合 Ultralytics YOLO26 和我们的平台管理 CI/CD、数据版本控制和监控。

机器学习运维 (MLOps) 是一套实践、原则和技术,它简化了将机器学习 (ML)模型从实验开发阶段推向可靠生产部署的流程。通过将数据科学的探索性与DevOps的严谨性相结合,MLOps旨在统一人工智能 (AI)应用的发布周期。传统软件开发主要关注代码版本控制,而MLOps则引入了管理大规模数据和不断变化的模型行为的额外复杂性。这种整体方法确保AI系统在其整个生命周期中保持可扩展、准确和受控。

MLOps 的支柱

成功的 MLOps 实施依赖于弥合数据工程、机器学习和 DevOps 这三个不同学科之间的鸿沟。

  • 持续集成与交付(CI/CD):正如标准软件使用 CI/CD管道来自动化测试和部署一样,MLOps管道自动化了模型训练和验证。这确保了代码或数据的更改会自动触发步骤来验证 模型性能,然后才将更新推送到生产环境。
  • 数据和模型版本控制: 在传统编码中,您只对源代码进行版本控制。在MLOps中,团队必须使用DVC (Data Version Control)等工具来跟踪训练数据以及模型超参数的变化。这保证了可复现性,使工程师能够从历史记录中重现任何特定的模型版本。
  • 持续监控: 一旦部署,模型可能会因为 概念漂移而性能下降,即目标变量的统计特性随时间变化。MLOps涉及建立 可观测性系统,以跟踪 推理延迟和准确性等指标,并在需要再训练时自动提醒团队。

实际应用

MLOps是现代企业AI的支柱,使公司能够可靠地将业务从单一模型扩展到数千个部署端点。

  1. 制造业中的预测性维护:工厂使用计算机视觉来识别装配线上的缺陷。MLOps管道确保随着新产品线的引入,目标检测模型能够使用新图像进行重新训练、版本化,并自动部署到工厂边缘设备,且无需停机。这确保了即使制造条件发生变化,质量检测也能保持一致。
  2. 智能零售库存:零售商部署摄像头来track货架库存。由于商店照明和产品包装频繁变化,模型漂移是一个持续的风险。MLOps系统监控置信度分数;如果置信度下降,系统会标记图像进行标注,并在云端启动再训练周期,将更新的模型推送到商店,以维护自动化库存管理

利用Ultralytics实施 MLOps

在任何机器学习运维工作流中,关键步骤是 实验追踪。这确保每次训练运行都会与其特定配置一同记录,使团队能够重现结果或在必要时回滚到先前版本。

以下示例演示了如何训练 YOLO26 Ultralytics 用于所有新项目的最新尖端模型——同时启用项目跟踪功能。这自然会生成 生产管道所需的工件。

from ultralytics import YOLO

# Load the YOLO26 model (recommended for superior speed and accuracy)
model = YOLO("yolo26n.pt")

# Train the model while specifying project and name for organized logging
# This creates a structured directory of artifacts (weights, charts, args)
# which is essential for reproducibility in MLOps pipelines.
results = model.train(data="coco8.yaml", epochs=10, project="mlops_experiments", name="run_v1")

通过将训练任务组织为特定项目,团队可轻松集成MLflow 或TensorBoard等工具,以可视化形式展示随时间推移的性能指标。随着组织规模扩大,这些工作流通常会迁移Ultralytics Ultralytics 提供统一界面,支持管理数据集、远程训练以及将模型部署为多种格式,例如 TensorRT 等格式,实现优化推理速度。

MLOps 与相关概念

要有效实施这些实践,区分MLOps与生态系统中相关术语至关重要。

  • MLOps 与 DevOps 的区别: DevOps专注于软件应用程序的持续交付。MLOps 通过将"数据"和"模型"作为核心要素纳入其中,进一步拓展了这些原则。在 DevOps 中,代码变更会触发构建;而在 MLOps 中,数据分布的变化或精度下降同样可能触发新的管道执行。
  • MLOps 与模型服务: 模型服务特指用于托管模型并处理 推理请求的基础设施。MLOps 则是更广泛的 概念,不仅涵盖服务环节,还包括训练、治理 和监控等阶段。
  • MLOps 与 AutoML: 自动化机器学习(AutoML) 专注于自动化模型创建过程(例如算法选择)。MLOps 则负责管理模型创建后的生命周期,并实现运行 AutoML 工具的管道。

让我们一起共建AI的未来!

开启您的机器学习未来之旅