在 Lightning AI 上定制培训 Ultralytics YOLO 模型

阿比拉米-维纳

3 分钟阅读

2025年1月13日

探索在 YOLO Vision 2024 上展示的 Lightning AI 如何通过更快的模型训练、部署和协作来简化可扩展的视觉 AI 开发。

无论您是经验丰富的人工智能开发人员,还是刚刚开始探索视觉人工智能,拥有一个可靠的环境来玩转和实验Ultralytics YOLO11等计算机视觉模型都是至关重要的。环境指的是高效设计、测试和部署人工智能模型所需的工具、资源和基础设施。 

虽然有多个在线平台提供不同的人工智能工具,但许多平台并没有为从数据准备到模型部署的整个人工智能生命周期提供统一的环境。这时,Lightning AI(人工智能开发的一体化平台)就可以介入,简化从数据准备到部署的流程。

YOLO Vision 2024(YV24)是 Ultralytics 主办的一年一度的混合活动,重点关注人工智能和计算机视觉领域的进展。Lightning AI 首席技术官Luca Antiga 发表了题为"Going YOLO on Lightning Studios"的主题演讲,详细介绍了如何使用 Lightning AI 快速、顺利地训练 Ultralytics YOLO 模型,而不涉及复杂的技术问题。

在本文中,我们将深入探讨卢卡演讲的主要内容,包括从真实世界的计算机视觉应用到使用 Lightning AI 训练和部署 Ultralytics YOLO 模型的现场演示。让我们开始吧!

使用 Lightning AI 和 Ultralytics YOLO 简化人工智能开发

卢卡在主题发言中首先分享了他对 YOLO 模式在各行各业的影响的看法和赞赏。他强调了 YOLO 模式如何应用于制造业和农业等行业。他说:"我很欣赏 YOLO 对建设者群体的影响--他们需要解决实际、实用的问题--这与我非常接近。

他将这一点与对人工智能培训日益增长的兴趣联系起来,介绍了 Lightning AI,这是一个旨在让人工智能模型开发更快、更简单、更易于为每个人所用的平台。它尤其适用于支持人工智能的迭代进步,帮助开发人员完善和改进模型。

图 1.Luca Antiga 在 YV24 上远程介绍闪电工作室。

他还指出,Lightning AI 类似于 PyTorch Lightning,后者是一个简化人工智能模型训练过程的框架。但不同之处在于,Lightning AI 是一个更全面的平台,为整个人工智能开发过程提供了更广泛的工具和功能,而不仅仅是训练人工智能模型。 

Lightning Studios是Lightning AI的重要组成部分,它为设计、训练和部署人工智能模型提供了一个直观的工作空间,使整个工作流程无缝高效。你可以把Lightning Studios看作是在云上运行的可复制的人工智能开发环境。例如,它提供了一个类似于 Jupyter Notebook 的环境,可以复制并与其他开发人员共享,有助于改善协作。 

Luca 接着阐述了 Lightning Studios 的优势,他说:"复制环境不再是问题。如果你需要从 CPU(中央处理器)机器换到 GPU(图形处理器)机器,或者在上千台机器上启动培训,你的环境将是持久的。

为培训和发展建立 "闪电工作室

接下来,Luca 演示了如何快速上手 Lightning Studios。只需点击几下,您就可以打开一个新的工作室,访问 Jupyter Notebooks 和VS Code 等工具和环境,所有设置都已准备就绪,随时可以进行编码。他展示了在不同机器之间切换的便捷性。如果您正在执行的任务需要更强大的功能,您可以轻松地从 CPU 切换到更强大的 GPU。GPU 只有在使用时才会保持激活状态,否则就会进入睡眠模式,从而节省功耗。

卢卡还提到了使用工作室模板的好处。它们是社区预制的人工智能编码环境,您可以使用它们,而无需进行任何设置。为人工智能项目设置环境可能会很耗时,而 Studio Templates 可以帮助提高工作效率。这些环境预装了人工智能项目所需的一切,如已安装的依赖项、模型权重、数据、代码等。

图 2.卢卡解释什么是工作室模板。

在 Lightning Studios 上训练 Ultralytics YOLO 模型

随后,Luca开始了现场演示,重点介绍了如何使用Lightning Studio来训练Ultralytics YOLO模型。他打开了一个Studio模板,该模板已经安装了所有的依赖项,并启动了一台有四个GPU的机器,以加快训练过程。关于数据,他说可以选择将数据直接存储在机器上,也可以从云端流式传输数据,从而使训练过程更快、更高效。

几秒钟后,机器就准备就绪,卢卡迅速启动了培训课程。在演示过程中,一个小问题导致机器意外停止,但闪电工作室无缝地从中断处恢复,确保不会丢失任何进度。卢卡指出,即使面对意外中断,这种可靠性也能支持流畅的工作流程。

接着,他演示了如何使用TensorBoard(一种实时可视化机器学习指标的工具)轻松监控训练进度。Lightning Studio可以自动生成URL,让您或同一工作区的队友无需任何额外设置即可访问TensorBoard视图,从而使这一操作变得更加简单。这样可以简化协作,让每个人都站在同一起跑线上。 

图 3.在 Lightning Studios 上训练 Ultralytics YOLO 模型的流程图。图片由作者提供。

利用 Lit Serve 部署 Ultralytics YOLO 模型

演示结束后,卢卡把话题转移到了闪电人工智能公司最近推出的一个新项目--LitServe。LitServe 简化了将训练有素的模型转化为可供他人使用的可扩展服务的过程,消除了对复杂部署管道的需求。它旨在以最小的工作量处理从打包模型到部署模型的所有工作。

为了实时展示这一点,卢卡使用预先训练好的Ultralytics YOLOv8模型为观众做了快速演示。他创建了一个简单的应用程序接口(API)来处理传入的请求,并在几秒钟内返回图像预测结果。这意味着,任何人都可以通过图像向该应用程序接口发送请求,几乎在瞬间就能获得对象检测等计算机视觉任务的结果。在幕后,Ultralytics YOLOv8 模型作为一项服务部署,高效地处理请求、处理图像,并以最小的延迟提供预测结果。

图 4.卢卡在 YV24 期间展示 Lightning AI 的 LitServe。

他在一张披萨图片上进行了推理,Ultralytics YOLOv8 成功地识别出了披萨、勺子和餐桌等物体。他解释说,虽然第一次请求由于 "冷启动 "而耗时稍长,但系统一旦预热,后续请求的速度就会快很多。

卢卡接着问:"如果我想向外界公开这些信息呢?他简要介绍了 API Builder 插件是如何将您的模型简单转化为实时、生产就绪的服务的。通过自定义域、增加安全性和无缝集成等功能,您可以轻松地让任何人都能访问您的模型。

使用 Lightning Studios 的主要优势

最后,Luca谈到了Lightning Studio在人工智能开发方面的可扩展性和灵活性。他提到了该平台如何通过容错训练在多台机器上训练模型,最多可扩展到 10,000 个节点,并在中断后自动恢复。 

例如,如果 GPU 集群上的训练作业因硬件问题或服务器重启而中断,Lightning Studios 可确保进程从中断的地方恢复。这使它成为大规模人工智能项目的理想选择,例如在ImageNet或COCO等海量数据集上训练深度学习模型。

以下是 Luca 谈到的 Lightning Studios 的其他一些主要优势:

  • 每月免费提供 GPU 点数:每月为用户提供 15 个免费 GPU 点数,这些点数会自动充值,确保您可以在不增加成本的情况下进行实验和开发。
  • 加强协作:
  • 灵活的实例选项:它可让您灵活选择可中断和不可中断实例,使用户能够通过可中断选项节省 GPU 机器的成本。
  • 与现有工具集成:该平台与 SSH(安全套接字外壳)和 VS Code 等远程开发工具集成,可灵活地在本地或云端工作。

主要收获

卢卡在 YV24 大会上的主题演讲强调了人工智能与 Ultralytics YOLO 模型和 Lightning AI 等工具的结合如何改变我们解决现实问题的方式。它们使开发人员更容易训练和部署模型,这些模型是为解决各行各业的具体问题而设计的。

他介绍了Lightning Studios如何使整个开发过程更快、更方便,让开发人员轻松创建强大的解决方案。作为Lightning AI等尖端平台的核心,计算机视觉模型正在改变人工智能解决方案应对挑战的方式。特别是利用最新的Ultralytics YOLO11模型,开发人员可以构建能产生重大影响的解决方案。

加入我们的社区,了解人工智能及其实际应用的最新进展。查看我们的 GitHub 存储库,探索自动驾驶汽车中的人工智能医疗保健中的计算机视觉等领域的创新。

让我们共同打造人工智能的未来

开始您的未来机器学习之旅

免费开始
链接复制到剪贴板