了解在边缘和云端高效部署Ultralytics YOLO26的5个实用技巧,涵盖从选择正确的工作流程和导出格式到量化等各个方面。
了解在边缘和云端高效部署Ultralytics YOLO26的5个实用技巧,涵盖从选择正确的工作流程和导出格式到量化等各个方面。
上个月,Ultralytics正式发布了Ultralytics YOLO26,为Vision AI(人工智能的一个分支,使机器能够解释和理解图像和视频中的视觉信息)树立了新标准。与简单地捕捉画面不同,Ultralytics YOLO模型等计算机视觉模型支持诸如object detection、实例segmentation、姿势估计和图像分类等视觉任务。
YOLO26专为计算机视觉实际运行的设备、相机、机器人和生产系统而构建,是一款最先进的模型,可在实际环境中提供更快的CPU推理、简化的部署和高效的端到端性能。YOLO26模型还旨在简化计算机视觉解决方案从实验到生产的过渡。

模型部署通常涉及各种考量,例如选择合适的硬件、选择适当的导出格式、优化性能以及在实际条件下验证结果。借助Ultralytics Python包,部署YOLO26的这些步骤变得简单直接,该软件包简化了跨多个部署目标的训练、推理和模型导出。
然而,即使工作流程得到简化,做出正确的部署决策仍然是关键。在本文中,我们将介绍五个实用技巧,帮助您在边缘和云环境中高效部署YOLO26,确保生产环境中Vision AI的可靠和可扩展性能。让我们开始吧!
在我们深入探讨YOLO26的部署策略之前,让我们先回顾一下模型部署在计算机视觉中的含义。
模型部署是将经过训练的深度学习模型从开发环境迁移到实际应用中的过程,在该应用中,模型可以持续处理新图像或视频流并生成预测。模型不再在静态数据集上运行实验,而是成为实时系统的一部分。
在计算机视觉中,这通常意味着将模型与相机、边缘AI设备、API或云基础设施集成。它必须在硬件限制内运行,满足延迟要求,并在不断变化的实际条件下保持一致的性能。
了解从实验到生产的这种转变至关重要,因为部署决策直接影响模型在实验室或实验设置之外的表现。
接下来,让我们看看YOLO26部署工作流程实际涉及哪些内容。简而言之,它是一系列步骤,将图像从捕获到分析并转化为预测。
在典型设置中,相机捕获图像或视频帧。然后,这些数据会进行预处理,例如正确调整大小或格式化,然后传递给Ultralytics YOLO26进行推理。
该模型分析输入并生成边界框、分割掩码或关键点等输出。这些结果随后可用于触发操作,例如发送警报、更新仪表板或引导机器人系统。
此工作流的运行位置取决于您的部署策略。例如,在边缘部署中,推理直接在设备上或摄像头附近进行,有助于减少延迟并提高数据隐私性。
同时,在云部署中,图像或视频帧被发送到远程服务器进行处理,从而实现更大的可扩展性和集中管理。一些系统采用混合方法,在边缘执行轻量级处理,在云端处理更繁重的工作负载。
为了做出明智的部署决策,了解有不同的 YOLO26 模型变体可供选择也很重要。
开箱即用,Ultralytics YOLO模型提供多种尺寸,方便您选择适合硬件和性能需求的版本。YOLO26有五种变体:Nano (n)、Small (s)、Medium (m)、Large (l) 和 Extra Large (x)。
较小的模型,例如YOLO26n,针对效率进行了优化,非常适用于边缘设备、物联网 (IoT) 设备、嵌入式系统以及由CPU驱动的系统,在这些场景中,低延迟和低功耗至关重要。它们在保持资源使用最小化的同时提供强大的性能。
像 YOLO26l 和 YOLO26x 这样的大型模型旨在提供更高精度并处理更复杂的场景。这些变体通常在配备图形处理单元 (GPU) 的系统或提供更多计算资源的云环境中表现最佳。
选择合适的模型尺寸取决于您的部署目标。如果速度和在受限硬件上的效率是您的首要任务,那么较小的变体可能更理想。如果您的应用需要最高的准确性并且您拥有更强大的硬件,那么更大的模型可能是更好的选择。
既然我们对YOLO26模型变体和部署工作流程有了更好的理解,那么让我们探讨一些在边缘和云环境中高效部署YOLO26的实用技巧。
部署 Ultralytics YOLO26 时,您需要做出的首批决定之一是模型将在何处运行。您的部署环境直接影响性能、延迟、隐私和可扩展性。
首先评估您的工作流程。您的应用是否需要低延迟,这意味着图像捕获后必须几乎立即生成预测?
例如,在机器人或安全系统中,即使是很小的延迟也会影响性能。在这些情况下,边缘部署通常是最佳选择。直接在设备上或相机附近运行推理可以减少处理数据所需的时间,并避免通过互联网发送图像,这也可以提高隐私性。
另一方面,云部署提供了更大的可扩展性和计算能力。云服务器可以处理大量图像,处理多个视频流,并支持更高的吞吐量。
例如,在农业领域,农民可能会收集数千张叶片图像并批量分析它们,以确定作物是否出现病害迹象。在这种情况下,可能不需要即时实时性能,这使得云处理成为一种实用且可扩展的选择。

然而,将数据发送到远程服务器会引入网络延迟,这是由于通过互联网传输图像并接收预测所造成的延迟。对于非时间敏感型应用,这种权衡可能是可以接受的。
纯边缘和纯云之间也存在多种选择。一些公司使用位于数据生成地点附近的本地基础设施。另一些则构建混合管道,在边缘执行轻量级过滤,并将选定的数据发送到云端进行更深入的分析。
选择正确的部署选项取决于您的应用需求。通过明确定义您对速度、隐私和可扩展性的需求,您可以选择一种策略,确保YOLO26在实际条件下可靠运行。
一旦您决定了模型将在何处运行,下一步是选择正确的导出格式。导出模型意味着将其从训练期间使用的格式转换为针对部署优化的格式。
YOLO26 模型原生基于 PyTorch 构建和训练,但生产环境通常依赖于更适合特定硬件的专用运行时。这些运行时旨在提高推理速度、减少内存使用,并确保与目标设备的兼容性。
将YOLO26转换为适当的格式,使其能够在训练环境之外高效运行。Ultralytics Python 包使这一过程变得简单。它支持广泛的集成,用于构建和部署计算机视觉项目。
如果您想更详细地探索这些集成,您可以查阅Ultralytics官方文档。它包括分步教程、硬件特定指南和实用示例,帮助您自信地从开发过渡到生产。

特别是,Ultralytics Python 包支持将 Ultralytics YOLO26 导出为多种格式,专为不同硬件平台定制。例如,ONNX 导出格式实现了跨平台兼容性,TensorRT 导出格式针对 NVIDIA GPU 和 NVIDIA Jetson 边缘设备进行了优化,而 OpenVINO 导出格式专为 Intel 硬件设计。
某些设备支持多种导出格式,但性能会因您的选择而异。不要默认选择一种格式,问问自己:哪种选项对您的设备最有效?
一种格式可能提供更快的推理速度,而另一种可能提供更好的内存效率或更容易集成到您现有的管道中。这就是为什么将导出格式与您的特定硬件和部署环境相匹配至关重要的原因。
花时间在目标设备上测试不同的导出选项,可以在实际性能上产生显著差异。匹配良好的导出格式有助于确保YOLO26高效、可靠地运行,并达到您的应用所需的速度。
选择导出格式后,确定您的模型是否应该进行量化也是一个好主意。
模型量化降低模型权重和计算的数值精度,通常将其从 32 位浮点数转换为 16 位或 8 位等低精度格式。这有助于减小模型大小、降低内存使用量并提高推理速度,尤其是在边缘设备或由 CPU 驱动的系统上。
根据您的硬件、导出格式和运行时依赖项,量化可以显著提升性能。某些运行时针对低精度模型进行了优化,使其运行更快、效率更高。
然而,如果量化操作不当,可能会轻微影响模型精度。在执行训练后量化时,请务必传入验证图像。这些图像在校准过程中用于帮助模型适应低精度并保持稳定的预测。
即使是训练有素的模型,也可能因为数据漂移而随时间推移性能下降。当模型在生产环境中看到的数据与其训练时的数据不同时,就会发生数据漂移。
换句话说,现实世界在变化,但您的模型没有。结果是,准确性会缓慢下降。
例如,您可能使用白天捕获的图像来训练您的YOLO26模型。如果同一模型后来在夜间、不同光照条件下使用,性能可能会下降。同样的问题也可能发生在相机角度、天气条件、背景或物体外观的变化上。
数据漂移在现实世界的视觉AI系统中很常见。环境很少是静态的,微小的变化都可能影响检测精度。为了减少漂移的影响,您可以确保您的训练数据集尽可能地反映真实世界的条件。
包含在一天中不同时间、不同光照条件和各种环境下捕获的图像。部署后,您可以继续监控性能,并在需要时更新或微调模型。
在全面部署模型之前,您可以在真实世界条件下对其进行基准测试。

通常在受控环境中使用sample_images或小型数据集测试性能。然而,真实世界系统通常表现不同。硬件限制、网络延迟、多路视频流和连续输入都可能影响性能。
基准测试是指衡量模型在实际运行设备和设置上的表现。这包括检查推理速度、整体延迟、内存使用情况和系统稳定性。重要的是不仅要测试模型本身,还要测试整个流水线,包括预处理和任何后处理步骤。
模型在单张图像测试中可能表现良好,但在连续处理实时视频时可能会遇到困难。同样,在强大的开发机器上的性能可能无法反映模型在低功耗边缘设备上的表现。
通过在真实条件下进行基准测试,您可以及早发现瓶颈并在上线前进行调整。在YOLO26将运行的相同环境中进行测试,有助于确保在生产环境中获得可靠、稳定和一致的性能。
以下是部署YOLO26时需要牢记的一些额外因素:
高效部署YOLO26始于了解模型将在何处运行以及您的应用程序的实际需求。通过选择正确的部署方法、将导出格式与您的硬件匹配,并在真实世界条件下测试性能,您可以构建可靠且响应迅速的视觉AI系统。借助正确的设置,Ultralytics YOLO26使将快速、生产就绪的计算机视觉带到边缘和云端变得更加容易。
加入我们的社区并探索我们的GitHub仓库。查看我们的解决方案页面,了解农业AI和医疗保健中的计算机视觉等各种应用。探索我们的许可选项,立即开始您的视觉AI之旅!
开启您的机器学习未来之旅