Scaleout 借助 Ultralytics YOLO 将模型更新时间从数周缩短至数小时
了解 Scaleout 如何利用 Ultralytics YOLO 和联邦学习在边缘设备上微调 AI 模型,同时确保敏感数据的安全。

Problem
Scaleout 正在为国防、工业和其他受监管部门开发边缘 AI 系统,并寻求在不迁移敏感数据或依赖稳定网络的情况下,持续改进其现场计算机视觉模型。
Solution
通过在边缘设备上微调 Ultralytics YOLO 模型,Scaleout 可以让数据保持在原地,实现离线工作,并在几小时而非几周内交付新的检测模型。
机器学习模型的训练通常假设你可以将所有数据汇集到一处,发送到云端,然后部署成品模型。但在许多实际应用场景中,这一假设并不成立。在国防、工业和受监管的环境中,数据因隐私法规、安全分级或单纯的带宽成本而被限制在原地,且连接这些地点的网络并不总是可靠的。
Scaleout 正是为这些环境构建基础设施。其平台 Scaleout Edge 使用联邦学习将模型训练带到数据所在地,而不是将数据移动到模型端。对于 计算机视觉 项目,Scaleout 在 Vision Ground Nodes(部署在每个站点的 GPU 加速边缘工作站)上对 Ultralytics YOLO 模型 进行自定义训练和微调,因此检测能力在现场不断提升,而敏感图像从未离开过设备。
Link to this section将机器学习带到数据所在地#
Scaleout 由来自乌普萨拉大学致力于大规模分布式系统的研究人员于 2018 年创立,旨在让无法集中数据的场景也能实现机器学习。其重点关注难以或无法将数据汇集到一处的环境,而联邦学习正是实现这一目标的核心机制。
联邦学习 将训练分配到多个设备,然后将其模型更新汇集到中央控制平面,并将其聚合成一个新的全局模型。每个设备都能通过了解其本地环境获益,而整个设备群则通过集体智能获益。数据保留在其归属地,只有模型学到的东西才会传输。
Scaleout 的业务涵盖国防、工业、交通和其他受监管部门,包括参与北约 DIANA 加速器计划以及与 BAE Systems 的合作。在所有这些项目中,模式都是相同的:数据无法移动,但模型仍需改进。
Link to this section边缘机器学习的复杂性#
以下是 Scaleout 在现场训练模型时面临的限制细节:
-
硬件受限: 现场部署没有数据中心服务器,只有诸如无人机机载计算机之类的小型低功耗设备。在这些设备上运行成品模型是可行的,但重新训练模型需要更高的算力。
-
数据锁定在设备上: 重训练所需的素材往往是专有的,无法发送到中央服务器,因此模型必须从从未离开过 边缘 的数据中学习。
-
现场无专家: 在现场捕获数据的操作员很少是机器学习工程师,因此重训练不能依赖于数据科学专家的现场支持。
-
条件不断变化: 现场环境变化迅速,因此模型必须持续更新,而不是进行缓慢的周期性重训练。
Link to this section在边缘端微调 Ultralytics YOLO 模型#
为了在这些限制条件下工作,Scaleout 构建了一个完全在现场运行的训练循环,以 Ultralytics YOLO 模型为核心。
在每个站点,Vision Ground Node(一个具有自身计算和存储能力的 GPU 加速边缘工作站)与无人机群并排运行。当无人机捕获素材时,节点会筛选最有用的帧,操作员对其进行标记,然后 YOLO 模型会在该本地硬件上进行微调。
经过几轮训练后,只有更新后的模型会被传回控制平面,绝不会传输原始素材。该循环通过 Scaleout 的视觉模块交付,这是 Scaleout Edge 平台的一个扩展,它将计算机视觉项目所需的工具打包成一个单一组件。
它集成了帧选择、标注、训练和部署功能,并由 Ultralytics YOLO 处理检测,因此团队可以在工作基础上进行构建,而无需自行组装这些组件。
Scaleout 首先在北约 DIANA 加速器计划中应用了这种方法,使用 YOLOv8 对现场收集的数据进行检测微调。这些数据因专有原因无法通过现场网络传输或进行集中处理,因此团队对微调进行了去中心化,让模型能够在本地从新样本中学习。
该循环同样是为操作员而非数据科学家设计的。系统引导非专业人员审查和标记关键帧,以便现场人员可以自行保持模型持续改进。
配套工具体现了这一点,包括用于标注的 Label Studio 开源版本、用于引入无人机流的流媒体服务器,以及用于微调的 Ultralytics Python 软件包。所有这些都运行在从 NVIDIA Jetson 模块到坚固型现场单元或笔记本电脑等各种硬件上,具体取决于部署环境。
Link to this section为何选择 Ultralytics YOLO 模型?#
对于 Scaleout 而言,Ultralytics YOLO 的最大优势在于模型极其轻量,这使得在网络连接较差的情况下进行联邦训练变得切实可行。Scaleout 不会移动原始数据,而只移动模型更新。它使用最多的 Ultralytics YOLOv8 nano 模型大约为 10.7 MB,因此即使在带宽匮乏时,完整的更新包也很小,易于传输。
Ultralytics Python 软件包还赋予了 Scaleout 工程师在不同硬件上进行训练和部署的灵活性。紧凑的 YOLOv8 nano 模型可以舒适地在受限边缘设备上运行,而该软件包的 导出选项 支持在 Scaleout 工作的不同环境中进行部署。由于模型微调非常简单,团队可以随着现场条件的变化快速进行迭代。
Link to this sectionUltralytics YOLO 帮助 Scaleout 更快地更新模型#
借助 Ultralytics YOLO,最繁重的工作部分保留在设备上。训练运行在数百 GB 的现场素材上,但实际传输的只是一个约 10 MB 的模型。这使得需要移动的数据量减少了大约十倍,正是这一点使得联邦训练在这些部署所依赖的有限网络上变得可行。
这种方法还改变了改进后的模型回到现场的速度。在边缘端运行循环时,本来可能需要数周或数月的时间来收集数据、运输到中心、重新训练和重新部署,现在被缩短到几天甚至几小时。
这一点在 Scaleout 的 无人机 工作中体现得最为明显。在国防侦察中,无人机执行搜索模式,并使用机载 Ultralytics YOLO 模型实时检测、识别和定位目标物体,所有处理都在无人机自身的计算机上完成,而不是发送出去进行分析。
当无人机收集新素材时,这些数据会馈送到 Vision Ground Node,在那里 YOLO 在新帧上进行微调,然后推送更新后的模型,全程无需素材离开站点。检测模型必须跟上快速变化的条件以及无法移动的数据,而本地重训练的模型在静态、中心化训练的模型可能落后的情况下仍然有用。

图 1. Scaleout 和 Ultralytics YOLO 如何为 AI 无人机提供动力的示例 (来源)
相同的模式远不止于无人机。在能源站点和偏远设施等工业环境中,每个地点的数据都很敏感,该平台可以在不让任何原始数据越过设施边界的情况下改进多个地点的检测模型。无论数据是存储在无人机上还是固定装置中,Scaleout 都能让素材保持在原地,只传输模型学到的内容。
Link to this section为数据无法移动的环境构建自适应 AI#
随着 Scaleout 的发展,它继续将其基于边缘的联邦计算机视觉扩展到更多的场景和硬件中。其预构建模块旨在将数月的集成时间缩短为几天,因此客户可以自带硬件并采用自适应学习循环,而无需重建底层的机器学习代码。
以 Ultralytics YOLO 作为检测流水线的核心,Scaleout 使得在传统方法失效的环境中训练和改进 AI 成为可能,保持数据原地不动,在网络故障时保持运行,并将成群的边缘设备变成一个整体不断学习的系统。
准备好探索 Vision AI 能为你做些什么了吗?前往我们的 GitHub 仓库,了解 YOLO 模型如何改变 AI 制造业 和 机器人计算机视觉 等领域。查看我们的 许可选项,开始你的智能化自动化之旅。






