深圳Yolo 视觉
深圳
立即加入
词汇表

联邦学习

探索联邦学习:一种以隐私为中心的 AI 方法,支持跨设备进行去中心化模型训练,而无需共享原始数据。

联合学习是机器学习(ML)的一种去中心化方法。 机器学习 (ML) 设备协作训练一个共享的预测模型,而无需将训练数据从其原始源头移出。 与需要将数据汇聚到集中式数据湖或云服务器的传统方法不同 数据湖或云服务器的传统方法不同,联合学习将 模型带到数据中。这种模式的转变解决了与 数据隐私和安全方面的关键挑战,使构建强大的系统成为可能。 这种模式的转变解决了与数据隐私和安全相关的关键挑战,使构建强大的系统成为可能,同时将敏感的用户信息严格保存在本地设备上,如智能手机、物联网传感器或医院服务器、 或医院服务器上。

联邦学习如何运作

这一过程依赖于中央服务器与参与的客户端设备之间的迭代循环通信。 它一般遵循以下不同步骤:

  1. 初始化:中央服务器初始化全局 神经网络模型,并将其广播给选定的一组符合条件的客户端设备。 选定的符合条件的客户端设备。
  2. 本地培训:每个客户端设备使用自己的私有数据 模型训练。这 利用边缘人工智能功能,确保原始数据永远不 离开设备。
  3. 更新传输:客户端只发送数学模型更新,而不是共享数据。 更新,特别是梯度或 模型权重回传给中央服务器。
  4. 聚合:服务器使用以下技术 Federated Averaging (FedAvg)等技术,将这些更新合并为一个新的改进的全局模型、 改进的全局模型。
  5. 迭代:更新后的全局模型被发送回客户端,如此循环往复,直到模型 达到预期精度

实际应用

在数据敏感性至关重要的行业中,联合学习已从理论研究转向实际部署。 至关重要。

  • 医疗保健与医学影像:医院利用联合学习协作进行 医学影像分析以检测肿瘤 无需共享患者记录。这样,医院就可以在不同的数据集上训练强大的 的人工智能医疗解决方案,同时严格遵守 HIPAA 等法规。 同时严格遵守HIPAA 等法规。
  • 移动预测文本:智能手机键盘利用这项技术改进了 自然语言处理 (NLP) 下一个单词预测模型。通过在本地学习输入模式,该系统改善了用户体验 而无需将私人文本信息传输到云端。 Google 人工智能研究倡导的方法。

联合学习与分布式培训

虽然这两个概念都涉及多台机器,但它们在数据管理和网络环境方面有着本质区别。

  • 联合学习:数据在本地生成,并因隐私限制而保持分散性。 设备通常是异构的(硬件不同),网络连接也不稳定。
  • 分布式培训:通常发生在受控数据中心内,中心数据集在计算节点(如 GPU 集群),以加快对大型数据集的处理速度。 处理大型数据集

代码示例:模拟本地客户端更新

在联合设置中,客户端的作用是根据本地数据对全局模型进行微调。下面的Python 代码段 演示了客户端如何使用 Ultralytics YOLO11模型进行一轮本地训练,然后 提取权重进行汇总。

from ultralytics import YOLO

# Load the global model received from the central server
# In a real scenario, this 'yolo11n.pt' comes from the aggregator
model = YOLO("yolo11n.pt")

# Perform local training on the client's private dataset
# 'epochs=1' simulates a single round of local computation
results = model.train(data="coco8.yaml", epochs=1, imgsz=640)

# After training, the updated model weights are saved
# These weights are what the client sends back to the server
print("Local training complete. Update ready for transmission.")

优势与挑战

联合学习的主要优势是设计隐私。它可以使用 合成数据或现实世界的私人数据。 否则,这些数据将因法律或道德限制而无法访问。此外,它还能减少网络带宽消耗 此外,由于无需传输大型数据集,它还能减少网络带宽消耗。

然而,挑战依然存在。系统异构性意味着模型必须在计算能力不同的设备上运行,从功能强大的服务器到电池有限的物联网传感器。 从功能强大的服务器到电池有限的物联网传感器。此外,还存在以下风险 恶意攻击在这种情况下,恶意客户端可能会提交中毒更新,破坏全局模型。为了减少这种风险,研究人员 采用差分隐私技术来增加 噪声,确保没有一个用户的数据可以被逆向工程。

TensorFlow FederatedPySyft等框架目前正在帮助开发人员实现这些复杂的 工作流程。随着计算机视觉的不断 的发展,联合学习将在部署智能系统方面发挥至关重要的作用。 提供高性能结果。

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入