词汇表

差分隐私

了解差分隐私如何在 AI/ML 中保护敏感数据，确保隐私，同时实现准确的分析并符合法规。

差分隐私是数据分析和机器学习（ML）中使用的一种稳健的数学框架。机器学习 (ML)中使用的一种稳健的数学框架。算法的输出不会泄露数据集中任何特定个体的信息。通过量化通过量化与数据发布相关的隐私损失，它允许企业在共享总体模式和趋势的同时同时为每位参与者提供可证明的保密保证。这种方法已成为这种方法已成为人工智能伦理的基石，使数据科学家能够从敏感信息中提取有价值的这种方法已成为人工智能伦理的基石，使数据科学家能够在不损害用户信任或违反监管标准的情况下，从敏感信息中提取有价值的见解。

差分隐私如何运作

差分隐私的核心机制是在数据集或数据库查询结果中注入经过计算的统计噪声。数据集或数据库查询结果。这种噪音经过仔细校准，足以掩盖任何一个人的贡献，使攻击者无法确定是否包含了某个特定的人的数据。攻击者无法确定是否包含了某个人的数据，但又要足够小，以保持总体统计数据的准确性。但又要足够小，以保证总体统计数据的准确性。

在深度学习（DL）中，这种技术技术通常应用于训练过程中，特别是梯度下降过程中。梯度下降过程中。通过在更新模型权重前剪切梯度和添加噪声，开发人员就能创建保护隐私的模型。然而，这就引入了 "更强的隐私设置（导致更多噪音）可能会略微降低最终模型的准确性。最终模型的准确性。

核心理念与实施

为了实现差分隐私，实践者使用了一个称为 "ε "的参数，作为隐私预算。ε值越低，隐私要求越严格，噪音越大；ε值越高，数据越精确，但潜在的信息泄漏余地越大。则可获得更精确的数据，但潜在信息泄漏的余地更大。当为敏感任务（如医疗图像分析或金融预测。

下面的Python 示例演示了差分隐私的基本概念：在数据中添加噪声，以掩盖精确值。虽然像 Opacus 这样的库可用于完整的模型训练，但本代码段使用的是 PyTorch来说明噪声注入机制。

import torch

# Simulate a tensor of sensitive gradients or data points
original_data = torch.tensor([1.5, 2.0, 3.5, 4.0])

# Generate Laplacian noise (common in Differential Privacy) based on a privacy budget
noise_scale = 0.5
noise = torch.distributions.laplace.Laplace(0, noise_scale).sample(original_data.shape)

# Add noise to create a differentially private version
private_data = original_data + noise

print(f"Original: {original_data}")
print(f"Private:  {private_data}")

实际应用

主要技术公司和政府机构依靠差异化隐私来提升用户体验，同时确保个人信息安全。确保个人信息的安全。

苹果的用户使用分析：苹果利用本地差异隐私收集 iPhone 和 Mac 用户的意见。这使他们能够识别流行的表情符号，发现应用程序中的高内存使用率，并改进 QuickType 建议。并改进 QuickType 建议，而无需访问原始用户数据或跟踪个人行为。
美国人口普查局：美国 2020 年美国人口普查采用差别隐私权来发布人口统计数据。这确保了所发布的数据表不能被逆向工程以识别特定家庭。这既满足了公众对人口统计数据的需求，又符合保护公民隐私的法律要求。公民保密的法律要求。

区别隐私与相关术语

重要的是，要将差分隐私与现代 MLOps 生命周期中的其他隐私保护技术区分开来。 MLOps 生命周期中的其他隐私保护技术。

差异隐私与数据隐私： 数据隐私是一门广泛的学科，包括处理个人数据的法律、权利和最佳实践（例如，遵守 GDPR）。差分隐私是一个特定的数学定义和技术工具，用于实现数据隐私目标。差分隐私是一种特定的数学定义和技术工具，用于实现数据隐私目标。
差异隐私与联合学习： Federated Learning是一种分散式训练方法。模型在本地设备（边缘计算）上进行训练，无需将原始数据上传到服务器。虽然联合学习可以保持本地数据，但不能保证模型更新本身不会泄露信息。因此，差分隐私通常与联合学习相结合，以确保模型更新的安全性。
区别隐私与匿名化：传统的匿名化涉及剥离个人身份信息 (PII)，如姓名或社会保险号码。社会保障号码等个人身份信息（PII）。不过，匿名化数据集通常可以通过与其他公共数据交叉引用来 "重新识别"。其他公共数据进行交叉比对，从而 "重新识别 "数据集。差分隐私提供了一种数学上可证明的保证，可抵御此类重新识别攻击。

计算机视觉的意义

对于利用先进模型的用户，如 YOLO11任务如物体检测或监控、对于利用 YOLO11 等高级模型执行物体检测或监控等任务的用户来说，差分隐私为他们提供了在真实世界视频馈送上进行训练的途径，而不会暴露镜头中捕捉到的人的身份。的身份。通过整合这些技术，开发人员可以构建稳健、合规、受公众信任的人工智能系统、并受到公众信任的人工智能系统。

要探索更多隐私工具，OpenDP 项目提供了一套开源算法，Google 则为希望将这些概念整合到工作流中的开发人员提供了TensorFlow Privacy。开发人员将这些概念整合到他们的工作流程中。

差分隐私

培训Ultralytics YOLO 模型，以简化各行业的工作流程

灵活的企业许可解决方案，助力您的创新

使用Ultralytics YOLO在数秒内训练人工智能模型

差分隐私如何运作

核心理念与实施

实际应用

区别隐私与相关术语

计算机视觉的意义

阅读更多此类别的内容

理解为何人机协同标注至关重要

什么是数据集蒸馏？快速概述

Oakley Meta AI眼镜正以视觉人工智能技术重新定义眼镜行业

加入Ultralytics 社区