敬请关注 YOLO Vision 2025!
2025年9月25日
英国夏令时 10:00 - 18:00
混合活动
Yolo Vision 2024
词汇表

数据安全

了解强大的数据安全实践如何保护 AI 和 ML 系统,确保数据完整性、信任和合规性。

数据安全是一种保护数字信息在整个生命周期内免受未经授权的访问、损坏或盗窃的实践。在人工智能 (AI) 和机器学习 (ML)的背景下,数据安全涉及保护用于模型训练和验证的数据集、模型本身以及运行它们的基础设施。实施强大的数据安全措施对于构建值得信赖的 AI 系统、保护敏感信息以及确保 AI 驱动结果的完整性至关重要。没有它,模型很容易受到威胁,从而可能损害其性能并导致严重的实际后果。

AI 中数据安全的重要性

数据是AI模型的命脉。因此,在整个AI开发生命周期中保护数据是不可协商的。强大的数据安全性可防范各种威胁并确保运营完整性。

  • 保护敏感信息: AI 系统通常处理大量的敏感数据,包括个人身份信息 (PII)、财务记录和健康数据。违规行为可能导致重大的经济损失、声誉损害以及 GDPR 等法规下的法律处罚。
  • 防止恶意攻击:不安全的数据和模型容易受到对抗性攻击,恶意行为者可以操纵输入数据以导致模型做出不正确的预测。他们还可以尝试通过污染训练数据来降低性能或创建后门的“模型中毒”。
  • 确保模型完整性:AI 模型的可靠性完全取决于其训练数据的质量和完整性。数据安全可确保用于训练的数据准确且未被篡改,从而产生更强大、更可靠的模型。
  • 维护合规性和信任: 遵守已建立的安全框架(如 NIST 网络安全框架)和标准(如 ISO/IEC 27001)对于法规遵从至关重要。这些实践通常通过全面的机器学习运维 (MLOps)进行管理,以建立和维护用户信任。

核心数据安全实践

AI中有效的数据安全涉及一种多层方法,其中包括若干技术和组织措施。

  • 加密: 数据在静态(存储时)和传输中(在网络中移动时)都应加密。加密将数据转换为安全代码,以防止未经授权的用户读取它。
  • 访问控制: 实施严格的访问控制策略(例如基于角色的访问控制 (RBAC))可确保只有授权人员才能访问敏感数据和模型组件。
  • 数据匿名化:数据脱敏和令牌化等技术用于在数据集用于训练之前删除或混淆数据集中的敏感信息,这是保护数据隐私的关键组成部分。
  • 安全基础设施: 利用安全的基础设施进行数据存储、处理和模型部署至关重要。这包括使用安全云服务和平台,例如将安全性融入开发工作流程的 Ultralytics HUB
  • 定期审计和监控: 对系统进行持续监控和定期安全审计有助于在漏洞被利用之前检测和缓解它们。

AI 和 ML 中的真实世界应用

数据安全在众多 AI 驱动的应用程序中至关重要:

  • 医疗保健:医疗保健AI中,尤其是在用于诊断疾病医学图像分析中,HIPAA要求采取严格的数据安全措施,以保护敏感的患者健康信息。这包括加密患者记录、控制对影像数据的访问以及匿名化用于研究的数据。
  • 自动驾驶车辆: 自动驾驶车辆会生成大量的传感器数据,用于导航和目标检测。保护这些数据对于防止恶意行为者干扰车辆运行至关重要,Waymo 等公司强调了这一点。数据安全可确保汽车领域人工智能系统的安全性和可靠性。

数据安全 vs. 数据隐私

数据安全和数据隐私虽然经常互换使用,但它们是既有区别又相关的概念。

  • 数据安全 是指为保护数据免受威胁而实施的技术和组织措施。它关注于防止未经授权的访问、篡改或破坏数据。示例包括防火墙、加密以及我们自己的 Ultralytics 安全策略
  • 数据隐私 侧重于关于如何收集、使用和共享个人数据的规则、政策和个人权利。它解决了关于同意、目的限制和透明度的问题。

简而言之,数据安全是确保数据隐私的前提。如果隐私政策所管辖的数据没有得到充分的保护以防止泄露,那么这些政策将毫无意义。两者对于构建值得信赖的计算机视觉系统至关重要,并且是像电子隐私信息中心 (EPIC)这样的倡导团体和像NIST 隐私框架的创建者这样的标准机构关注的焦点。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入
链接已复制到剪贴板