数据安全
了解强大的数据安全实践如何保护人工智能和 ML 系统,确保数据完整性、可信度和合规性。
数据安全是指在数字信息的整个生命周期内保护其免遭未经授权的访问、破坏或盗窃。在人工智能(AI)和机器学习(ML)领域,数据安全涉及保护用于模型训练和验证的数据集、模型本身及其运行的基础设施。实施强大的数据安全措施对于建立可信的人工智能系统、保护敏感信息和确保人工智能驱动成果的完整性至关重要。否则,模型很容易受到威胁,从而影响其性能并导致严重的现实后果。
人工智能中数据安全的重要性
数据是人工智能模型的生命线。因此,确保整个人工智能开发生命周期中的数据安全是不容忽视的。强大的数据安全性可以抵御一系列威胁,并确保运行的完整性。
- 保护敏感信息:人工智能系统通常会处理大量敏感数据,包括个人身份信息 (PII)、财务记录和健康数据。根据GDPR 等法规,数据泄露可能导致重大经济损失、声誉受损和法律处罚。
- 防止恶意攻击:不安全的数据和模型容易受到恶意攻击,恶意行为者可以操纵输入数据,导致模型做出错误的预测。他们还可以通过污染训练数据来降低性能或创建后门,从而尝试 "毒害模型"。
- 确保模型的完整性:人工智能模型的可靠性完全取决于其训练数据的质量和完整性。数据安全可确保用于训练的数据准确无误且未被篡改,从而建立更强大、更可靠的模型。
- 保持合规和信任:遵守既定的安全框架(如NIST 网络安全框架)和标准(如ISO/IEC 27001)对于合规性至关重要。这些实践通常通过全面的机器学习运营(MLOps)进行管理,以建立和维护用户信任。
核心数据安全实践
有效的人工智能数据安全涉及多层次的方法,包括若干技术和组织措施。
- 加密:数据在静止状态(存储时)和传输过程中(在网络上移动时)都应加密。加密可将数据转换为安全代码,防止未经授权的用户读取数据。
- 访问控制:实施严格的访问控制策略,如基于角色的访问控制(RBAC),确保只有获得授权的人员才能访问敏感数据和模型组件。
- 数据匿名化:数据屏蔽和标记化等技术用于在数据集用于训练之前,从数据集中移除或混淆敏感信息,这是保护数据隐私的关键组成部分。
- 安全的基础设施:利用安全的基础设施进行数据存储、处理和模型部署至关重要。这包括使用安全的云服务和Ultralytics HUB 等平台,它们将安全性纳入了开发工作流程。
- 定期审计和监控:对系统的持续监控和定期安全审计有助于在漏洞被利用之前发现并减少漏洞。
人工智能和 ML 的现实世界应用
在众多人工智能驱动的应用中,数据安全至关重要:
数据安全与数据隐私
虽然数据安全和数据隐私经常互换使用,但它们是截然不同但又相互关联的概念。
- 数据安全是指为保护数据免受威胁而实施的技术和组织措施。它涉及防止未经授权的访问、更改或破坏数据。例如防火墙、加密和我们自己的Ultralytics 安全政策。
- 数据隐私侧重于有关如何收集、使用和共享个人数据的规则、政策和个人权利。它涉及同意、目的限制和透明度等问题。
简而言之,数据安全是确保数据隐私的先决条件。如果隐私政策所管辖的数据得不到充分保护,那么这些政策就失去了意义。这两者对于构建可信的计算机视觉系统都至关重要,也是电子隐私信息中心(EPIC)等倡导团体和NIST 隐私框架创建者等标准机构关注的焦点。