Khám phá các kỹ thuật bảo vệ quyền riêng tư dữ liệu quan trọng cho AI/ML, từ ẩn danh hóa đến học liên kết, đảm bảo sự tin cậy, tuân thủ và các hoạt động AI có đạo đức.
Quyền riêng tư dữ liệu đề cập đến việc quản trị, thực hành và tiêu chuẩn đạo đức liên quan đến cách thức thu thập, xử lý, lưu trữ và chia sẻ thông tin cá nhân trong các hệ thống trí tuệ nhân tạo (AI) và học máy (ML) . Do các thuật toán hiện đại, đặc biệt là các mô hình học sâu (DL) , đòi hỏi một lượng lớn dữ liệu đào tạo để đạt được hiệu suất cao, việc đảm bảo tính bảo mật và quyền của cá nhân đã trở thành một thách thức quan trọng. Các biện pháp bảo mật dữ liệu hiệu quả giúp xây dựng niềm tin của người dùng và đảm bảo tuân thủ các khuôn khổ pháp lý như Quy định Bảo vệ Dữ liệu Chung của Châu Âu (GDPR) và Đạo luật Quyền riêng tư của Người tiêu dùng California (CCPA) .
Trong bối cảnh hoạt động học máy (MLOps) , quyền riêng tư dữ liệu không chỉ là vấn đề bảo mật mà còn là vấn đề kiểm soát và đồng ý. Các nguyên tắc chính bao gồm:
Mặc dù thường được sử dụng thay thế cho nhau, những thuật ngữ này đại diện cho những khái niệm riêng biệt trong vòng đời AI.
Bảo mật là công cụ thực thi quyền riêng tư. Ví dụ, mã hóa là một biện pháp bảo mật giúp đáp ứng các yêu cầu về quyền riêng tư. Các cơ quan như Viện Tiêu chuẩn và Công nghệ Quốc gia (NIST) cung cấp các khuôn khổ để tích hợp hiệu quả cả hai.
Quyền riêng tư dữ liệu là tối quan trọng trong các lĩnh vực mà thông tin cá nhân nhạy cảm được xử lý tự động.
Các nhà phát triển sử dụng nhiều công nghệ tăng cường quyền riêng tư (PET) khác nhau để bảo mật quy trình làm việc ML:
Một trong những tác vụ bảo mật phổ biến nhất là làm mờ khuôn mặt hoặc các vùng nhạy cảm trong dữ liệu hình ảnh. Ví dụ sau đây minh họa cách sử dụng YOLO11 để detect một vật thể (như một người) và làm mờ để bảo vệ danh tính của họ.
import cv2
from ultralytics import YOLO
# Load the YOLO11 model
model = YOLO("yolo11n.pt")
# Read an image
img = cv2.imread("bus.jpg")
# Run object detection
results = model(img)
# Iterate through detections and blur identified objects
for box in results[0].boxes.xyxy:
x1, y1, x2, y2 = map(int, box)
# Extract the region of interest (ROI)
roi = img[y1:y2, x1:x2]
# Apply a Gaussian blur to the ROI to anonymize it
img[y1:y2, x1:x2] = cv2.GaussianBlur(roi, (51, 51), 0)
# Save the anonymized image
cv2.imwrite("bus_anonymized.jpg", img)