Descubra las técnicas clave de privacidad de datos para IA/ML, desde la anonimización hasta el aprendizaje federado, garantizando la confianza, el cumplimiento y las prácticas éticas de la IA.
La privacidad de los datos se refiere a la gobernanza, las prácticas y las normas éticas relativas a la forma en que la información personal es se recopila, procesa, almacena y comparte en los inteligencia artificial (IA) y aprendizaje automático. A medida que los modernos, en particular aprendizaje profundo (DL), requieren grandes cantidades de datos de datos de entrenamiento para lograr un alto rendimiento, garantizar la confidencialidad y los derechos de las personas se ha convertido en un reto crítico. Las medidas eficaces de privacidad de los datos generan confianza de los usuarios y garantizan el cumplimiento de marcos legales como el Reglamento General Europeo de Protección de Datos (GDPR) y la Ley de Privacidad del Consumidor de California (CCPA).
En el contexto de operaciones de aprendizaje automático (MLOps), la privacidad de los datos no es sólo secreto, sino también control y consentimiento. Los principios clave incluyen:
Aunque a menudo se utilizan indistintamente, estos términos representan conceptos distintos en el ciclo de vida de la IA.
La seguridad es la herramienta que refuerza la privacidad. Por ejemplo, el cifrado es una medida de seguridad que ayuda a satisfacer los requisitos de privacidad. privacidad. Agencias como el Instituto Nacional de Normas y Tecnología (NIST) proporcionan marcos para integrar eficazmente ambas.
La privacidad de los datos es primordial en sectores en los que se procesa automáticamente información personal sensible.
Los desarrolladores utilizan diversas tecnologías de mejora de la privacidad (PET) para proteger los flujos de trabajo de ML:
Una de las tareas de privacidad más comunes consiste en difuminar rostros o regiones sensibles en datos visuales. El siguiente ejemplo muestra cómo utilizar YOLO11 para detect un objeto (como una persona) y aplicar un desenfoque para proteger su identidad.
import cv2
from ultralytics import YOLO
# Load the YOLO11 model
model = YOLO("yolo11n.pt")
# Read an image
img = cv2.imread("bus.jpg")
# Run object detection
results = model(img)
# Iterate through detections and blur identified objects
for box in results[0].boxes.xyxy:
x1, y1, x2, y2 = map(int, box)
# Extract the region of interest (ROI)
roi = img[y1:y2, x1:x2]
# Apply a Gaussian blur to the ROI to anonymize it
img[y1:y2, x1:x2] = cv2.GaussianBlur(roi, (51, 51), 0)
# Save the anonymized image
cv2.imwrite("bus_anonymized.jpg", img)