Glossario

Privacy dei dati

Scopri le principali tecniche di privacy dei dati per AI/ML, dall'anonimizzazione all'apprendimento federato, garantendo fiducia, conformità e pratiche etiche di AI.

La privacy dei dati si riferisce alla governance, alle pratiche e agli standard etici relativi alle modalità di raccolta, elaborazione, archiviazione e condivisione delle informazioni personali all'interno di un'azienda. raccolte, elaborate, archiviate e condivise nell'ambito dell'intelligenza intelligenza artificiale (IA) e e dell 'apprendimento automatico (ML). Poiché i moderni algoritmi moderni, in particolare modelli di deep learning (DL), necessitano di grandi quantità di dati di di dati di addestramento per ottenere prestazioni elevate, garantire la riservatezza e i diritti delle persone è diventata una sfida cruciale. Misure efficaci per la privacy dei dati fiducia degli utenti e assicurano la conformità a quadri giuridici come il Regolamento generale europeo sulla protezione dei dati (GDPR) e il California Consumer Privacy Act (CCPA).

Principi fondamentali della privacy dei dati

Nel contesto delle operazioni di apprendimento automatico (MLOps), la privacy dei dati non riguarda solo la segretezza, ma anche il controllo e il consenso. I principi chiave includono:

Minimizzazione dei dati: I sistemi devono raccogliere solo i dati specifici necessari per il compito definito, evitare l'accumulo di informazioni sensibili.
Limitazione dello scopo: I dati raccolti per uno scopo, come ad esempio migliorare la produzione con la computer vision, non devono essere utilizzati per attività non correlate senza un consenso esplicito.
Trasparenza: Le organizzazioni devono essere chiare su quali dati vengono utilizzati. Questa è una pietra miliare dell'etica dell'IA etica dell'IA e aiuta a prevenire algoritmici.
Anonimizzazione: Gli identificatori personali devono essere rimossi o oscurati. Tecniche come la pseudonimizzazione sostituiscono gli identificatori privati con con documenti d'identità falsi, consentendo l'analisi dei dati e proteggendo al contempo le identità individuali.

Privacy dei dati vs. Sicurezza dei dati

Sebbene siano spesso usati in modo intercambiabile, questi termini rappresentano concetti distinti nel ciclo di vita dell'IA.

La privacy dei dati riguarda i diritti delle persone e la legalità dell'utilizzo dei dati. Affronta le questioni del consenso e del trattamento etico.
Sicurezza dei dati coinvolge i I meccanismi tecnici utilizzati per proteggere i dati da accessi non autorizzati, furti o attacchi avversari. attacchi avversari.

La sicurezza è lo strumento che fa rispettare la privacy. Ad esempio, la crittografia è una misura di sicurezza che contribuisce a soddisfare i requisiti di privacy. privacy. Agenzie come il Istituto nazionale per gli standard e la tecnologia (NIST) forniscono per integrare efficacemente le due cose.

Applicazioni del mondo reale nell'IA

La privacy dei dati è fondamentale nei settori in cui le informazioni personali sensibili vengono elaborate automaticamente.

Diagnostica sanitaria: Nell'analisi delle immagini mediche analisi delle immagini mediche, gli ospedali utilizzano l'IA per detect patologie come i tumori. Per rispettare la Health Insurance Portability and Accountability Act (HIPAA), le scansioni dei pazienti devono essere private delle informazioni di identificazione personale (PII) prima di essere utilizzate per addestrare i modelli. Gli innovatori stanno utilizzando YOLO11 per il rilevamento dei tumori su set di dati anonimizzati per migliorare i risultati senza compromettere la riservatezza dei pazienti.
Città intelligenti e sorveglianza: La computer vision è ampiamente utilizzata per gestione del traffico e la sicurezza. Tuttavia, la registrazione degli spazi pubblici solleva problemi di privacy. Per risolvere questo problema, gli sviluppatori impiegano rilevamento degli oggetti per identificare gli astanti o le targhe targhe e applicano una sfocatura in tempo reale. Questo permette al sistema di monitorare il flusso del traffico di sorveglianza, proteggendo l'anonimato individuale. proteggendo l'anonimato individuale.

Tecniche per preservare la privacy

Gli sviluppatori utilizzano varie tecnologie di rafforzamento della privacy (PET) per proteggere i flussi di lavoro ML:

Privacy differenziale: Questo metodo Questo metodo aggiunge rumore statistico alle serie di dati, assicurando che l'output di un algoritmo non riveli se un individuo specifico è stato incluso nell'input. informazioni di un individuo specifico. Organizzazioni come OpenMined sostengono questi strumenti open-source per la privacy.
Apprendimento federato: Invece di centralizzare i dati di centralizzare i dati, il modello viene inviato al dispositivo (edge computing). Il modello apprende localmente e invia solo aggiornamenti, mantenendo i dati grezzi sul dispositivo dell'utente. Questo aspetto è sempre più rilevante per veicoli autonomi e dispositivi mobili.
Dati sintetici: Generare dati artificiali dati artificiali che imitano le proprietà statistiche del mondo reale consente agli ingegneri di addestrare i modelli senza mai esporre i dati reali degli utenti. dati reali dell'utente.

Esempio: Anonimizzazione delle immagini con Python

Uno dei compiti di privacy più comuni è quello di sfocare i volti o le regioni sensibili nei dati visivi. Il seguente esempio dimostra come utilizzare YOLO11 per detect un oggetto (come una persona) e applicare una sfocatura per proteggerne l'identità.

import cv2
from ultralytics import YOLO

# Load the YOLO11 model
model = YOLO("yolo11n.pt")

# Read an image
img = cv2.imread("bus.jpg")

# Run object detection
results = model(img)

# Iterate through detections and blur identified objects
for box in results[0].boxes.xyxy:
    x1, y1, x2, y2 = map(int, box)
    # Extract the region of interest (ROI)
    roi = img[y1:y2, x1:x2]
    # Apply a Gaussian blur to the ROI to anonymize it
    img[y1:y2, x1:x2] = cv2.GaussianBlur(roi, (51, 51), 0)

# Save the anonymized image
cv2.imwrite("bus_anonymized.jpg", img)

Privacy dei dati

Addestrare i modelliYOLO di Ultralytics per ottimizzare i flussi di lavoro in tutti i settori industriali

Soluzione di licenza aziendale flessibile per potenziare la tua innovazione

Addestrare modelli di intelligenza artificiale in pochi secondi con Ultralytics YOLO

Principi fondamentali della privacy dei dati

Privacy dei dati vs. Sicurezza dei dati

Applicazioni del mondo reale nell'IA

Tecniche per preservare la privacy

Esempio: Anonimizzazione delle immagini con Python

Leggi di più in questa categoria

Apprendimento auto-supervisionato per il denoising: un'analisi dettagliata passo dopo passo

Tendenze future del rilevamento degli oggetti: 7 aspetti chiave da tenere d'occhio

Miglioramento della reidentificazione dei veicoli con i modelliYOLO di Ultralytics

Unitevi alla comunità di Ultralytics