Glossar

Datenschutz

Entdecken Sie wichtige Datenschutztechniken für KI/ML, von der Anonymisierung bis zum Federated Learning, um Vertrauen, Compliance und ethische KI-Praktiken zu gewährleisten.

Datenschutz bezieht sich auf die Verwaltung, die Praktiken und die ethischen Standards in Bezug auf die Art und Weise, wie persönliche Informationen gesammelt, verarbeitet, gespeichert und geteilt werden künstlicher Intelligenz (KI) und Systeme für maschinelles Lernen (ML). Da moderne Algorithmen, insbesondere Deep Learning (DL) -Modelle, große Mengen an Trainingsdaten benötigen, um eine hohe Leistung zu erzielen, ist die ist die Gewährleistung der Vertraulichkeit und der Rechte des Einzelnen zu einer entscheidenden Herausforderung geworden. Wirksame Maßnahmen zum Schutz der Daten schaffen Vertrauen der Nutzer und gewährleisten die Einhaltung rechtlicher Rahmenbedingungen wie der Europäischen Datenschutzgrundverordnung (GDPR) und dem California Consumer Privacy Act (CCPA).

Grundprinzipien des Datenschutzes

Im Kontext von maschineller Lernverfahren (MLOps) geht es beim Datenschutz nicht nur um Geheimhaltung, sondern auch um Kontrolle und Zustimmung. Zu den wichtigsten Grundsätzen gehören:

Datenminimierung: Die Systeme sollten nur die spezifischen Daten erfassen, die für die definierte Aufgabe erforderlich sind, das Horten von sensiblen Informationen vermeiden.
Zweckbeschränkung: Daten, die für einen bestimmten Zweck gesammelt wurden, wie z.B. Verbesserung der Produktion mit Hilfe von Computer Vision, sollten nicht ohne ausdrückliche Zustimmung für andere Aufgaben verwendet werden.
Transparenz: Organisationen müssen sich darüber im Klaren sein, welche Daten verwendet werden. Dies ist ein Eckpfeiler der KI-Ethik und trägt dazu bei, dass algorithmische Voreingenommenheit.
Anonymisierung: Persönliche Identifikatoren sollten entfernt oder unkenntlich gemacht werden. Techniken wie Pseudonymisierung ersetzen private Identifikatoren durch gefälschte IDs und ermöglichen so die Datenanalyse bei gleichzeitigem Schutz der individuellen Identitäten.

Datenprivatsphäre vs. Datensicherheit

Obwohl diese Begriffe oft synonym verwendet werden, stehen sie für unterschiedliche Konzepte im KI-Lebenszyklus.

Der Datenschutz betrifft die Rechte des Einzelnen und die Rechtmäßigkeit der Datennutzung. Es geht um Fragen der Zustimmung und des ethischen Umgangs damit.
Die Datensicherheit umfasst die technische Mechanismen, die zum Schutz von Daten vor unbefugtem Zugriff, Diebstahl oder gegnerischen Angriffen.

Sicherheit ist das Werkzeug, das die Privatsphäre durchsetzt. So ist beispielsweise die Verschlüsselung eine Sicherheitsmaßnahme, die dazu beiträgt, die Anforderungen zu erfüllen. Agenturen wie das National Institute of Standards and Technology (NIST) bieten Rahmenwerke, um beide effektiv zu integrieren.

Real-World-Anwendungen in AI

In Bereichen, in denen sensible persönliche Informationen automatisch verarbeitet werden, ist der Datenschutz von größter Bedeutung.

Diagnostik im Gesundheitswesen: Unter medizinischen Bildanalyse nutzen Krankenhäuser KI um Krankheiten wie Tumore detect . Um den Anforderungen des Health Insurance Portability and Accountability Act (HIPAA), müssen die Scans von Patienten von personenbezogenen Daten befreit werden, bevor sie zum Trainieren von Modellen verwendet werden können. Die Innovatoren verwenden YOLO11 für die Tumorerkennung auf anonymisierten Datensätzen, um die Ergebnisse zu verbessern, ohne die Vertraulichkeit der Patienten zu gefährden.
Intelligente Städte und Überwachung: Computervision wird weithin eingesetzt für Verkehrsmanagement und Sicherheit. Die Aufzeichnung öffentlicher Räume wirft jedoch Bedenken hinsichtlich der Privatsphäre auf. Um dieses Problem zu lösen, verwenden die Entwickler Objekterkennung zur Identifizierung von Passanten oder Nummernschilder zu erkennen und in Echtzeit zu verwischen. So kann das System den Verkehrsfluss überwachen und den Status quo der Überwachung zu durchbrechen indem es die Anonymität des Einzelnen schützt.

Techniken zur Wahrung der Privatsphäre

Entwickler nutzen verschiedene Technologien zur Verbesserung des Datenschutzes (Privacy Enhancing Technologies, PET), um ML-Workflows zu sichern:

Differenzierter Datenschutz: Diese Methode fügt Datensätzen statistisches Rauschen hinzu und stellt sicher, dass die Ausgabe eines Algorithmus nicht verrät, ob eine ob die Daten einer bestimmten Person in der Eingabe enthalten waren. Organisationen wie OpenMined setzen sich für diese Open-Source-Datenschutz-Tools ein.
Föderiertes Lernen: Statt werden die Daten nicht zentralisiert, sondern das Modell wird an das Gerät gesendet (Edge Computing). Das Modell lernt lokal und sendet nur Aktualisierungen zurück, wobei die Rohdaten auf dem Gerät des Nutzers verbleiben. Dies ist zunehmend relevant für autonome Fahrzeuge und mobile Geräte.
Synthetische Daten: Generierung von künstlicher Daten, die die statistischen Eigenschaften der realen Welt nachahmen, können Ingenieure Modelle trainieren, ohne dass sie jemals echten Benutzerdaten.

Beispiel: Anonymisierung von Bildmaterial mit Python

Eine der häufigsten Aufgaben zum Schutz der Privatsphäre besteht darin, Gesichter oder sensible Bereiche in visuellen Daten unkenntlich zu machen. Das folgende Beispiel zeigt, wie man YOLO11 verwendet wird, um detect Objekt (wie eine Person) zu erkennen und eine Unschärfe anzuwenden, um ihre Identität zu schützen.

import cv2
from ultralytics import YOLO

# Load the YOLO11 model
model = YOLO("yolo11n.pt")

# Read an image
img = cv2.imread("bus.jpg")

# Run object detection
results = model(img)

# Iterate through detections and blur identified objects
for box in results[0].boxes.xyxy:
    x1, y1, x2, y2 = map(int, box)
    # Extract the region of interest (ROI)
    roi = img[y1:y2, x1:x2]
    # Apply a Gaussian blur to the ROI to anonymize it
    img[y1:y2, x1:x2] = cv2.GaussianBlur(roi, (51, 51), 0)

# Save the anonymized image
cv2.imwrite("bus_anonymized.jpg", img)

Datenschutz

Trainieren Sie Ultralytics YOLO zur Rationalisierung von Arbeitsabläufen in verschiedenen Branchen

Flexible Enterprise-Lizenzlösung zur Förderung Ihrer Innovationen

Trainieren Sie AI-Modelle in Sekundenschnelle mit Ultralytics YOLO

Grundprinzipien des Datenschutzes

Datenprivatsphäre vs. Datensicherheit

Real-World-Anwendungen in AI

Techniken zur Wahrung der Privatsphäre

Beispiel: Anonymisierung von Bildmaterial mit Python

Mehr in dieser Kategorie lesen

Verstehen, warum Annotationen durch Menschen entscheidend sind

Was ist Datensatzdestillation? Ein kurzer Überblick

Die Oakley Meta AI-Brille definiert mit Vision AI die Welt der Brillen neu.

Werden Sie Mitglied der Ultralytics