Glossar

Maschinelles Vergessen

Entdecken Sie das „Machine Unlearning“, um sensible Trainingsdaten gezielt zu entfernen. Erfahren Sie, wie Sie mit Ultralytics die Einhaltung der DSGVO und den Datenschutz gewährleisten können.

Das „Machine Unlearning“ ist ein aufstrebendes Teilgebiet des maschinellen Lernens, das sich darauf konzentriert, den Einfluss einer bestimmten Teilmenge von Trainingsdaten aus einem trainierten Modell zu entfernen. Da Modelle riesige Informationsmengen verarbeiten, ist die Fähigkeit, Daten selektiv zu „vergessen“, entscheidend geworden. Dieser Prozess ermöglicht es Entwicklern, bestimmte Datenpunkte zu extrahieren, ohne die gesamte Architektur von Grund auf neu trainieren zu müssen, was erhebliche Zeit- und Rechenressourcen einspart.

Der Hauptgrund für diese Technologie ist der Datenschutz. Mit dem Inkrafttreten strenger Datenschutzvorschriften und Bestimmungen wie dem Recht auf Vergessenwerden gemäß der DSGVO haben Nutzer das gesetzliche Recht, die Löschung ihrer personenbezogenen Daten zu verlangen. Das „Machine Unlearning“ bietet eine Möglichkeit, diese Daten sicher aus Deep-Learning-Modellen zu entfernen, wodurch die Einhaltung der Vorschriften gewährleistet wird, während der Gesamtnutzen des Modells erhalten bleibt.

So funktioniert das „Unlearning“ von Maschinen

Herkömmliche Mechanismen des Gradientenabstiegs verknüpfen Trainingsdaten eng mit den Gewichten eines Netzwerks. Aus diesem Grund werden die gelernten Muster nicht aus dem Modell selbst entfernt, wenn lediglich das ursprüngliche Bild oder die Textdatei aus einer Datenbank gelöscht wird. Techniken zum maschinellen Vergessen lassen sich im Allgemeinen in zwei Kategorien einteilen: exaktes Vergessen und approximatives Vergessen. Exaktes Unlearning garantiert, dass das endgültige Modell statistisch identisch mit einem Modell ist, das vollständig ohne die vergessenen Daten trainiert wurde, was oft durch geschickte Datensatzpartitionierung erreicht wird. Approximatives Unlearning, das in aktuellen Studien zu effizienten Unlearning-Algorithmen häufig diskutiert wird, nutzt mathematische Eingriffe, um die Parameter des Modells anzupassen und den Einfluss der Zieldaten nachträglich zu maskieren.

Es ist wichtig, maschinelles Verlernen von kontinuierlichem Lernen zu unterscheiden. Während kontinuierliches Lernen darauf abzielt, schrittweise neues Wissen hinzuzufügen, ohne dass es zu einem katastrophalen Vergessen kommt, ist Verlernen die bewusste, gezielte Entfernung von Wissen. Organisationen, die sich auf algorithmische Fairness konzentrieren, nutzen das Verlernen auch, um Verzerrungen in der KI zu korrigieren, indem sie schädliche oder verzerrte Daten nach dem Training bereinigen.

Anwendungsfälle in der Praxis

Algorithmen zum Verlernen haben sich rasch von der theoretischen KI-Sicherheitsforschung hin zur praktischen Umsetzung in verschiedenen Branchen entwickelt.

Gesundheitswesen und medizinische Bildgebung: Bei der medizinischen Bildanalyse kann die Einwilligung des Patienten jederzeit widerrufen werden. Wenn ein Patient die Entfernung seiner Röntgenbilder verlangt, können Krankenhäuser mithilfe des „Unlernens“ seine spezifischen physiologischen Muster aus einem Diagnosemodell extrahieren, ohne die Fähigkeit des Systems zur detect Krankheiten bei anderen Patienten zu beeinträchtigen.
Überwachung und Sicherheit: In modernen intelligenten Überwachungssystemen können Kameras unbeabsichtigt personenbezogene Daten (PII) wie Kfz-Kennzeichen oder Gesichter erfassen. Durch „Unlearning“ können Entwickler diese spezifischen personenbezogenen Daten nachträglich aus einem bereits im Einsatz befindlichen Computer-Vision-Modell entfernen, um den Anforderungen datenschutzkonformer KI-Verfahren gerecht zu werden.

Strategien zum Verlernen umsetzen

Während direkte, einstufige APIs zum Unlernen nach wie vor ein aktives Forschungsgebiet im Rahmen von „Machine Unlearning“-Herausforderungen darstellen, erreichen Praktiker oft eine exakte Unlern-Baseline, indem sie einen bereinigten Datensatz zusammenstellen und einen schnellen Neutrainingszyklus einleiten. Bei der Nutzung der Ultralytics für das cloudbasierte Datenmanagement können Sie einen Datensatz ganz einfach versionieren, um widerrufene Daten auszuschließen.

Nachfolgend finden Sie ein kurzes Python , das den grundlegenden Ansatz des „Unlernens“ durch das erneute Trainieren von Ultralytics auf einem bereinigten Datensatz veranschaulicht:

from ultralytics import YOLO

# Load an existing, pre-trained Ultralytics YOLO26 model
model = YOLO("yolo26n.pt")

# Naive exact unlearning: perform efficient retraining on a sanitized dataset.
# The 'sanitized_data.yaml' excludes the specific sensitive data to be "unlearned"
results = model.train(data="sanitized_data.yaml", epochs=50, device="cuda")

Da die Nachfrage nach Modelloptimierung und Robustheit bei neuronalen Netzen steigt, wird das „Unlernen“ zu einer Standardanforderung. Ganz gleich, ob Sie komplexe Bildklassifizierungs-Pipelines verwalten oder Modelle am Netzwerkrand einsetzen – die Integration von Mechanismen zum verantwortungsvollen Vergessen von Daten stellt sicher, dass Ihre KI-Systeme konform, fair und vertrauenswürdig bleiben.

Maschinelles Vergessen

Exportieren Sie in über 17 Formate. Stellen Sie Ihre Inhalte in 43 Regionen weltweit bereit.

Trainieren Sie YOLO26 auf H100-GPUs für 2,39 $ pro Stunde.

Flexible Unternehmenslizenzen zur Umsetzung Ihrer Vision-AI-Projekte.

Unternehmenslizenzen, die Ihr nächstes Projekt voranbringen

Bis zu 10-mal schneller beschriften dank intelligenter Beschriftung

Annotieren. Trainieren. Bereitstellen. Alles auf einer Plattform.

So funktioniert das „Unlearning“ von Maschinen

Anwendungsfälle in der Praxis

Strategien zum Verlernen umsetzen

Mehr in dieser Kategorie lesen

So exportieren Sie Ultralytics YOLO mithilfe Ultralytics

Erkennung unsicherer Palettenstapel mit Ultralytics

Ein Leitfaden zur Polygon-Annotation mit Ultralytics

Lassen Sie uns gemeinsam die Zukunft der KI gestalten!

Maschinelles Vergessen

Exportieren Sie in über 17 Formate. Stellen Sie Ihre Inhalte in 43 Regionen weltweit bereit.

Trainieren Sie YOLO26 auf H100-GPUs für 2,39 $ pro Stunde.

Flexible Unternehmenslizenzen zur Umsetzung Ihrer Vision-AI-Projekte.

Unternehmenslizenzen, die Ihr nächstes Projekt voranbringen

Bis zu 10-mal schneller beschriften dank intelligenter Beschriftung

Annotieren. Trainieren. Bereitstellen. Alles auf einer Plattform.

So funktioniert das „Unlearning“ von Maschinen

Anwendungsfälle in der Praxis

Strategien zum Verlernen umsetzen

Mehr in dieser Kategorie lesen

So exportieren Sie Ultralytics YOLO mithilfe Ultralytics

Erkennung unsicherer Palettenstapel mit Ultralytics

Ein Leitfaden zur Polygon-Annotation mit Ultralytics

Lassen Sie uns gemeinsam die Zukunft der KI gestalten!

Annotieren. Trainieren. Bereitstellen. Alles auf einer Plattform.