Erfahren Sie mehr über Datenvergiftung und deren Auswirkungen auf KI. Erfahren Sie, wie Sie Ultralytics absichern und Trainingsdaten mit der Ultralytics schützen können.
Datenvergiftung ist eine Bedrohung der Cybersicherheit, bei der böswillige Akteure absichtlich die Trainingsdaten manipulieren, die zum Aufbau von Machine-Learning-Modellen (ML) verwendet werden. Indem sie den Datensatz vor dem Training eines Modells verfälschen, können Angreifer versteckte Hintertüren einbauen, Verzerrungen hervorrufen oder die Gesamtleistung des Modells beeinträchtigen. Im Gegensatz zu anderen Sicherheitsangriffen, die auf den Code eines Systems abzielen, zielen Data-Poisoning-Angriffe auf den Lernprozess selbst ab, was ihre detect extrem erschwert, detect das Modell in Produktionsumgebungen eingesetzt wird. Laut der Übersicht zu Bedrohungsinformationen von IBM stellen diese Angriffe ein erhebliches Risiko für die Integrität und Zuverlässigkeit von Systemen mit künstlicher Intelligenz dar.
Da Unternehmen zunehmend auf Deep Learning (DL) und große Sprachmodelle (LLMs) setzen, sammeln sie oft riesige Mengen an ungeprüften Daten aus dem Internet. Diese Vorgehensweise eröffnet Möglichkeiten für Dateninjektion, bei der Angreifer erfundene oder bösartige Datenpunkte in öffentliche Repositorien einschleusen. Aktuelle Studien zum Thema AI-Poisoning aus dem Jahr 2025 zeigen eine alarmierende Realität auf: Selbst bei riesigen Modellen mit Milliarden von Parametern muss ein Angreifer nur eine nahezu konstante, minimale Anzahl von Beispielen manipulieren, um das System zu kompromittieren.
LLM-Poisoning tritt auf, wenn bestimmte Triggerphrasen in Texte eingeschleust werden, die das Modell während des Trainings verarbeitet. Nach der Bereitstellung funktioniert das Modell möglicherweise zunächst normal, bis ein Nutzer die Triggerphrase eingibt, wodurch das System Sicherheitsprotokolle umgeht oder schädliche Ausgaben generiert. Anthropic Studie aus dem Jahr 2025 zum Thema LLM-Poisoning zeigt, dass bereits 250 manipulierte Dokumente eine Hintertür in einem Modell mit 13 Milliarden Parametern schaffen können.
Datenvergiftung geht über die Textgenerierung hinaus und hat erhebliche Auswirkungen auch auf Modelle der Bildverarbeitung (Computer Vision, CV). Hier sind zwei konkrete Beispiele dafür, wie sich diese Bedrohung in praktischen Anwendungen äußert:
Obwohl beide Phänomene eng miteinander verbunden sind, ist es wichtig, zwischen Datenvergiftung und adversarialen Angriffen zu unterscheiden. Adversarial Attacks finden während der Inferenz statt – der Angreifer manipuliert die Eingabedaten (etwa indem er einen Aufkleber auf ein echtes Stoppschild klebt), um ein bereits trainiertes Modell zu täuschen. Im Gegensatz dazu findet Data Poisoning während des Trainings statt und verändert die interne Logik des Modells von Grund auf. Um beides anzugehen, sind robuste KI-Sicherheitsprotokolle erforderlich.
Um sich gegen diese Bedrohungen zu schützen, sind eine strenge Modellüberwachung und die Verwendung von unverfälschten, vertrauenswürdigen Validierungsdaten zur Überprüfung der Modellintegrität erforderlich. Die Bewertung eines Modells anhand eines verifizierten Datensatzes kann Teams dabei helfen, unerwartete Leistungseinbußen zu erkennen, die auf Manipulationen hindeuten könnten. Die von der Sicherheitsforschung bei OpenAI und dem OWASP GenAI Security Project dargelegten Best Practices legen Wert auf eine strenge Datenherkunftsnachweisbarkeit und die Verwendung von kuratierten Datensätzen anstelle von rohen Web-Scraping-Daten.
Beim Erstellen und Testen von Modellen sollten Teams auf bewährte Frameworks wie PyTorch oder TensorFlow neben umfassenden Validierungsroutinen nutzen. Sie können Ihr Ultralytics ganz einfach anhand eines sauberen, vertrauenswürdigen Datensatzes validieren, um sicherzustellen, dass die Genauigkeit nicht beeinträchtigt wurde.
from ultralytics import YOLO
# Load a custom-trained Ultralytics YOLO26 model
model = YOLO("yolo26n.pt")
# Validate the model on a trusted dataset to detect performance drops
# Sudden decreases in precision/recall may indicate data poisoning
metrics = model.val(data="clean_validation_data.yaml")
print(f"mAP50-95: {metrics.box.map}") # Review core metrics
Bei groß angelegten Computer-Vision-Projekten ist es unerlässlich, diese Kennzahlen über mehrere Trainingsdurchläufe hinweg zu verfolgen. Entwickler können Erkenntnisse aus der Modellbewertung nutzen, um die Basisleistung zu verstehen, und die Ultralytics einsetzen, um Daten sicher zu annotieren, zu trainieren und zu verwalten, ohne auf unüberprüfte externe Quellen zurückgreifen zu müssen. Die Kombination aus sicherer Datenkuratierung und kontrollierten Techniken zur Datenvergrößerung trägt dazu bei, dass Ihre Modelle sowohl präzise bleiben als auch widerstandsfähig gegen externe Manipulationen sind.
Beginnen Sie Ihre Reise mit der Zukunft des maschinellen Lernens