Découvrez ce qu'est l'empoisonnement des données et son impact sur l'IA. Découvrez comment sécuriser les modèles Ultralytics et protéger les données d'entraînement grâce à la Ultralytics .
L'empoisonnement des données est une menace de cybersécurité dans laquelle des acteurs malveillants manipulent intentionnellement les données d'entraînement utilisées pour construire des modèles d'apprentissage automatique (ML). En corrompant l' ensemble de données avant l'entraînement d'un modèle, les attaquants peuvent introduire des portes dérobées cachées, induire des biais ou dégrader les performances globales du modèle. Contrairement à d'autres failles de sécurité qui ciblent le code d'un système, les attaques par empoisonnement des données visent le processus d'apprentissage lui-même, ce qui les rend extrêmement difficiles à detect le modèle est déployé dans des environnements de production . Selon le rapport d'IBM sur les menaces, ces attaques font peser de graves risques sur l'intégrité et la fiabilité des systèmes d'intelligence artificielle.
Alors que les organisations s'appuient de plus en plus sur l'apprentissage profond (DL) et les grands modèles linguistiques (LLM), elles récupèrent souvent d'énormes quantités de données non vérifiées sur Internet. Cette pratique ouvre la voie à l'injection de données, une technique par laquelle des attaquants insèrent des données fabriquées de toutes pièces ou malveillantes dans des référentiels publics. Des études récentes sur l'empoisonnement de l'IA datant de 2025 révèlent une réalité alarmante : même pour des modèles massifs comportant des milliards de paramètres, un attaquant n'a besoin que de manipuler un nombre minimal et quasi constant d' échantillons pour compromettre le système.
L'empoisonnement des grands modèles de langage (LLM) se produit lorsque des phrases déclencheuses spécifiques sont injectées dans les textes que le modèle traite pendant son apprentissage. Une fois déployé, le modèle peut fonctionner normalement jusqu'à ce qu'un utilisateur saisisse la phrase déclencheuse, ce qui amène le système à contourner les protocoles de sécurité ou à générer des résultats toxiques. Les recherchesAnthropic en 2025 sur l'empoisonnement des LLM démontrent que seulement 250 documents empoisonnés suffisent à créer une porte dérobée dans un modèle de 13 milliards de paramètres.
L'empoisonnement des données ne se limite pas à la génération de texte et affecte également de manière significative les modèles de vision par ordinateur (CV). Voici deux exemples concrets illustrant comment cette menace se concrétise dans des applications réelles :
Bien qu'ils soient étroitement liés, il est important de distinguer l'empoisonnement des données des attaques adversaires. Les attaques adversariales se produisent lors de l'inférence : l'attaquant manipule les données d'entrée (par exemple en collant un autocollant sur un panneau « Stop » dans le monde réel) pour tromper un modèle déjà entraîné. À l'inverse, l'empoisonnement des données se produit pendant l'entraînement, modifiant fondamentalement la logique interne du modèle dès sa conception. Pour lutter contre ces deux phénomènes, il faut des protocoles de sécurité de l'IA robustes.
Pour se prémunir contre ces menaces, il est nécessaire de mettre en place une surveillance rigoureuse des modèles et d'utiliser des données de validation intactes et fiables afin de vérifier l'intégrité des modèles. L'évaluation d'un modèle par rapport à un ensemble de données vérifiées peut aider les équipes à détecter des baisses de performances inattendues qui pourraient indiquer une altération. Les bonnes pratiques définies par les recherches en matière de sécurité menées par OpenAI et le projet OWASP GenAI Security mettent l'accent sur une traçabilité stricte des données et sur l'utilisation d'ensembles de données triés plutôt que de données brutes issues du web scraping.
Lors de la création et du test de modèles, les équipes devraient tirer parti de frameworks éprouvés tels que PyTorch ou TensorFlow , ainsi que des routines de validation complètes. Vous pouvez facilement valider votre modèle Ultralytics à l'aide d'un ensemble de données propre et fiable afin de vous assurer que la précision n'a pas été compromise.
from ultralytics import YOLO
# Load a custom-trained Ultralytics YOLO26 model
model = YOLO("yolo26n.pt")
# Validate the model on a trusted dataset to detect performance drops
# Sudden decreases in precision/recall may indicate data poisoning
metrics = model.val(data="clean_validation_data.yaml")
print(f"mAP50-95: {metrics.box.map}") # Review core metrics
Pour les projets de vision par ordinateur à grande échelle, il est essentiel de suivre ces indicateurs tout au long de plusieurs cycles d'entraînement. Les développeurs peuvent analyser les informations issues de l'évaluation des modèles pour comprendre les performances de base, et utiliser la Ultralytics pour annoter, entraîner et gérer les données en toute sécurité, sans avoir à recourir à des sources externes non vérifiées. En combinant une curation sécurisée des données avec des techniques contrôlées d'augmentation des données, vous contribuez à garantir que vos modèles restent à la fois précis et résistants aux manipulations externes.
Commencez votre parcours avec l'avenir de l'apprentissage automatique