Découvre YOLO26 : l'IA de vision de nouvelle génération.
Ultralytics
Retour au glossaire Ultralytics

Data Poisoning

Apprends-en plus sur l'empoisonnement des données et son impact sur l'IA. Découvre comment sécuriser les modèles Ultralytics YOLO26 et protéger les données d'entraînement avec la plateforme Ultralytics.

L'empoisonnement des données est une menace de cybersécurité où des acteurs malveillants manipulent intentionnellement les données d'entraînement utilisées pour construire des modèles d'Apprentissage Automatique (ML). En corrompant le jeu de données avant l'entraînement d'un modèle, les attaquants peuvent introduire des portes dérobées cachées, induire des biais ou dégrader la performance globale du modèle. Contrairement à d'autres exploits de sécurité qui ciblent le code d'un système, les attaques par empoisonnement des données ciblent le processus d'apprentissage lui-même, ce qui les rend incroyablement difficiles à détecter une fois que le modèle est déployé dans des environnements de production. Selon l'aperçu de l'intelligence sur les menaces d'IBM, ces attaques font peser de graves risques sur l'intégrité et la fiabilité des systèmes d'intelligence artificielle.

Link to this sectionLa mécanique de l'empoisonnement de l'IA#

À mesure que les organisations dépendent de plus en plus de l'Apprentissage Profond (DL) et des Grands Modèles de Langage (LLM), elles récupèrent souvent de vastes quantités de données non vérifiées sur Internet. Cette pratique crée des opportunités d'injection de données, où des adversaires insèrent des points de données fabriqués ou malveillants dans des référentiels publics. Des études récentes sur l'empoisonnement de l'IA datant de 2025 révèlent une réalité alarmante : même pour des modèles massifs dotés de milliards de paramètres, un attaquant n'a besoin de manipuler qu'un nombre minimal et quasi constant d'échantillons pour compromettre le système.

L'empoisonnement des LLM se produit lorsque des phrases déclencheuses spécifiques sont injectées dans des textes que le modèle consomme pendant l'entraînement. Une fois déployé, le modèle peut fonctionner normalement jusqu'à ce qu'un utilisateur saisisse la phrase déclencheuse, amenant le système à contourner les protocoles de sécurité ou à générer des contenus toxiques. La recherche d'Anthropic de 2025 sur l'empoisonnement des LLM démontre qu'à peine 250 documents empoisonnés peuvent créer une porte dérobée dans un modèle de 13 milliards de paramètres.

Link to this sectionApplications et exemples concrets#

L'empoisonnement des données s'étend au-delà de la génération de texte et impacte également fortement les modèles de Vision par Ordinateur (CV). Voici deux exemples concrets de la manière dont cette menace se matérialise dans des applications réelles :

  • Perturbation des modèles d'art génératif : des outils comme le projet Nightshade permettent aux artistes numériques d'altérer subtilement les pixels de leurs œuvres avant de les mettre en ligne. Lorsqu'un modèle d'IA Générative récupère ces images pour l'entraînement, les pixels altérés agissent comme un poison, amenant le modèle à mal classifier les invites – par exemple, en générant l'image d'un chat alors qu'on lui demande une voiture.
  • Compromission des véhicules autonomes : dans les systèmes de détection d'objets utilisés pour les voitures autonomes, un attaquant pourrait altérer subtilement des images de panneaux stop dans un jeu de données d'entraînement open-source. En appliquant un bruit visuel spécifique, les données d'entraînement empoisonnées apprennent au modèle à interpréter à tort les panneaux stop comme des panneaux de limitation de vitesse, ce qui présente des risques de sécurité catastrophiques.

Link to this sectionDifférencier des attaques adverses#

Bien qu'étroitement liées, il est important de distinguer l'empoisonnement des données des Attaques Adverses. Les attaques adverses se produisent pendant l'inférence : l'attaquant manipule les données d'entrée (comme mettre un autocollant sur un vrai panneau stop) pour tromper un modèle déjà entraîné. À l'inverse, l'empoisonnement des données se produit pendant l'entraînement, altérant fondamentalement la logique interne du modèle dès le départ. Pour faire face aux deux, il faut des protocoles robustes de Sécurité de l'IA.

Link to this sectionAtténuation des risques dans le développement de modèles#

Se défendre contre ces menaces nécessite une surveillance de modèle rigoureuse et l'utilisation de données de validation vierges et fiables pour vérifier l'intégrité du modèle. Évaluer un modèle par rapport à un jeu de données vérifié peut aider les équipes à détecter des baisses de performance inattendues qui pourraient indiquer une altération. Les meilleures pratiques décrites par la recherche sur la sécurité d'OpenAI et le Projet de sécurité GenAI de l'OWASP soulignent l'importance d'une provenance stricte des données et de l'utilisation de jeux de données organisés plutôt que du web scraping brut.

Lors de la construction et du test de modèles, tu devrais tirer parti de frameworks établis comme PyTorch ou TensorFlow ainsi que de routines de validation complètes. Tu peux facilement valider ton modèle Ultralytics YOLO26 par rapport à un jeu de données propre et fiable pour t'assurer que la précision n'a pas été compromise.

from ultralytics import YOLO

# Load a custom-trained Ultralytics YOLO26 model
model = YOLO("yolo26n.pt")

# Validate the model on a trusted dataset to detect performance drops
# Sudden decreases in precision/recall may indicate data poisoning
metrics = model.val(data="clean_validation_data.yaml")

print(f"mAP50-95: {metrics.box.map}")  # Review core metrics

Pour les projets de vision par ordinateur à grande échelle, le suivi de ces métriques sur plusieurs cycles d'entraînement est essentiel. Tu peux explorer les aperçus d'évaluation de modèles pour comprendre les performances de base, et utiliser la Plateforme Ultralytics pour annoter, entraîner et gérer les données en toute sécurité sans dépendre de sources externes non vérifiées. Combiner une curation de données sécurisée avec des techniques contrôlées d'augmentation de données aide à garantir que tes modèles restent à la fois précis et résilients contre les manipulations externes.

Explore solutions

Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.
En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.
En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.
En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.
En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.
En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.
En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.
En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.
En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.
En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.
En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.
En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.
En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.
En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.
En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.
En savoir plus

Construisons ensemble le futur de l'IA !

Commence ton aventure avec le futur de l'apprentissage automatique