Détection d'anomalies
Découvrez comment la détection d'anomalies dans l'IA/ML identifie les schémas inhabituels dans les données, avec des applications dans la prévention de la fraude, les soins de santé, etc.
La détection d'anomalies est une technique utilisée dans l'apprentissage automatique (ML) pour identifier les éléments, événements ou observations rares qui suscitent des soupçons en différant significativement de la majorité des données. Ces instances non conformes sont appelées anomalies, valeurs aberrantes ou nouveautés. L'objectif principal est de distinguer automatiquement les points de données normaux des points de données anormaux. Cette capacité est essentielle dans un large éventail de domaines, car elle permet l'identification proactive de problèmes tels que les défaillances d'équipement, la fraude financière, les violations de sécurité et les problèmes médicaux. Dans le contexte de la vision par ordinateur (CV), la détection d'anomalies consiste à trouver des motifs ou des objets inhabituels dans des images et des vidéos qui ne sont pas conformes au comportement attendu.
Détection d'anomalies vs. Détection d'objets
Il est important de différencier la détection d'anomalies de la détection d'objets.
- Détection d'objets : Cette tâche se concentre sur l'identification et la localisation d'instances de classes d'objets connues dans une image. Par exemple, un modèle de détection d'objets est entraîné pour trouver toutes les voitures, les piétons et les panneaux de signalisation dans une image de rue. Le modèle sait ce qu'il recherche en fonction des catégories prédéfinies dans ses données d'entraînement.
- Détection d'anomalies : Cette tâche consiste à identifier tout ce qui s'écarte d'une définition apprise de "normal". Dans de nombreux cas, le système ne sait pas à quoi ressemblera l'anomalie à l'avance. Par exemple, il peut être entraîné sur des milliers d'images de produits impeccables et être chargé de signaler toute imperfection, qu'il s'agisse d'une rayure, d'une bosse ou d'une décoloration, des types de défauts qu'il n'a peut-être jamais vus auparavant.
Bien qu'un modèle comme Ultralytics YOLO puisse être entraîné sur mesure pour effectuer une version de la détection d'anomalies en traitant des défauts spécifiques comme des objets, les approches fondamentales diffèrent. La détection d'objets traditionnelle nécessite des exemples de chaque classe qu'elle doit trouver, alors que de nombreuses méthodes de détection d'anomalies ne nécessitent que des données représentant un état normal.
Méthodes de détection d'anomalies
Les techniques de détection d'anomalies peuvent être largement classées en fonction de la disponibilité des étiquettes dans l'ensemble de données :
- Apprentissage supervisé : Cette méthode nécessite un ensemble de données qui a été étiqueté avec des exemples à la fois « normaux » et « anormaux ». Un modèle de classification est entraîné pour faire la distinction entre les deux. Cette approche est très efficace, mais limitée par la nécessité d'un ensemble de données vaste et bien étiqueté, ce qui peut être difficile à obtenir, car les anomalies sont, par définition, rares.
- Apprentissage semi-supervisé : C'est l'approche la plus courante, où le modèle est entraîné uniquement sur un ensemble de données d'exemples normaux. Le système apprend les schémas normaux et signale tout point de données qui s'écarte de ce modèle appris comme une anomalie. Ceci est très pratique pour les scénarios où les anomalies sont diverses et imprévisibles.
- Apprentissage non supervisé : Cette méthode fonctionne sans aucune étiquette. Elle part du principe que les anomalies sont rares et distinctes des points de données normaux. Des algorithmes tels que le clustering (par exemple, DBSCAN) ou des méthodes statistiques sont utilisés pour regrouper les points de données, les points isolés ou les petits clusters étant identifiés comme des anomalies. Un aperçu complet des différentes méthodes est disponible dans les études académiques sur le sujet, telles que « Deep Learning for Anomaly Detection: A Survey ».
Applications concrètes
La détection d'anomalies est une pierre angulaire de nombreux systèmes intelligents, fournissant des informations essentielles dans divers secteurs.
- Contrôle qualité de la fabrication: Sur une chaîne de montage, les systèmes de vision par ordinateur peuvent surveiller les produits en temps réel. Un modèle entraîné sur des images d'articles parfaits peut instantanément repérer les défauts tels que les fissures, les mauvais alignements ou les composants manquants. Cette inspection automatisée, souvent explorée dans la fabrication intelligente, améliore la qualité et réduit les déchets beaucoup plus efficacement que les contrôles manuels.
- Sécurité et surveillance : Dans les espaces publics ou les installations sécurisées, les systèmes de surveillance basés sur l'IA peuvent détecter les événements anormaux. Il peut s'agir, par exemple, d'identifier un véhicule qui roule à contresens, de détecter un sac abandonné dans un aéroport ou de signaler un accès non autorisé à une zone restreinte. Ces systèmes peuvent fournir des alertes en temps réel au personnel de sécurité.
- IA dans le domaine de la santé : La détection d'anomalies aide à l'analyse d'images médicales en mettant en évidence les cellules potentiellement cancéreuses dans les scans ou en identifiant les battements cardiaques irréguliers à partir des données ECG.
- Détection de la fraude financière : les banques et les institutions financières utilisent la détection des anomalies pour surveiller les flux de transactions et identifier les schémas indiquant une activité frauduleuse, comme ceux que l’on trouve dans les ensembles de données publiques comme l’ensemble de données de détection de la fraude par carte de crédit sur Kaggle.
- Cybersécurité : Le trafic réseau est surveillé pour détecter les schémas inhabituels qui pourraient signaler une cyberattaque ou une violation de données. Des organisations comme la Cybersecurity and Infrastructure Security Agency (CISA) mettent l'accent sur de telles mesures proactives.
Outils et technologies
Le développement de systèmes robustes de détection d'anomalies implique souvent une combinaison de bibliothèques de ML standard et de plateformes spécialisées.