Détection des anomalies
Découvrez comment la détection d'anomalies dans l'IA/ML identifie des modèles inhabituels dans les données, avec des applications dans la prévention de la fraude, les soins de santé, et plus encore.
La détection des anomalies est une technique utilisée dans le cadre de l'apprentissage automatique pour identifier des éléments, des événements ou des observations rares qui suscitent des soupçons en raison de leur différence significative par rapport à la majorité des données. Ces cas non conformes sont appelés anomalies, valeurs aberrantes ou nouveautés. L'objectif principal est de distinguer automatiquement les points de données normaux des points anormaux. Cette capacité est essentielle dans un grand nombre de domaines, car elle permet l'identification proactive de problèmes tels que les pannes d'équipement, les fraudes financières, les failles de sécurité et les problèmes médicaux. Dans le contexte de la vision par ordinateur, la détection des anomalies consiste à trouver des modèles ou des objets inhabituels dans les images et les vidéos qui ne sont pas conformes au comportement attendu.
Détection d'anomalies et détection d'objets
Il est important de distinguer la détection d'anomalies de la détection d'objets.
- Détection d'objets: Cette tâche consiste à identifier et à localiser des instances de classes d'objets connues dans une image. Par exemple, un modèle de détection d'objets est entraîné à trouver toutes les voitures, tous les piétons et tous les panneaux de signalisation dans une image de rue. Le modèle sait ce qu'il recherche en fonction des catégories prédéfinies dans ses données d'apprentissage.
- Détection des anomalies: Cette tâche consiste à identifier tout ce qui s'écarte d'une définition apprise de la "normalité". Dans de nombreux cas, le système ne sait pas à l'avance à quoi ressemblera l'anomalie. Par exemple, il peut être entraîné sur des milliers d'images de produits impeccables et chargé de repérer toute imperfection, qu'il s'agisse d'une rayure, d'une bosse ou d'une décoloration - des types de défauts qu'il n'a peut-être jamais vus auparavant.
Bien qu'un modèle comme Ultralytics YOLO puisse être entraîné sur mesure pour effectuer une version de la détection d'anomalies en traitant des défauts spécifiques comme des objets, les approches fondamentales diffèrent. La détection traditionnelle d'objets nécessite des exemples de chaque classe qu'elle doit trouver, alors que de nombreuses méthodes de détection d'anomalies ne nécessitent que des données représentant un état normal.
Méthodes de détection des anomalies
Les techniques de détection des anomalies peuvent être largement classées en fonction de la disponibilité des étiquettes dans l'ensemble de données:
- Apprentissage supervisé: Cette méthode nécessite un ensemble de données étiquetées avec des exemples "normaux" et "anormaux". Un modèle de classification est formé pour faire la distinction entre les deux. Cette approche est très efficace mais limitée par la nécessité de disposer d'un grand ensemble de données bien étiquetées, ce qui peut être difficile à obtenir puisque les anomalies sont, par définition, rares.
- Apprentissage semi-supervisé: Il s'agit de l'approche la plus courante, dans laquelle le modèle est formé uniquement sur un ensemble de données d'exemples normaux. Le système apprend les modèles normaux et signale comme anomalie tout point de données qui s'écarte du modèle appris. Cette approche est très pratique pour les scénarios dans lesquels les anomalies sont diverses et imprévisibles.
- Apprentissage non supervisé: Cette méthode fonctionne sans aucune étiquette. Elle part du principe que les anomalies sont peu nombreuses et distinctes des points de données normaux. Des algorithmes tels que le regroupement (par exemple, DBSCAN) ou des méthodes statistiques sont utilisés pour regrouper les points de données, les points isolés ou les petits groupes étant identifiés comme des anomalies. Un aperçu complet des différentes méthodes peut être trouvé dans les études universitaires sur le sujet, telles que"Deep Learning for Anomaly Detection : A Survey".
Applications dans le monde réel
La détection des anomalies est la pierre angulaire de nombreux systèmes intelligents, fournissant des informations essentielles dans tous les secteurs d'activité.
- Contrôle de la qualité de la fabrication: Sur une chaîne de montage, les systèmes de vision artificielle peuvent contrôler les produits en temps réel. Un modèle formé à partir d'images d'articles parfaits peut instantanément repérer des défauts tels que des fissures, des désalignements ou des composants manquants. Cette inspection automatisée, souvent étudiée dans le cadre de la fabrication intelligente, permet d'améliorer la qualité et de réduire les déchets bien plus efficacement que les contrôles manuels.
- Sécurité et surveillance: Dans les espaces publics ou les installations sécurisées, les systèmes de surveillance alimentés par l'IA peuvent détecter des événements anormaux. Il peut s'agir, par exemple, d'identifier un véhicule roulant à contre-sens, de détecter un sac abandonné dans un aéroport ou de signaler l'accès non autorisé à une zone restreinte. Ces systèmes peuvent fournir des alertes en temps réel au personnel de sécurité.
- L'IA dans les soins de santé: La détection d'anomalies aide à l'analyse d'images médicales en mettant en évidence les cellules potentiellement cancéreuses dans les scanners ou en identifiant les battements de cœur irréguliers dans les données ECG.
- Détection des fraudes financières: Les banques et les institutions financières utilisent la détection des anomalies pour surveiller les flux de transactions et identifier les schémas indiquant une activité frauduleuse, tels que ceux trouvés dans les ensembles de données publiques comme l'ensemble de données Credit Card Fraud Detection (détection des fraudes à la carte de crédit) sur Kaggle.
- Cybersécurité: Le trafic réseau est surveillé afin de détecter des schémas inhabituels qui pourraient signaler une cyberattaque ou une violation de données. Des organisations telles que l'Agence pour la cybersécurité et la sécurité des infrastructures (CISA) mettent l'accent sur ces mesures proactives.
Outils et technologies
Le développement de systèmes robustes de détection d'anomalies implique souvent une combinaison de bibliothèques de ML standard et de plateformes spécialisées.