Glossaire

Fonction de perte

Découvrez le rôle des fonctions de perte dans l'apprentissage automatique, leurs types, leur importance et les applications réelles de l'IA telles que YOLO et la détection d'objets.

Une fonction de perte, souvent appelée fonction de coût ou fonction objective, constitue le noyau mathématique de l'apprentissage automatique moderne et de l'analyse des données. modernes d'apprentissage automatique (ML) et systèmes d'apprentissage profond (DL). Elle quantifie la entre la sortie prédite d'un modèle et la vérité de terrain fournie par les données d'apprentissage. données d'apprentissage. Essentiellement, la fonction de perte calcule une valeur numérique unique qui représente l'"erreur" du modèle à un moment donné. une valeur élevée indique une mauvaise performance, tandis qu'une valeur faible suggère que les prédictions sont proches de la cible. L'objectif principal L'objectif principal de la phase d'apprentissage du modèle est de minimiser cette valeur de manière itérative, guidant ainsi les prédictions vers la cible. de manière itérative, guidant ainsi le réseau neuronal vers une plus grande précision.

Les mécanismes de l'apprentissage

Le processus d'apprentissage en intelligence artificielle est piloté par la boucle de rétroaction fournie par la fonction de perte. Lorsqu'un un modèle traite un lot de données, il génère des prédictions qui sont immédiatement comparées aux étiquettes correctes à l'aide de la fonction de perte. à l'aide de la fonction de perte. Cette erreur calculée n'est pas simplement un score, mais un signal utilisé pour l'amélioration.

Une fois la perte calculée, un processus appelé rétro-propagation détermine le gradient de la perte en fonction des paramètres du modèle. Un algorithme d'optimisation, tel que Descente stochastique du gradient (SGD) ou l'optimiseurAdam , utilise ces informations de gradient gradient pour ajuster les poids internes du modèle. Ces minuscules ajustements sont contrôlés par un taux d'apprentissage taux d'apprentissage spécifique, garantissant que le modèle converge vers un état optimal où la perte est minimisée.

Types courants de fonctions de perte

Différentes tâches de vision par ordinateur nécessitent des formules mathématiques différentes pour mesurer efficacement l'erreur.

Erreur quadratique moyenne (EQM) : Principalement utilisée dans l'analyse de régression, cette fonction calcule l'erreur quadratique moyenne (EQM). dans l'analyse de régression, cette fonction calcule la différence quadratique moyenne entre les valeurs estimées et les valeurs réelles. différence quadratique moyenne entre les valeurs estimées et la valeur réelle. Elle est utile pour prédire des données numériques données numériques continues, telles que les prix des logements ou les coordonnées.
Perte d'entropie croisée : il s'agit de la fonction de perte standard pour les problèmes de classification d'images. problèmes de classification d'images. Elle mesure Elle mesure les performances d'un modèle de classification dont le résultat est une valeur de probabilité comprise entre 0 et 1. pénalise efficacement les prédictions erronées avec un niveau de confiance élevé, ce qui est essentiel pour l'entraînement des modèles sur des ensembles de données tels que les images. ImageNet.
Perte focale : Conçu pour remédier au déséquilibre des classes, Focal Loss applique un terme modulant à la perte standard d'entropie croisée afin de concentrer l'apprentissage sur les exemples difficiles classify classer. Ceci est particulièrement important dans la détection d'objets où l'arrière-plan l'arrière-plan l'emporte largement sur les objets d'intérêt.
Perte d'IoU : Variantes de l 'intersection sur l'union (IoU), telles que IoU et CIoU, sont essentielles pour la régression de la boîte englobante. telles que GIoU et CIoU, sont essentielles pour la régression de la boîte englobante. Elles mesurent le chevauchement entre la boîte prédite et la boîte de vérité la boîte de la vérité de terrain. Des modèles très performants tels que Ultralytics YOLO11 utilisent ces fonctions de perte sophistiquées sophistiquées pour obtenir une localisation précise des objets.
Perte de dés : Largement utilisée dans la segmentation sémantique, cette fonction est utilisée dans la segmentation sémantique. segmentation sémantique, cette fonction mesure le chevauchement entre deux échantillons et est particulièrement robuste contre le déséquilibre des classes dans les tâches de classification par pixel. dans les tâches de classification par pixel.

Applications concrètes

Les fonctions de perte sont présentes dans les coulisses de pratiquement toutes les applications réussies de l'IA, garantissant la sécurité et la fiabilité. et la fiabilité.

Fabrication automatisée : En milieu industriel, l 'IA dans la fabrication repose sur des systèmes sur des systèmes de détection des défauts. Une fonction de perte aide le modèle à apprendre les subtiles différences visuelles entre un produit parfait et un produit défectueux. parfait et un produit défectueux. En minimisant la perte au cours de la formation sur un ensemble de données d'inspection de la qualité, le système apprend à détecter les anomalies sur les chaînes de montage. d 'inspection de la qualité, le système apprend à repérer les anomalies sur les chaînes de montage avec une grande précision, ce qui permet de réduire les déchets.
Diagnostic médical : Dans le domaine de l'analyse d'images médicales, des modèles comme U-Net utilisent la perte de dés ou l'entropie croisée pondérée pour identifier les pathologies. Par exemple, lors de l'entraînement sur un sur un ensemble de données de détection de tumeurs cérébrales, la fonction de perte pénalise fortement le modèle s'il manque des tumeurs cancéreuses. pénalise fortement le modèle s'il manque des pixels cancéreux, ce qui le guide pour segment avec précision les tumeurs des tissus sains, ce qui est vital pour l'analyse de l'image. les tumeurs et les tissus sains, ce qui est essentiel pour l'IA dans les processus de soins de santé. l 'IA dans les flux de travail des soins de santé.

Exemple Python : Surveillance de la perte

Lorsque l'on utilise des cadres de haut niveau, le calcul de la perte est souvent automatisé. L'exemple suivant montre l'entraînement d'un modèle YOLO11 dans lequel la fonction de perte est automatiquement sélectionnée et calculée pour optimiser les performances. La boucle imprime les valeurs de perte (perte de boîte, perte de classe, etc.) après chaque période.

from ultralytics import YOLO

# Load the YOLO11 nano model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 dataset
# The loss functions (IoU, DFL, Cls) are automatically applied and minimized
results = model.train(data="coco8.yaml", epochs=3, imgsz=640)

# Loss metrics are recorded in the results object
print("Final Box Loss:", results.results_dict.get("train/box_loss"))

Distinction par rapport aux concepts apparentés

Pour bien comprendre le pipeline de formation, il est utile de distinguer la fonction de perte des autres mesures et composants. composants.

Fonction de perte et mesures d'évaluation : Bien qu'elles mesurent toutes deux les performances, elles servent des phases différentes. La fonction de perte est différentiable et utilisée pendant l' apprentissage pour mettre à jour les poids (par exemple, perte logarithmique). Les mesures d'évaluation telles que La précision, Précision et précision moyenne (mAP) sont utilisées après les étapes de après les étapes de formation pour interpréter les performances du modèle en termes lisibles par l'homme. Un modèle peut minimiser efficacement la perte mais avoir une faible précision si la fonction de perte n'est pas bien alignée avec la métrique d'évaluation.
Fonction de perte et régularisation : La fonction de perte oriente le modèle vers la bonne réponse, tandis que les techniques de régularisation de régularisation (comme L1, L2 ou Dropout) sont ajoutées à l'équation de perte pour empêcher l 'ajustement excessif. La régularisation pénalise les modèles trop modèles trop complexes, en s'assurant qu'ils se généralisent bien à de nouvelles données de test inédites.
Fonction de perte et optimisation : La fonction de perte définit l ' objectif à atteindre (minimiser l'erreur), tandis que l'algorithme d'optimisation définit la manière d' atteindre cet objectif (mise à jour des poids via les gradients). Vous pouvez explorer différents optimiseurs dans la documentation de documentationPyTorch .

Fonction de perte

Former les modèlesYOLO d'Ultralytics pour rationaliser les flux de travail dans tous les secteurs d'activité

Solution de licence d'entreprise flexible pour dynamiser votre innovation

Former des modèles d'IA en quelques secondes avec Ultralytics YOLO

Les mécanismes de l'apprentissage

Types courants de fonctions de perte

Applications concrètes

Exemple Python : Surveillance de la perte

Distinction par rapport aux concepts apparentés

En savoir plus dans cette catégorie

Comprendre pourquoi l'annotation humaine est essentielle

Qu'est-ce que la distillation de jeux de données ? Un aperçu rapide

Les lunettes Oakley Meta AI redéfinissent les lunettes grâce à la technologie Vision AI.

Rejoindre la communauté Ultralytics