Découvrez les principes fondamentaux de la régression logistique pour la classification binaire. Apprenez-en davantage sur la fonction sigmoïde, les scores de probabilité et sa comparaison avec YOLO26.
La régression logistique est une méthode statistique fondamentale et un algorithme d'apprentissage automatique principalement utilisé pour les tâches de classification binaire . Bien que son nom contienne le terme « régression », qui implique généralement la prédiction de valeurs continues (comme la température ou les cours boursiers), la régression logistique est conçue pour prédire la probabilité qu' une entrée donnée appartienne à une catégorie spécifique. Cela en fait un outil essentiel pour les problèmes dont le résultat est dichotomique, comme déterminer si un e-mail est un « spam » ou « non spam », ou si une tumeur médicale est « bénigne » ou « maligne ». Elle sert de pont entre les statistiques traditionnelles et l'apprentissage supervisé moderne , offrant un équilibre entre simplicité et interprétabilité qui est souvent utilisé comme base avant de mettre en œuvre des modèles plus complexes tels que les réseaux neuronaux .
Contrairement à la régression linéaire, qui ajuste une ligne droite aux points de données pour prédire un résultat continu, la régression logistique ajuste une courbe en forme de « S » aux données. Cette courbe est générée à l'aide de la fonction sigmoïde, une transformation mathématique qui mappe tout nombre réel en une valeur comprise entre 0 et 1. Ce résultat représente un score de probabilité, indiquant le degré de confiance qu'une instance appartient à la classe positive.
Au cours du processus d'apprentissage, l'algorithme apprend les poids et les biais optimaux weights and biases afin de minimiser les erreurs. Cela est généralement réalisé à l'aide d'un algorithme d'optimisation tel que la descente de gradient, qui ajuste de manière itérative les paramètres du modèle afin de réduire la différence entre les probabilités prédites et les étiquettes de classe réelles. La performance est souvent évaluée à l'aide d'une fonction de perte spécifique appelée perte logarithmique ou entropie croisée binaire . Une fois que le modèle a généré une probabilité, une limite de décision (souvent fixée à 0,5) classe l'entrée : les valeurs supérieures au seuil deviennent la classe positive, et les valeurs inférieures deviennent la classe négative.
Il est important de distinguer la régression logistique d'autres concepts similaires afin d'éviter toute confusion :
La régression logistique reste largement utilisée dans divers secteurs en raison de son efficacité et de la facilité avec laquelle ses résultats peuvent être interprétés.
Alors que les modèles d'apprentissage profond tels que YOLO26 sont préférés pour les tâches complexes telles que la détection d'objets, la régression logistique est souvent la couche finale dans les réseaux de classification d'images binaires . Par exemple, un réseau neuronal convolutif peut extraire des caractéristiques, et la couche finale agit comme un classificateur de régression logistique pour déterminer si une image contient un « chat » ou un « chien ».
Des outils tels que la Ultralytics simplifient le flux de travail pour l'entraînement de modèles de classification complexes qui utilisent ces principes sous-jacents. Cependant, pour comprendre le concept brut, des bibliothèques simples peuvent en démontrer les mécanismes.
Voici un exemple simple utilisant torch définir une structure de modèle de régression logistique à une seule couche :
import torch
import torch.nn as nn
# Define a simple Logistic Regression model class
class LogisticRegression(nn.Module):
def __init__(self, input_dim):
super().__init__()
# A single linear layer maps input features to a single output
self.linear = nn.Linear(input_dim, 1)
def forward(self, x):
# The sigmoid function transforms the linear output to a probability (0 to 1)
return torch.sigmoid(self.linear(x))
# Example usage: Initialize model for 10 input features
model = LogisticRegression(input_dim=10)
print(model)
Comprendre les forces et les faiblesses de cet algorithme aide à choisir l'outil adapté à la tâche à accomplir.