Glossaire

Normalisation

Découvrez la puissance de la normalisation dans l'apprentissage automatique ! Découvrez comment elle améliore l'entraînement des modèles, augmente les performances et garantit des solutions d'IA robustes.

La normalisation est une technique fondamentale de technique fondamentale de prétraitement des données utilisée pour les caractéristiques numériques d'un ensemble de données à une échelle commune, généralement sans déformer les différences dans les plages de valeurs ou perdre des informations. valeurs ou perdre des informations. Dans le contexte de l 'apprentissage automatique (ML) et l 'apprentissage profond (DL), ce processus est essentiel pour garantir que les données d'entrée sont dans un format que les algorithmes peuvent traiter efficacement. En ajustant les valeurs - souvent dans une plage entre 0 et 1 - la normalisation empêche les caractéristiques ayant des échelles numériques plus importantes de dominer le processus d'apprentissage du modèle, garantissant ainsi une contribution cohérente de toutes les données. d'apprentissage du modèle, garantissant ainsi une contribution cohérente de toutes les entrées pendant l'apprentissage du modèle.

L'importance de la normalisation dans l'IA

L'objectif principal de la normalisation est de faciliter la stabilité et la rapidité de l'algorithme d'optimisation. l 'algorithme d'optimisation. De nombreux algorithmes, tels que la descente stochastique de gradient (SGD), s'appuient sur le calcul des distances ou des gradients entre les points de données. Si une caractéristique s'étend de 0 à 100 000 (par exemple, le prix des prix des maisons) et qu'une autre varie de 0 à 10 (par exemple, le nombre de pièces), l'optimiseur aura du mal à naviguer efficacement dans la fonction de perte. fonction de perte.

Une normalisation correcte offre plusieurs avantages importants :

Convergence plus rapide : Il permet à l'algorithme de descente du gradient de converger plus rapidement. algorithme de descente de gradient de converger plus rapidement vers la solution optimale, ce qui réduit les ressources de calcul nécessaires. vers la solution optimale, réduisant ainsi les ressources informatiques nécessaires.
Stabilité numérique : Le fait de conserver des valeurs faibles permet d'éviter les problèmes numériques, tels que l'explosion du gradient, où l'erreur est importante. l'explosion du gradient, où les gradients d'erreur d'erreur s'accumulent et entraînent des mises à jour instables du réseau.
Importance égale des caractéristiques : Il garantit que le modèle traite toutes les caractéristiques comme étant d'égale importance d'importance égale, ce qui permet d'éviter les biais en faveur des variables de plus grande ampleur. Il s'agit d'un aspect essentiel de l'ingénierie robuste .

Techniques de normalisation courantes

Il existe plusieurs méthodes de normalisation des données, chacune adaptée à des distributions et des algorithmes différents.

Échelle Min-Max : Il s'agit de la forme la plus courante de normalisation. Elle remet les données à l'échelle d'un intervalle fixe, généralement [0, 1]. Cette opération est réalisée en soustrayant la valeur minimale et en la divisant par la plage (maximum moins minimum). Vous pouvez explorer la mise en œuvre mathématique dans le module Scikit-Learn MinMaxScaler.
Normalisation du score Z : Souvent confondue avec la normalisation, normalisation (ou normalisation du score Z) transforme les données de manière à ce qu'elles aient une moyenne de 0 et un écart type de 1. distribution gaussienne.
Mise à l'échelle logarithmique : Pour les données présentant une queue importante ou des valeurs aberrantes extrêmes, l'application d'une transformation logarithmique logarithmique peut comprimer la plage de valeurs, rendant la distribution plus gérable pour le réseau neuronal (NN).

Normalisation ou normalisation par lots

Il est important de faire la distinction entre la normalisation des données d'entrée et la normalisation des données de sortie. la normalisation par lots.

Normalisation des données : se produit au cours de l'étape de pré-traitement des données annotées. prétraitement des données annotées. Elle est appliquée aux données brutes (images ou données tabulaires, par exemple) avant qu'elles n'entrent dans le modèle.
Normalisation par lots : Il s'agit d'une technique de couche spécifique utilisée dans les réseaux neuronaux profonds. Elle normalise les activations d'une couche pour chaque mini-lot pendant la formation. normalise les activations d'une couche pour chaque mini-lot pendant la formation. Alors que la normalisation des données prépare l'entrée, la normalisation des lots stabilise le processus d'apprentissage interne. l'entrée, la normalisation par lots stabilise le processus d'apprentissage interne, aidant les architectures profondes telles que les réseaux neuronaux profonds. YOLO11 à s'entraîner plus profondément et plus rapidement.

Applications concrètes

La normalisation est omniprésente dans divers domaines de l'intelligence artificielle.

Vision par ordinateur (VA) : Dans des tâches telles que détection d'objets et la détection d'objets et la classification d'images, les images sont composées valeurs de pixels allant de 0 à 255. L'introduction de ces grands nombres entiers directement dans un réseau peut ralentir l'apprentissage. A étape de prétraitement standard consiste à diviser les valeurs des pixels par 255,0 pour les normaliser dans la plage [0, 1]. Cette étape standardise les entrées pour des modèles tels que YOLO11 et le YOLO26.
Analyse d'images médicales : Les scanners médicaux, tels que ceux utilisés dans le cadre de l'IA dans les soins de santé, proviennent souvent de différentes sources. l 'IA dans les soins de santé, proviennent souvent machines différentes avec des échelles d'intensité variables. La normalisation garantit que les intensités des pixels d'une IRM ou d'un scanner sont comparables d'un patient à l'autre, ce qui est essentiel pour obtenir des résultats précis. comparables d'un patient à l'autre, ce qui est essentiel pour une détection précise des tumeurs.

Exemple de mise en œuvre

Alors que des bibliothèques avancées comme ultralytics de la normalisation d'image dans leurs pipelines de formation, il est il est utile de comprendre la logique sous-jacente. Voici un exemple de Python exemple d'utilisation numpy pour montrer comment normaliser manuellement les données les données des pixels d'une image de la plage 0-255 à la plage 0-1.

import numpy as np

# Simulate a 2x2 pixel image with 3 color channels (RGB)
# Values range from 0 to 255
raw_image = np.array([[[10, 255, 128], [0, 50, 200]], [[255, 255, 255], [100, 100, 100]]], dtype=np.float32)

# Apply Min-Max normalization to scale values to [0, 1]
# Since the known min is 0 and max is 255, we simply divide by 255.0
normalized_image = raw_image / 255.0

print(f"Original Max: {raw_image.max()}")
print(f"Normalized Max: {normalized_image.max()}")
print(f"Normalized Data Sample:\n{normalized_image[0][0]}")

Cette simple opération prépare les données d'entraînement pour l'ingestion par un réseau neuronal, en veillant à ce que les opérations mathématiques à l'intérieur des couches fonctionnent de manière optimale.

Normalisation

Former les modèlesYOLO d'Ultralytics pour rationaliser les flux de travail dans tous les secteurs d'activité

Solution de licence d'entreprise flexible pour dynamiser votre innovation

Former des modèles d'IA en quelques secondes avec Ultralytics YOLO

L'importance de la normalisation dans l'IA

Techniques de normalisation courantes

Normalisation ou normalisation par lots

Applications concrètes

Exemple de mise en œuvre

En savoir plus dans cette catégorie

Tendances futures en matière de détection d'objets : 7 éléments clés à surveiller

Améliorer la réidentification des véhicules avec les modèlesYOLO 'Ultralytics

Améliorer la prédiction des collisions avec les modèles Ultralytics YOLO

Rejoindre la communauté Ultralytics