Découvre YOLO26 : l'IA de vision de nouvelle génération.
Ultralytics
Retour au glossaire Ultralytics

Data Preprocessing

Apprends comment le prétraitement des données transforme les données brutes en entrées propres pour l'IA. Explore des techniques clés comme la mise à l'échelle et la normalisation pour booster la précision d'Ultralytics YOLO26.

Le prétraitement des données est la première étape critique du pipeline d'apprentissage automatique, où les données brutes sont transformées en un format propre et compréhensible pour les algorithmes. Dans le monde réel, les données sont souvent incomplètes, incohérentes et manquent de comportements ou de tendances spécifiques, paraissant « sales » ou « bruitées » pour un ordinateur. Le prétraitement comble le fossé entre les informations brutes et les entrées structurées requises par les réseaux de neurones, impactant de manière significative la précision et l'efficacité du modèle final. En standardisant et en nettoyant les jeux de données, les ingénieurs s'assurent que des architectures sophistiquées comme YOLO26 peuvent apprendre des modèles significatifs plutôt que du bruit.

Link to this sectionPourquoi le prétraitement des données est-il important ?#

Les modèles d'apprentissage automatique, en particulier ceux utilisés en vision par ordinateur, sont sensibles à la qualité et à l'échelle des données d'entrée. Sans un prétraitement approprié, un modèle peut peiner à converger pendant l'entraînement ou produire des prédictions peu fiables. Par exemple, si les images d'un jeu de données ont des résolutions ou des échelles de couleur variables, le modèle doit dépenser une capacité supplémentaire à apprendre à gérer ces incohérences au lieu de se concentrer sur la tâche réelle de détection d'objets.

Les techniques de prétraitement visent généralement à :

  • Améliorer la qualité des données : supprimer les erreurs, les valeurs aberrantes et les doublons pour garantir que le jeu de données représente précisément l'espace du problème.
  • Standardiser les entrées : remettre à l'échelle les caractéristiques (comme les valeurs de pixels) sur une plage uniforme, souvent entre 0 et 1, pour aider les algorithmes d'optimisation comme la descente de gradient à fonctionner plus harmonieusement.
  • Réduire la complexité : simplifier les représentations des données grâce à des techniques comme la réduction de dimensionnalité, rendant le processus d'apprentissage plus rapide.

Link to this sectionTechniques clés du prétraitement#

Plusieurs méthodes standard sont utilisées pour préparer les données à l'entraînement, chacune remplissant un objectif spécifique dans le pipeline de données.

  • Nettoyage de données : cela implique de gérer les valeurs manquantes (imputation), de corriger les étiquetages incohérents et de filtrer les fichiers corrompus. Dans le contexte de l'IA visuelle, cela peut signifier supprimer des images floues ou corriger des coordonnées de boîte englobante incorrectes.
  • Normalisation et mise à l'échelle : étant donné que les intensités des pixels peuvent varier considérablement, la normalisation des images garantit que les pixels de grande valeur ne dominent pas le processus d'apprentissage. Les méthodes courantes incluent la mise à l'échelle Min-Max et la normalisation Z-score.
  • Encodage : les données catégorielles, telles que les étiquettes de classe (par ex. « chat », « chien »), doivent être converties en formats numériques. Des techniques comme le one-hot encoding ou l'encodage par étiquettes sont une pratique courante.
  • Redimensionnement et formatage : les modèles d'apprentissage profond attendent généralement des entrées de taille fixe. Les pipelines de prétraitement redimensionnent automatiquement les images disparates vers une dimension standard, telle que 640x640 pixels, ce qui est courant pour l'inférence en temps réel.

Link to this sectionApplications concrètes#

Le prétraitement des données est omniprésent dans tous les secteurs, garantissant que les entrées brutes se traduisent en informations exploitables.

Link to this sectionDiagnostic par imagerie médicale#

Dans l'IA de santé, le prétraitement est vital pour analyser les rayons X ou les scanners IRM. Les images médicales brutes contiennent souvent du bruit provenant des capteurs ou des variations de luminosité et de contraste selon la machine utilisée. Les étapes de prétraitement comme l'égalisation d'histogramme améliorent le contraste pour rendre les tumeurs ou les fractures plus visibles, tandis que les filtres de réduction de bruit clarifient la structure de l'image. Cette préparation permet aux modèles d'effectuer la détection de tumeurs avec une plus grande précision, sauvant potentiellement des vies en réduisant les faux négatifs.

Link to this sectionConduite autonome#

Les voitures autonomes s'appuient sur les entrées de multiples capteurs, dont le LiDAR, le radar et les caméras. Ces capteurs produisent des données à des taux et des échelles différents. Le prétraitement synchronise ces flux et filtre le bruit environnemental, tel que la pluie ou les reflets, avant de fusionner les données. Pour les véhicules autonomes, cela garantit que le système de perception reçoit une vue cohérente de la route, permettant une navigation sûre et une détection de piétons fiable dans des environnements en temps réel.

Link to this sectionConcepts associés#

Il est important de distinguer le prétraitement des données d'autres termes qui apparaissent dans le flux de travail de l'apprentissage automatique.

  • vs. Augmentation de données : alors que le prétraitement prépare les données pour être techniquement utilisables par le modèle (par ex. redimensionnement), l'augmentation génère de nouvelles variations des données existantes (par ex. rotation ou retournement d'images) pour accroître la diversité du jeu de données. Consulte notre guide sur l'augmentation de données YOLO pour plus de détails.
  • vs. Ingénierie de caractéristiques : le prétraitement concerne le nettoyage et le formatage. L'ingénierie de caractéristiques implique la création de nouvelles variables significatives à partir des données pour améliorer les performances du modèle, comme le calcul d'un « indice de masse corporelle » à partir des colonnes de taille et de poids.
  • vs. Étiquetage de données : l'étiquetage est le processus de définition de la vérité terrain, comme le dessin de boîtes englobantes autour des objets. Le prétraitement intervient après la collecte et l'étiquetage des données, mais avant que les données ne soient injectées dans le réseau de neurones.

Link to this sectionExemple pratique#

Dans l'écosystème Ultralytics, le prétraitement est souvent géré automatiquement pendant le pipeline d'entraînement. Cependant, tu peux aussi prétraiter manuellement des images en utilisant des bibliothèques comme OpenCV. L'extrait suivant démontre le chargement d'une image, son redimensionnement à une taille d'entrée standard pour un modèle comme YOLO26, et la normalisation des valeurs de pixels.

import cv2
import numpy as np

# Load an image using OpenCV
image = cv2.imread("bus.jpg")

# Resize the image to 640x640, a standard YOLO input size
resized_image = cv2.resize(image, (640, 640))

# Normalize pixel values from 0-255 to 0-1 for model stability
normalized_image = resized_image / 255.0

# Add a batch dimension (H, W, C) -> (1, H, W, C) for inference
input_tensor = np.expand_dims(normalized_image, axis=0)

print(f"Processed shape: {input_tensor.shape}")

Pour les projets à grande échelle, l'utilisation d'outils comme la plateforme Ultralytics peut rationaliser ces flux de travail. La plateforme simplifie la gestion des jeux de données, automatisant de nombreuses tâches de prétraitement et d'annotation pour accélérer la transition des données brutes vers le modèle déployé.

Explore solutions

Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.

En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.

En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.

En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus

Construisons ensemble le futur de l'IA !

Commence ton aventure avec le futur de l'apprentissage automatique