Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant
Glossaire

Poids du modèle

Découvrez l'importance des poids des modèles dans l'apprentissage automatique, leur rôle dans les prédictions, et comment Ultralytics YOLO simplifie leur utilisation pour les tâches d'IA.

Les poids du modèle sont les paramètres fondamentaux d'un réseau neuronal, susceptibles d'être appris, qui transforment les données d'entrée en données de sortie. réseau neuronal qui transforment les données d'entrée en en prédictions significatives. Fonctionnant de la même manière que la force des synapses dans un cerveau biologique, ces valeurs numériques déterminent l'influence d'une caractéristique d'entrée spécifique sur la sortie du réseau. déterminent l'influence d'une caractéristique d'entrée spécifique sur la sortie du réseau. Lorsqu'un modèle traite informations, telles qu'une image ou un texte, les données d'entrée sont multipliées par ces poids, couche par couche. La combinaison finale La combinaison finale de ces signaux pondérés produit le résultat, qu'il s'agisse de classification d'images, traduction linguistique ou l'identification d'objets dans un flux vidéo.

Comment les pondérations des modèles sont-elles apprises ?

Les poids ne sont pas statiques ; ce sont des valeurs dynamiques affinées au cours du processus de formation. processus d'apprentissage. Au départ, un modèle commence avec des poids aléatoires, ce qui signifie que ses prédictions sont essentiellement des suppositions. aléatoires, ce qui signifie que ses prédictions sont essentiellement des suppositions. Au cours d'un cycle connu sous le nom d'apprentissage supervisé apprentissage supervisé, le modèle compare ses prédictions à un ensemble de données de formation étiquetées. A formule mathématique appelée fonction de fonction de perte calcule l'erreur, c'est-à-dire la différence entre la prédiction et la vérité réelle.

Pour minimiser cette erreur, le modèle utilise un algorithme d'optimisation. algorithme d'optimisation, tel que Descente stochastique de gradient (SGD) ou Adam. Cet algorithme calcule les gradients par rétro-propagation pour déterminer exactement comment chaque poids doit être ajusté, soit en l'augmentant, soit en le diminuant, afin de réduire l'erreur lors de l'itération suivante. Ce cycle se répète sur de nombreuses époques jusqu'à ce que les poids convergent vers un état optimal où le modèle atteint une grande précision. optimal où le modèle atteint une grande précision.

Différencier les concepts clés

Pour bien comprendre les poids des modèles, il est utile de les distinguer des termes apparentés dans l'apprentissage automatique. l 'apprentissage automatique:

  • Biais: Alors que les poids contrôlent la pente ou l'échelle de la transformation, les biais permettent de déplacer la fonction d'activation vers la gauche ou la droite. d'activation à gauche ou à droite. Ensemble, les weights and biases permettent au réseau de s'adapter à des modèles de données complexes et non linéaires.
  • Hyperparamètres: Les poids sont appris à partir des données, tandis que les hyperparamètres sont des paramètres structurels configurés avant le début de l'apprentissage. avant le début de la formation. Il s'agit par exemple du taux d'apprentissage, la taille du lot et le nombre de couches dans le réseau.
  • Modèle d'architecture: L'architecture est le plan ou le squelette du réseau (par exemple, ResNet ou un Transformer), définissant la manière dont les neurones se connectent. neurones se connectent. Les poids sont les valeurs spécifiques stockées dans cette structure.

Le pouvoir de l'apprentissage par transfert

La formation d'un modèle à partir de zéro nécessite des ensembles de données massifs et des de données et d'importantes ressources informatiques. Pour résoudre ce problème, les développeurs utilisent souvent des poids pré-entraînés. Il s'agit de prendre un modèle tel que YOLO11qui a déjà appris de riches représentations riches à partir d'un grand ensemble de données comme COCOet l'appliquer à un nouveau problème. nouveau problème.

Cette technique, connue sous le nom d'apprentissage par transfert, permet aux utilisateurs d'affiner le modèle sur un ensemble de données plus petit, sur un ensemble de données plus petit et personnalisé. Les poids pré-entraînés fournissent une "longueur d'avance", permettant au modèle de reconnaître immédiatement les bords, les textures et les formes, ce qui permet d'accélérer l'entraînement et d'améliorer les performances, les textures et les formes, ce qui permet d'accélérer l'apprentissage et d'améliorer les performances.

L'extrait Python suivant montre comment charger des poids pré-entraînés spécifiques dans un modèle YOLO11 pour une détection immédiate d'objets. détection immédiate d'objets.

from ultralytics import YOLO

# Load the YOLO11 model with pre-trained weights (learned on COCO)
model = YOLO("yolo11n.pt")

# Run inference on an image using the loaded weights
# The weights determine the model's ability to recognize the bus
results = model("https://ultralytics.com/images/bus.jpg")

# Display the resulting bounding boxes and classes
results[0].show()

Applications concrètes

L'utilité pratique de l'optimisation des poids des modèles est évidente dans les différents secteurs où les solutions d'IA sont déployées. les solutions d'IA sont déployées :

  • L'IA dans les soins de santé: Les radiologues utilisent des modèles avec des poids affinés sur l'imagerie médicale pour aider au diagnostic. Par exemple, un modèle permet d'identifier les tumeurs cérébrales dans les IRM. Les poids Les poids de ce modèle spécifique ont appris à distinguer les subtiles différences de texture entre les tissus sains et les anomalies, fournissant ainsi un second avis qui accroît la confiance dans le diagnostic. et les anomalies, ce qui permet d'obtenir un deuxième avis et d'accroître la confiance dans le diagnostic.
  • Systèmes de vente au détail intelligents: Les détaillants utilisent la vision par ordinateur pour automatiser les processus de caisse. Un système de caméras équipé de poids-modèles formés à l'emballage des produits peut reconnaître instantanément les articles placés sur un comptoir. reconnaître instantanément les articles placés sur un comptoir. Cette application repose sur la capacité des poids à mettre en correspondance les données visuelles - comme la couleur et le logo d'une boîte de céréales - avec l'UGS correcte du produit. comme la couleur et le logo d'une boîte de céréales, à l'UGS correcte du produit pour la gestion des stocks. gestion des stocks.

L'avenir des pondérations des modèles

Au fur et à mesure que la recherche progresse, la façon dont les poids sont manipulés continue d'évoluer. Des techniques telles que la la quantification du modèle réduisent la précision des des poids (par exemple, de 32 bits flottants à 8 bits entiers) afin de réduire la taille des fichiers et d'accélérer l'inférence sur les dispositifs de bord sans sacrifier de manière significative la précision. d'inférence sur les appareils de pointe sans sacrifier de manière significative la précision. En outre, les architectures à venir telles que YOLO26 visent à modèles qui sont nativement plus efficaces, en veillant à ce que les poids appris fournissent la plus grande performance possible par paramètre.

Une gestion efficace de ces fichiers est également essentielle. Des plateformes telles que Ultralytics Platform permettent aux équipes d'effectuer des versions, de track et de déployer les poids de leurs modèles de manière transparente. de manière transparente, ce qui garantit que la version la plus performante d'un modèle est toujours celle qui est en production.

Rejoindre la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant