Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant
Glossaire

Réglage fin efficace en termes de paramètres (PEFT)

Découvrez le réglage fin efficace en termes de paramètres (PEFT) pour adapter les grands modèles d'IA avec un minimum de ressources. Réduisez les coûts, prévenez le surapprentissage et optimisez le déploiement!

Le réglage fin efficace des paramètres (PEFT) est une stratégie sophistiquée d'apprentissage l 'apprentissage machine (ML) conçue pour adapter de grands modèles pré modèles pré-entraînés à des tâches spécifiques en aval sans la charge de calcul que représente le réentraînement de l'ensemble du réseau. En tant que modèles de base dans des domaines tels que le traitement du le traitement du langage naturel et la vision artificielle (CV) ont à des milliards de paramètres, l'ajustement traditionnel , quimet à jour chaque poids dans le modèle, est devenu est devenu prohibitif pour de nombreux utilisateurs. PEFT résout ce problème en figeant la majorité des poids du modèle pré-entraîné et en ne mettant à jour qu'une petite partie des poids du modèle. et en ne mettant à jour qu'un petit sous-ensemble de paramètres paramètres, ou en ajoutant quelques nouvelles couches entraînables. Cette approche réduit considérablement l'obstacle matériel, ce qui permet aux chercheurs et aux ingénieurs de personnaliser des modèles de pointe. aux chercheurs et aux ingénieurs de personnaliser des modèles de pointe à l'aide de GPU GPU grand public tout en maintenant des performances comparables à celles d'un apprentissage complet.

Les mécanismes du PEFT

Le concept de base de PEFT est l'apprentissage par transfert, où un modèle exploite connaissances acquises à partir d'un ensemble massif de données (comme ImageNet ou Common Crawl) pour résoudre de nouveaux problèmes avec des données limitées. Contrairement au réglage fin complet, PEFT modifie l'architecture du modèle ou le processus d'apprentissage pour être "efficace en termes de paramètres". efficace en termes de paramètres". Cela crée une empreinte réduite pour le modèle adapté, souvent quelques mégaoctets seulement, par rapport aux gigaoctets nécessaires pour un modèle complet. gigaoctets nécessaires pour une copie complète du modèle. Cette efficacité est cruciale pour éviter l'oubli catastrophique, phénomène par lequel un perd ses capacités générales d'origine lors de l'apprentissage de nouvelles informations.

Les techniques les plus courantes dans le cadre du PEFT sont les suivantes :

  • LoRA (Low-Rank Adaptation): Cette méthode populaire injecte de petites matrices de décomposition des rangs pouvant être entraînées dans les couches du modèle, gelant ainsi les poids originaux. les poids d'origine. Elle est largement citée dans les recherches de Microsoft pour pour son équilibre entre vitesse et précision.
  • Adaptateurs : Il s'agit d'insérer de petits modules de réseaux neuronaux entre les couches existantes. modules de réseaux neuronaux entre les couches existantes du réseau pré-entraîné.
  • Prompt Tuning: Principalement utilisé avec les avec les modèles de langage, il ajoute à la séquence d'entrée des à la séquence d'entrée, guidant le comportement du modèle gelé. le comportement du modèle figé.

Applications concrètes

PEFT contribue à démocratiser l'accès à de puissants outils d'intelligence artificielle dans divers secteurs d'activité.

  • Agriculture de précision : Les agriculteurs et les entreprises d'agrotechnique utilisent PEFT pour adapter des modèles généraux de détection d'objets, tels que les modèles d'analyse de l'environnement. modèles généraux de détection d'objets comme YOLO11 pour identifier des maladies spécifiques des cultures ou des parasites locaux. En utilisant l'IA dans l'agriculture, un modèle formé sur des objets généraux peut être affiné sur un petit ensemble de données personnalisées. sur des objets généraux peut être affiné sur un petit ensemble de données personnalisées d'images de feuilles afin de detect avec une grande précision le mildiou localisé, en s'exécutant efficacement sur des appareils périphériques sur le terrain.
  • Diagnostic médical : Dans le domaine de l'IA l 'IA dans le domaine de la santé, le respect de la vie privée et la des données sont des défis majeurs. Les hôpitaux peuvent utiliser PEFT pour adapter les modèles de vision pour l'analyse d'images médicales, comme la détection les fractures aux rayons X. Le modèle de base restant figé, l'entraînement nécessite moins d'images de patients pour converger, le risque de surajustement et de préserver la capacité du d'adaptation et de préserver la capacité du modèle à reconnaître des caractéristiques visuelles générales.

Mise en œuvre pratique

Dans le contexte des modèles Ultralytics , l'efficacité des paramètres est souvent obtenue en "gelant" les couches dorsales du réseau pendant la formation. du réseau pendant la formation. Cela garantit que les couches d'extraction des caractéristiques restent inchangées et que seule la tête (la partie du modèle responsable des prédictions finales) est mise à jour. (la partie du modèle responsable des prédictions finales) est mise à jour.

L'exemple suivant montre comment mettre en œuvre une forme simple de formation efficace en termes de paramètres avec Ultralytics YOLO en gelant les 10 premières couches du modèle.

from ultralytics import YOLO

# Load the YOLO11 model (latest stable version)
model = YOLO("yolo11n.pt")

# Train the model on a specific dataset
# The 'freeze=10' argument freezes the first 10 layers (the backbone)
# This reduces the number of trainable parameters significantly
results = model.train(data="coco8.yaml", epochs=5, freeze=10)

PEFT vs. Concepts Connexes

Il est essentiel de comprendre la distinction entre le PEFT et les termes similaires pour choisir la bonne stratégie :

  • Réglage fin complet : Ce réglage met à jour tous les paramètres du réseau. Il offre une plasticité maximale mais nécessite d'énormes ressources de calcul et de stockage pour chaque nouvelle version du modèle. plasticité maximale mais nécessite des ressources de calcul et de stockage massives pour chaque nouvelle version du modèle. Voir ce guide sur le réglage fin pour les meilleures pratiques lorsque les ressources ne sont pas une contrainte.
  • Ingénierie rapide: Il s'agit consiste à élaborer le texte d'entrée (invite) pour guider le modèle sans modifier les poids. En revanche, PEFT met à jour en permanence un petit ensemble de paramètres ou de poids pour modifier la façon dont le modèle traite les données.
  • Apprentissage par transfert: Il s'agit du concept plus large de réutilisation des connaissances. concept plus large de réutilisation des connaissances. Le PEFT est une mise en œuvre spécifique et efficace de l'apprentissage par transfert. Vous pouvez explorer des définitions plus approfondies de ces concepts sur des plateformes telles que les pages pédagogiques d'IBM sur l'IA.

En minimisant le coût informatique de l'adaptation, PEFT permet de créer des modèles hautement spécialisés pour des tâches allant de la perception des véhicules autonomes à la gestion de l'environnement. tâches allant de la perception de véhicules autonomes à l'analyse de l'imagerie l 'imagerie satellite, rendant l'IA avancée accessible à une plus large communauté de développeurs.

Rejoindre la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant