Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant
Glossaire

Réglage des instructions

Découvrez comment l'ajustement des instructions permet d'aligner les modèles d'IA sur les intentions humaines. Apprenez à former Ultralytics et d'autres modèles à suivre des directives spécifiques pour améliorer les tâches.

Le réglage des instructions est une technique spécialisée d' apprentissage automatique utilisée pour entraîner les modèles à suivre des directives ou des commandes spécifiques de l'utilisateur. Contrairement à l'entraînement préalable standard, qui se concentre souvent sur la prédiction du mot suivant dans une séquence ou la reconnaissance de modèles généraux dans les données, le réglage des instructions exploite des ensembles de données formatés sous forme de tâches directes. En exposant le modèle à des paires d'entrées-sorties structurées sous forme de commandes explicites et de leurs réponses correctes correspondantes, les développeurs peuvent transformer un modèle de base polyvalent en un assistant hautement réactif et orienté vers les tâches . Cette approche est largement utilisée dans l' IA générative pour aligner les modèles sur l'intention humaine, garantissant ainsi que les résultats sont pertinents, sûrs et exploitables.

Comment fonctionne l'ajustement des instructions

Le processus consiste à mettre à jour les pondérations d'un modèle à l'aide d'un ensemble de données d'instructions hautement sélectionnées . Ces ensembles de données couvrent divers domaines, allant de la résolution d'équations mathématiques à l'analyse d'images. Pendant la formation, le modèle apprend la relation structurelle entre la formulation impérative d'une instruction (par exemple, « Résumez ce texte » ou « Identifiez les objets dans cette image ») et le format de sortie souhaité. Des recherches récentes, telles que les études sur FLAN (Fine-tuned Language Net) menées par Google, démontrent que les modèles adaptés aux instructions présentent des capacités d'apprentissage sans entraînement (zero-shot learning) considérablement améliorées pour des tâches inédites .

Applications concrètes

L'optimisation des instructions a débloqué des capacités transformatrices à la fois dans les modalités textuelles et visuelles :

  • Assistants IA interactifs : les chatbots modernes s'appuient fortement sur l'ajustement des instructions pour traiter des dialogues complexes et exécuter des logiques en plusieurs étapes. Cet ajustement garantit que lorsqu'un utilisateur demande au système de formater des données sous forme d'objet JSON , le modèle respecte strictement cette contrainte plutôt que de générer des remplissages conversationnels. Les recherches d'OpenAI sur InstructGPT soulignent comment cette technique réduit les sorties toxiques et améliore l'alignement.
  • Modèles de vision-langage (VLM) : en vision par ordinateur, le réglage des instructions est utilisé pour construire des systèmes de vision flexibles et réactifs. Au lieu d'un pipeline rigide de détection d'objets qui détecte un ensemble fixe de classes, un modèle de vision réglé par instruction peut traiter une commande telle que « Trouvez le produit défectueux sur la chaîne de montage » et ajuster sa mise au point de manière dynamique.

Pour gérer les ensembles de données de haute qualité requis pour ces workflows avancés, les équipes se tournent souvent vers la Ultralytics , qui simplifie l'annotation des ensembles de données, l'organisation des projets et les déploiements de formation basés sur le cloud.

Distinguer les concepts apparentés

Pour concevoir correctement des pipelines d'IA, il est important de distinguer l'ajustement des instructions des techniques similaires d'optimisation des modèles :

  • Réglage des invites vs réglage des instructions : Le réglage des invites est une méthode efficace en termes de paramètres qui optimise un petit ensemble d'« invites souples » (tensors apprenables ) tout en conservant le modèle de base figé. En revanche, le réglage des instructions implique généralement la mise à jour de l'ensemble du modèle (ou d'une partie importante de celui-ci) à l'aide d'un apprentissage supervisé sur des ensembles de données d'instructions.
  • Ajustement fin vs ajustement par instruction: L'ajustement fin traditionnel adapte un modèle à un domaine spécifique (par exemple, la littérature médicale) sans nécessairement lui apprendre à suivre des commandes. L'ajustement par instruction est un sous-ensemble distinct de l'ajustement fin, explicitement conçu pour améliorer l'exécution des tâches et la compréhension du langage naturel à travers un large éventail d'instructions variées.

Adapter les modèles dans la pratique

Pour les développeurs qui créent des pipelines de vision par ordinateur personnalisés, l'adaptation d'un modèle de base à des contraintes de tâches spécifiques est une exigence courante. Alors que le réglage complet des instructions nécessite des ensembles de données spécialisés et volumineux, l'adaptation de modèles puissants tels que Ultralytics à des tâches de domaine spécifiques utilise des principes similaires d'adaptation supervisée.

from ultralytics import YOLO

# Load a pre-trained YOLO26 foundation model
model = YOLO("yolo26n.pt")

# Adapt the model weights to a custom task dataset using the PyTorch backend
# This process aligns the model's predictive capabilities with user-defined classes
results = model.train(data="custom_task.yaml", epochs=50, imgsz=640)

En tirant parti de ces méthodologies de formation avancées, les développeurs peuvent déployer des systèmes d'IA robustes qui interprètent et exécutent de manière fiable des commandes complexes, comblant ainsi le fossé entre l'apprentissage profond théorique et les logiciels pratiques et centrés sur l'utilisateur . Pour en savoir plus sur les mécanismes de formation, consultez PyTorch officielle PyTorch sur la formation des réseaux neuronaux.

Rejoindre la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant