Instruction Tuning
Découvre comment l'instruction tuning aligne les modèles d'IA avec l'intention humaine. Apprends à entraîner Ultralytics YOLO26 et d'autres modèles à suivre des directives spécifiques pour de meilleures tâches.
L'instruction tuning est une technique spécialisée de machine learning utilisée pour entraîner des modèles à suivre des directives ou des commandes utilisateur spécifiques. Contrairement au pré-entraînement standard, qui se concentre souvent sur la prédiction du mot suivant dans une séquence ou sur la reconnaissance de modèles généraux dans les données, l'instruction tuning tire parti de jeux de données formatés comme des tâches directes. En exposant le modèle à des paires entrée-sortie structurées comme des commandes explicites et leurs réponses correctes correspondantes, les développeurs peuvent transformer un modèle de base polyvalent en un assistant très réactif et orienté vers les tâches. Cette approche est largement utilisée dans l'IA Generative AI pour aligner les modèles sur l'intention humaine, garantissant que les résultats soient pertinents, sûrs et exploitables.
Link to this sectionComment fonctionne l'Instruction Tuning#
Le processus implique la mise à jour des model weights d'un modèle à l'aide d'un jeu de données d'instructions hautement sélectionné. Ces jeux de données couvrent des domaines variés, de la résolution d'équations mathématiques à l'analyse d'images. Pendant l'entraînement, le modèle apprend la relation structurelle entre la formulation impérative d'une instruction (par exemple, "Résume ce texte" ou "Identifie les objets dans cette image") et le format de sortie souhaité. Des recherches récentes, telles que les études sur FLAN (Fine-tuned Language Net) par Google, démontrent que les modèles ayant subi un instruction tuning présentent des capacités d'apprentissage zero-shot learning considérablement améliorées sur des tâches inédites.
Link to this sectionApplications concrètes#
L'instruction tuning a ouvert des capacités transformatrices à travers les modalités textuelles et visuelles :
- Assistants IA interactifs : Les chatbots modernes s'appuient fortement sur l'instruction tuning pour traiter des dialogues complexes et exécuter une logique en plusieurs étapes. Ce réglage garantit que lorsqu'un utilisateur demande au système de formater des données en tant qu'objet JSON, le modèle respecte strictement cette contrainte plutôt que de générer du remplissage conversationnel. La recherche d'OpenAI sur InstructGPT souligne comment cette technique réduit les sorties toxiques et améliore l'alignement.
- Modèles Vision-Langage (VLM) : En computer vision, l'instruction tuning est utilisé pour construire des systèmes de vision flexibles et pilotables par des invites. Au lieu d'un pipeline rigide d'object detection qui détecte un ensemble fixe de classes, un modèle de vision ajusté par instruction peut traiter une commande comme "Trouve le produit défectueux sur la chaîne de montage" et ajuster son focus dynamiquement.
Pour gérer les jeux de données de haute qualité requis pour ces flux de travail avancés, les équipes se tournent souvent vers la Ultralytics Platform, qui simplifie l'annotation des jeux de données, l'organisation des projets et les déploiements d'entraînement dans le cloud.
Link to this sectionDistinguer les concepts apparentés#
Pour architecturer correctement les pipelines d'IA, il est important de distinguer l'instruction tuning des techniques d'optimisation de modèles similaires :
- Prompt Tuning vs. Instruction Tuning : Le prompt tuning est une méthode efficace en termes de paramètres qui optimise un petit ensemble de "soft prompts" (tenseurs apprenables) tout en gardant le modèle de base gelé. En revanche, l'instruction tuning implique généralement la mise à jour du modèle entier (ou d'une partie significative de celui-ci) en utilisant l'supervised learning sur des jeux de données d'instructions.
- Fine-Tuning vs. Instruction Tuning : Le fine-tuning traditionnel adapte un modèle à un domaine spécifique (par exemple, la littérature médicale) sans nécessairement lui apprendre à suivre des commandes. L'instruction tuning est un sous-ensemble distinct du fine-tuning, explicitement conçu pour améliorer l'exécution des tâches et la natural language understanding à travers un large éventail d'instructions variées.
Link to this sectionAdapter les modèles en pratique#
Pour les développeurs construisant des pipelines personnalisés de computer vision, adapter un modèle de base aux contraintes spécifiques d'une tâche est une exigence courante. Bien que l'instruction tuning complet nécessite des jeux de données massifs spécialisés, l'adaptation de modèles puissants comme Ultralytics YOLO26 à des tâches de domaine spécifiques utilise des principes similaires d'adaptation supervisée.
from ultralytics import YOLO
# Load a pre-trained YOLO26 foundation model
model = YOLO("yolo26n.pt")
# Adapt the model weights to a custom task dataset using the PyTorch backend
# This process aligns the model's predictive capabilities with user-defined classes
results = model.train(data="custom_task.yaml", epochs=50, imgsz=640)En tirant parti de ces méthodologies d'entraînement avancées, les développeurs peuvent déployer des systèmes d'IA robustes qui interprètent et exécutent de manière fiable des commandes complexes, comblant le fossé entre le deep learning théorique et le logiciel pratique centré sur l'utilisateur. Pour en savoir plus sur les mécanismes d'entraînement, explore la documentation officielle de PyTorch sur l'entraînement des réseaux de neurones.






