Instruction Tuning

Découvre comment l'instruction tuning aligne les modèles d'IA avec l'intention humaine. Apprends à entraîner Ultralytics YOLO26 et d'autres modèles pour suivre des directives spécifiques pour de meilleures tâches.

Le réglage d'instructions est une technique spécialisée de machine learning utilisée pour entraîner des modèles à suivre des directives ou des commandes spécifiques de l'utilisateur. Contrairement au pré-entraînement standard, qui se concentre souvent sur la prédiction du mot suivant dans une séquence ou sur la reconnaissance de modèles généraux dans les données, le réglage d'instructions exploite des jeux de données formatés comme des tâches directes. En exposant le modèle à des paires entrée-sortie structurées sous forme de commandes explicites et de leurs réponses correctes correspondantes, tu peux transformer un modèle de base polyvalent en un assistant très réactif et axé sur les tâches. Cette approche est largement utilisée dans l'IA générative pour aligner les modèles sur l'intention humaine, garantissant que les résultats sont pertinents, sûrs et exploitables.

Link to this sectionComment fonctionne le réglage d'instructions#

Le processus implique la mise à jour des poids du modèle à l'aide d'un jeu de données hautement organisé d'instructions. Ces jeux de données couvrent des domaines divers, allant de la résolution d'équations mathématiques à l'analyse d'images. Pendant l'entraînement, le modèle apprend la relation structurelle entre le phrasé impératif d'une instruction (par exemple, « Résume ce texte » ou « Identifie les objets dans cette image ») et le format de sortie souhaité. Des recherches récentes, telles que les études sur FLAN (Fine-tuned Language Net) par Google, démontrent que les modèles réglés par instructions présentent des capacités de zero-shot learning considérablement améliorées sur des tâches inédites.

Link to this sectionApplications concrètes#

Le réglage d'instructions a débloqué des capacités transformatrices à la fois pour les modalités textuelles et visuelles :

Assistants IA interactifs : Les chatbots modernes reposent fortement sur le réglage d'instructions pour traiter des dialogues complexes et exécuter une logique en plusieurs étapes. Ce réglage garantit que lorsqu'un utilisateur demande au système de formater des données en tant qu'objet JSON, le modèle respecte strictement cette contrainte plutôt que de générer du remplissage conversationnel. La recherche d'OpenAI sur InstructGPT souligne comment cette technique réduit les résultats toxiques et améliore l'alignement.
Modèles Vision-Langage (VLM) : En computer vision, le réglage d'instructions est utilisé pour construire des systèmes de vision flexibles et basés sur des invites. Au lieu d'un pipeline rigide de détection d'objets qui détecte un ensemble fixe de classes, un modèle de vision réglé par instructions peut traiter une commande comme « Trouve le produit défectueux sur la chaîne de montage » et ajuster sa mise au point dynamiquement.

Pour gérer les jeux de données de haute qualité requis pour ces flux de travail avancés, les équipes se tournent souvent vers la plateforme Ultralytics, qui simplifie l'annotation des jeux de données, l'organisation des projets et les déploiements d'entraînement basés sur le cloud.

Link to this sectionDistinguer les concepts apparentés#

Pour bien concevoir tes pipelines d'IA, il est important de distinguer le réglage d'instructions des techniques d'optimisation de modèles similaires :

Prompt Tuning vs. Instruction Tuning : Le prompt tuning est une méthode efficace en termes de paramètres qui optimise un petit ensemble de « prompts souples » (tenseurs apprenables) tout en gardant le modèle de base gelé. En revanche, le réglage d'instructions implique généralement la mise à jour de l'ensemble du modèle (ou de parties significatives de celui-ci) en utilisant l'apprentissage supervisé sur des jeux de données d'instructions.
Fine-Tuning vs. Instruction Tuning : Le fine-tuning traditionnel adapte un modèle à un domaine spécifique (par exemple, la littérature médicale) sans nécessairement lui apprendre à suivre des commandes. Le réglage d'instructions est un sous-ensemble distinct du fine-tuning explicitement conçu pour améliorer l'exécution des tâches et la compréhension du langage naturel à travers un large éventail d'instructions variées.

Link to this sectionAdapter les modèles en pratique#

Pour les développeurs qui construisent des pipelines personnalisés de computer vision, adapter un modèle de base à des contraintes de tâches spécifiques est une exigence courante. Bien que le réglage d'instructions complet nécessite des jeux de données massifs spécialisés, l'adaptation de modèles puissants comme Ultralytics YOLO26 à des tâches de domaine spécifiques utilise des principes similaires d'adaptation supervisée.

from ultralytics import YOLO

# Load a pre-trained YOLO26 foundation model
model = YOLO("yolo26n.pt")

# Adapt the model weights to a custom task dataset using the PyTorch backend
# This process aligns the model's predictive capabilities with user-defined classes
results = model.train(data="custom_task.yaml", epochs=50, imgsz=640)

En tirant parti de ces méthodologies d'entraînement avancées, tu peux déployer des systèmes d'IA robustes qui interprètent et exécutent de manière fiable des commandes complexes, comblant ainsi le fossé entre le deep learning théorique et les logiciels pratiques centrés sur l'utilisateur. Pour plus d'informations sur les mécanismes d'entraînement, explore la documentation officielle de PyTorch sur l'entraînement des réseaux de neurones.

Instruction Tuning

Link to this sectionComment fonctionne le réglage d'instructions#

Link to this sectionApplications concrètes#

Link to this sectionDistinguer les concepts apparentés#

Link to this sectionAdapter les modèles en pratique#

Explore solutions

IA dans la robotique

IA dans la logistique

IA dans le commerce de détail

IA dans la santé

IA dans la fabrication

IA dans l'automobile

IA en agriculture

IA dans la robotique

IA dans la logistique

IA dans le commerce de détail

IA dans la santé

IA dans la fabrication

IA dans l'automobile

IA en agriculture

IA dans la robotique

IA dans la logistique

IA dans le commerce de détail

IA dans la santé

IA dans la fabrication

IA dans l'automobile

IA en agriculture

Construisons ensemble le futur de l'IA !