Découvrez comment l'ajustement des instructions permet d'aligner les modèles d'IA sur les intentions humaines. Apprenez à former Ultralytics et d'autres modèles à suivre des directives spécifiques pour améliorer les tâches.
Le réglage des instructions est une technique spécialisée d' apprentissage automatique utilisée pour entraîner les modèles à suivre des directives ou des commandes spécifiques de l'utilisateur. Contrairement à l'entraînement préalable standard, qui se concentre souvent sur la prédiction du mot suivant dans une séquence ou la reconnaissance de modèles généraux dans les données, le réglage des instructions exploite des ensembles de données formatés sous forme de tâches directes. En exposant le modèle à des paires d'entrées-sorties structurées sous forme de commandes explicites et de leurs réponses correctes correspondantes, les développeurs peuvent transformer un modèle de base polyvalent en un assistant hautement réactif et orienté vers les tâches . Cette approche est largement utilisée dans l' IA générative pour aligner les modèles sur l'intention humaine, garantissant ainsi que les résultats sont pertinents, sûrs et exploitables.
Le processus consiste à mettre à jour les pondérations d'un modèle à l'aide d'un ensemble de données d'instructions hautement sélectionnées . Ces ensembles de données couvrent divers domaines, allant de la résolution d'équations mathématiques à l'analyse d'images. Pendant la formation, le modèle apprend la relation structurelle entre la formulation impérative d'une instruction (par exemple, « Résumez ce texte » ou « Identifiez les objets dans cette image ») et le format de sortie souhaité. Des recherches récentes, telles que les études sur FLAN (Fine-tuned Language Net) menées par Google, démontrent que les modèles adaptés aux instructions présentent des capacités d'apprentissage sans entraînement (zero-shot learning) considérablement améliorées pour des tâches inédites .
L'optimisation des instructions a débloqué des capacités transformatrices à la fois dans les modalités textuelles et visuelles :
Pour gérer les ensembles de données de haute qualité requis pour ces workflows avancés, les équipes se tournent souvent vers la Ultralytics , qui simplifie l'annotation des ensembles de données, l'organisation des projets et les déploiements de formation basés sur le cloud.
Pour concevoir correctement des pipelines d'IA, il est important de distinguer l'ajustement des instructions des techniques similaires d'optimisation des modèles :
Pour les développeurs qui créent des pipelines de vision par ordinateur personnalisés, l'adaptation d'un modèle de base à des contraintes de tâches spécifiques est une exigence courante. Alors que le réglage complet des instructions nécessite des ensembles de données spécialisés et volumineux, l'adaptation de modèles puissants tels que Ultralytics à des tâches de domaine spécifiques utilise des principes similaires d'adaptation supervisée.
from ultralytics import YOLO
# Load a pre-trained YOLO26 foundation model
model = YOLO("yolo26n.pt")
# Adapt the model weights to a custom task dataset using the PyTorch backend
# This process aligns the model's predictive capabilities with user-defined classes
results = model.train(data="custom_task.yaml", epochs=50, imgsz=640)
En tirant parti de ces méthodologies de formation avancées, les développeurs peuvent déployer des systèmes d'IA robustes qui interprètent et exécutent de manière fiable des commandes complexes, comblant ainsi le fossé entre l'apprentissage profond théorique et les logiciels pratiques et centrés sur l'utilisateur . Pour en savoir plus sur les mécanismes de formation, consultez PyTorch officielle PyTorch sur la formation des réseaux neuronaux.