Découvrez la puissance des modèles de base dans l'IA. Apprenez à adapter des modèles à grande échelle tels que Ultralytics à des tâches personnalisées à l'aide de la Ultralytics .
Un modèle de base représente un changement de paradigme significatif dans le domaine de l' intelligence artificielle (IA). Il s'agit d'un modèle d'apprentissage automatique à grande échelle, entraîné sur une quantité considérable de données (comprenant souvent des milliards de paramètres), qui peut être adapté à un large éventail de tâches en aval. Contrairement aux modèles traditionnels d' apprentissage automatique (ML), qui sont généralement conçus dans un but spécifique et unique, comme la classification d'un type particulier de fleur, un modèle de base apprend des modèles, des structures et des relations généraux au cours d'une phase de pré-entraînement qui nécessite d'importantes ressources. Cette vaste base de connaissances permet aux développeurs d'appliquer le modèle à de nouveaux problèmes grâce à l' apprentissage par transfert, ce qui réduit considérablement le temps et les données nécessaires pour obtenir des résultats de pointe.
La puissance d'un modèle de base réside dans son processus de développement en deux étapes : le pré-entraînement et le réglage fin. Au cours du pré-entraînement, le modèle est exposé à des ensembles de données massifs, tels que de grandes portions d'Internet, diverses bibliothèques d'images ou des référentiels de code étendus. Cette étape utilise souvent l' apprentissage auto-supervisé, une technique dans laquelle le modèle génère ses propres étiquettes à partir de la structure des données elle-même, supprimant ainsi le goulot d'étranglement de l'annotation manuelle des données. Par exemple, un modèle linguistique peut apprendre à prédire le mot suivant dans une phrase, tandis qu'un modèle de vision apprend à comprendre les contours, les textures et la permanence des objets.
Une fois pré-entraîné, le modèle sert de point de départ polyvalent. Grâce à un processus appelé « réglage fin », les développeurs peuvent ajuster les poids du modèle sur un ensemble de données plus petit et spécifique à un domaine. Cette capacité est essentielle à la démocratisation de l'IA, car elle permet aux organisations disposant de ressources informatiques limitées de tirer parti d'architectures puissantes. Les workflows modernes utilisent souvent des outils tels que Ultralytics pour rationaliser ce processus d'adaptation, permettant ainsi un entraînement efficace sur des ensembles de données personnalisés sans avoir à construire un réseau neuronal à partir de zéro.
Les modèles fondamentaux constituent l'épine dorsale des innovations dans divers secteurs. Leur capacité de généralisation les rend applicables à des tâches allant du traitement du langage naturel à la vision par ordinateur avancée.
Les développeurs peuvent exploiter les modèles de base pour effectuer des tâches complexes avec un minimum de code. L'exemple suivant montre comment charger un modèle YOLO26pré-entraîné, un modèle de base de vision optimisé pour les applications en temps réel, et effectuer la détection d'objets sur une image.
from ultralytics import YOLO
# Load a pre-trained YOLO26 foundation model
# 'n' stands for nano, the smallest and fastest version
model = YOLO("yolo26n.pt")
# Perform inference on an image to detect objects
# The model uses its pre-trained knowledge to identify common objects
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results
results[0].show()
Il est utile de distinguer le « modèle de base » des concepts connexes dans le domaine de l'IA afin de comprendre leurs rôles spécifiques :
L'évolution des modèles de base s'oriente vers l' IA multimodale, où un seul système peut traiter et relier simultanément des informations provenant de textes, d'images, d'enregistrements audio et de données de capteurs. Les recherches menées par des institutions telles que le Stanford Institute for Human-Centered AI (HAI) mettent en évidence le potentiel de ces systèmes à raisonner sur le monde de manière plus humaine. À mesure que ces modèles gagnent en efficacité, leur déploiement sur des appareils informatiques de pointe devient de plus en plus faisable, apportant de puissantes capacités d'IA directement aux smartphones, drones et capteurs IoT.