Glossaire

Modèles linguistiques de petite taille (SLM)

Découvrez comment les petits modèles linguistiques (SLM) permettent de mettre en œuvre une IA efficace, confidentielle et économique sur les appareils en périphérie. Apprenez à associer les SLM à Ultralytics pour l'IA en périphérie.

Les petits modèles linguistiques (SLM) sont des modèles d'intelligence artificielle allégés, conçus pour comprendre et générer le langage humain de manière efficace. Contrairement à leurs homologues plus volumineux, les SLM comptent généralement entre quelques millions et environ 15 milliards de paramètres, ce qui leur permet de fonctionner localement sur des terminaux périphériques sans nécessiter une infrastructure massive de cloud computing. En fonctionnant localement, ces modèles offrent un traitement plus rapide, une meilleure protection de la vie privée des utilisateurs et une réduction significative des coûts de déploiement.

Différencier les termes clés

Pour mieux comprendre le paysage de l'IA, il est utile de distinguer les modèles de langage super-scalaires (SLM) des technologies connexes :

Les SLM par rapport aux grands modèles linguistiques (LLM): Alors que les LLM contiennent des centaines de milliards de paramètres et nécessitent d'importantes ressources serveur, les SLM sont hautement optimisés. Cela leur permet de fonctionner avec un temps de latence d'inférence minimal, ce qui les rend idéaux pour les applications spécialisées et spécifiques à un domaine où une échelle massive n'est pas nécessaire.
Modèles de langage et de vision (SLM) vs. Modèles de vision et de langage (VLM): Les SLM se concentrent principalement sur les tâches de traitement du langage naturel. À l'inverse, les VLM peuvent interpréter à la fois le texte et les images de manière native. Cependant, de nombreux développeurs associent désormais les SLM à des modèles de vision rapides afin de créer des systèmes multimodaux légers.

Applications concrètes

Les petits modèles linguistiques transforment rapidement les secteurs d'activité en intégrant directement des capacités d'intelligence avancée dans l'électronique grand public et les réseaux d'entreprise .

Assistants virtuels intégrés aux appareils: Les smartphones et les appareils IoT modernes exploitent les modèles SLM pour traiter les commandes vocales en local. Cela garantit des réponses en temps réel et permet de conserver les données sensibles sur le matériel. Des modèles de pointe tels que Phi-3Microsoft et OpenELM d'Apple sont à l'avant-garde de cette révolution des assistants intégrés aux appareils.
Chatbots spécialisés: les entreprises déploient des modèles de langage (SLM) hautement optimisés pour l'assistance client automatisée. En associant ces modèles compacts à la génération augmentée par la recherche (RAG), les entreprises peuvent interroger en toute sécurité leurs bases de données internes et résoudre les problèmes sans avoir recours à des API tierces coûteuses.
L'informatique en périphérie dans le secteur manufacturier: Dans les usines intelligentes, les systèmes SLM aident les techniciens en résumant rapidement les manuels d'utilisation complexes des équipements. Associés à des modèles de détection d'objets en temps réel, ces systèmes analysent les défauts visuels et génèrent instantanément des rapports de diagnostic en texte clair directement sur le site de production.

Intégration des SLM dans les flux de travail modernes

Les avancées récentes de 2024 et 2025 ont démontré que des données d'entraînement de haute qualité peuvent permettre d'obtenir des performances rivalisant avec celles des modèles massifs des années précédentes. Des innovations telles que GemmaGoogle et Llama 3 8B de Meta montrent à quel point les architectures plus légères sont désormais performantes.

Lorsqu'ils développent des solutions d'IA complètes, les développeurs utilisent souvent Python pour associer le raisonnement linguistique d’un SLM à la précision visuelle des outils disponibles sur la Ultralytics . Par exemple, un SLM embarqué pourrait traiter une commande vocale pour lancer une tâche de vision par ordinateur. L’extrait de code concis suivant montre comment charger un modèle léger tel Ultralytics pour le suivi d’objets , une opération parfaitement adaptée au même matériel périphérique exécutant un SLM :

from ultralytics import YOLO

# Load the highly efficient YOLO26 nano model, suitable for edge devices
model = YOLO("yolo26n.pt")

# Run real-time object tracking on a local video stream
results = model.track(source="video.mp4", show=True, tracker="botsort.yaml")

En privilégiant l'exécution locale, les ingénieurs réduisent considérablement les besoins en bande passante et les coûts d'exploitation. À mesure que le secteur continue de faire progresser les technologies d'IA en périphérie, la puissante combinaison d'une vision par ordinateur optimisée et de petits modèles linguistiques efficaces sera le moteur de la prochaine génération de systèmes intelligents et autonomes.

Modèles linguistiques de petite taille (SLM)

Exportation vers plus de 17 formats. Déploiement dans 43 régions du monde.

Entraînez YOLO26 sur des GPU H100 pour 2,39 $/heure.

Des licences d'entreprise flexibles pour donner vie à vos projets d'IA visuelle.

Des licences d'entreprise conçues pour dynamiser votre prochain projet

Étiquetez jusqu'à 10 fois plus vite grâce à l'annotation intelligente

Annoter. Entraîner. Déployer. Le tout sur une seule et même plateforme.

Différencier les termes clés

Applications concrètes

Intégration des SLM dans les flux de travail modernes

En savoir plus dans cette catégorie

Ultralytics YOLO à DEEPX : inférence IA en périphérie pour l'IA physique

Comment exporterYOLO Ultralytics à l'aide de Ultralytics

Détection d'un empilage de palettes dangereux à l'aide d'Ultralytics

Construisons ensemble l'avenir de l'IA !

Modèles linguistiques de petite taille (SLM)

Exportation vers plus de 17 formats. Déploiement dans 43 régions du monde.

Entraînez YOLO26 sur des GPU H100 pour 2,39 $/heure.

Des licences d'entreprise flexibles pour donner vie à vos projets d'IA visuelle.

Des licences d'entreprise conçues pour dynamiser votre prochain projet

Étiquetez jusqu'à 10 fois plus vite grâce à l'annotation intelligente

Annoter. Entraîner. Déployer. Le tout sur une seule et même plateforme.

Différencier les termes clés

Applications concrètes

Intégration des SLM dans les flux de travail modernes

En savoir plus dans cette catégorie

Ultralytics YOLO à DEEPX : inférence IA en périphérie pour l'IA physique

Comment exporterYOLO Ultralytics à l'aide de Ultralytics

Détection d'un empilage de palettes dangereux à l'aide d'Ultralytics

Construisons ensemble l'avenir de l'IA !

Annoter. Entraîner. Déployer. Le tout sur une seule et même plateforme.