Scaleout réduit les mises à jour de modèles de quelques semaines à quelques heures avec Ultralytics YOLO
Découvre comment Scaleout utilise Ultralytics YOLO et l'apprentissage fédéré pour affiner des modèles d'IA sur des appareils en périphérie (edge) tout en maintenant la sécurité des données sensibles.

Problem
Scaleout développait des systèmes d'IA en périphérie pour la défense, l'industrie et d'autres secteurs réglementés, et cherchait à améliorer continuellement ses modèles de vision par ordinateur sur le terrain sans déplacer de données sensibles ni dépendre d'un réseau stable.
Solution
En affinant les modèles Ultralytics YOLO sur des appareils périphériques, Scaleout garde les données en place, travaille hors ligne et expédie de nouveaux modèles de détection en quelques heures au lieu de plusieurs semaines.
L'entraînement de modèles de machine learning suppose généralement que tu puisses regrouper toutes tes données à un seul endroit, les envoyer vers le cloud et déployer un modèle fini. Dans de nombreuses situations réelles, cette hypothèse ne tient pas. Dans les environnements de défense, industriels et réglementés, les données sont liées à leur emplacement par des lois sur la confidentialité, des classifications de sécurité ou tout simplement par le coût de la bande passante, et le réseau reliant ces sites n'est pas toujours fiable.
Scaleout construit l'infrastructure adaptée à ces conditions précises. Sa plateforme, Scaleout Edge, utilise l'apprentissage fédéré pour amener l'entraînement du modèle là où résident les données, plutôt que de déplacer les données vers le modèle. Pour les projets de vision par ordinateur, Scaleout entraîne et affine sur mesure les modèles Ultralytics YOLO sur des Vision Ground Nodes, des stations périphériques accélérées par GPU déployées sur chaque site, afin que la détection continue de s'améliorer sur le terrain sans que des images sensibles ne quittent jamais l'appareil.
Link to this sectionApporter le machine learning là où se trouvent les données#
Fondée en 2018 par des chercheurs de l'Université d'Uppsala travaillant sur des systèmes distribués à grande échelle, Scaleout a entrepris de rendre le machine learning possible là où les données ne peuvent pas être centralisées. Son attention se porte sur les contextes où regrouper les données en un seul lieu est difficile, voire impossible, et l'apprentissage fédéré est le mécanisme central qui rend cela possible.
L'apprentissage fédéré répartit l'entraînement sur de nombreux appareils, puis rassemble leurs mises à jour de modèles dans un plan de contrôle central qui les agrège en un nouveau modèle global. Chaque appareil bénéficie de la compréhension de son propre environnement local, tandis que la flotte dans son ensemble profite de l'intelligence collective. Les données restent là où elles doivent être, et seul ce que le modèle a appris voyage.
Le travail de Scaleout couvre les secteurs de la défense, de l'industrie, du transport et d'autres secteurs réglementés, incluant des engagements tels que le programme d'accélération DIANA de l'OTAN et une collaboration avec BAE Systems. Pour tous, le schéma est identique : des données qui ne peuvent pas bouger et des modèles qui doivent tout de même s'améliorer.
Link to this sectionLes complexités du machine learning en périphérie#
Voici un examen plus approfondi des contraintes auxquelles Scaleout a été confronté pour entraîner des modèles sur le terrain :
-
Matériel limité : Les déploiements sur le terrain ne disposent pas de serveurs de centre de données, seulement de petits appareils à faible consommation, comme l'ordinateur embarqué sur un drone. Exécuter un modèle fini dessus est réalisable, mais en réentraîner un demande beaucoup plus de ressources de calcul.
-
Données verrouillées sur l'appareil : Les séquences vidéo nécessaires au réentraînement sont souvent propriétaires et ne peuvent pas être envoyées vers un serveur central, donc le modèle doit apprendre à partir de données qui ne quittent jamais l'edge.
-
Aucun spécialiste sur place : Les opérateurs capturant des données sur le terrain sont rarement des ingénieurs en machine learning, donc le réentraînement ne peut pas dépendre de la présence d'experts en science des données.
-
Conditions en constante évolution : Les environnements de terrain changent rapidement, le modèle doit donc être mis à jour continuellement plutôt que selon des cycles de réentraînement lents et périodiques.
Link to this sectionAffiner les modèles Ultralytics YOLO à la périphérie#
Pour respecter ces contraintes, Scaleout a construit une boucle d'entraînement qui s'exécute entièrement sur le terrain, avec les modèles Ultralytics YOLO en son centre.
Sur chaque site, un Vision Ground Node, une station périphérique accélérée par GPU avec ses propres capacités de calcul et de stockage, est installé aux côtés d'une flotte de drones. Pendant que les drones capturent des images, le nœud sélectionne les cadres les plus utiles, un opérateur les étiquette, et le modèle YOLO est affiné sur ce matériel local.
Après quelques époques d'entraînement, seul le modèle mis à jour est renvoyé vers le plan de contrôle, jamais les séquences brutes. Cette boucle est fournie via le module de vision de Scaleout, une extension de la plateforme Scaleout Edge qui regroupe les outils nécessaires à un projet de vision par ordinateur en un seul package.
Il réunit la sélection d'images, l'annotation, l'entraînement et le déploiement, avec Ultralytics YOLO pour gérer la détection, afin que les équipes puissent s'appuyer sur une base fonctionnelle au lieu d'assembler ces éléments elles-mêmes.
Scaleout a d'abord mis en œuvre cette approche dans le programme d'accélération DIANA de l'OTAN, en utilisant YOLOv8 pour affiner la détection sur des données collectées sur le terrain. Ces données ne pouvaient pas être déplacées via les réseaux de terrain ou centralisées pour des raisons de propriété ; l'équipe a donc décentralisé l'affinage, permettant au modèle d'apprendre localement à partir de nouveaux exemples.
La boucle est également conçue pour les opérateurs plutôt que pour les data scientists. Le système guide un non-spécialiste dans l'examen et l'étiquetage des images pertinentes, afin que les personnes sur le terrain puissent continuer à améliorer le modèle par elles-mêmes.
Les outils de support reflètent cette approche, avec la version open-source de Label Studio pour l'annotation, un serveur de streaming pour intégrer les flux des drones, et le package Python Ultralytics pour l'affinage. Tout cela fonctionne sur du matériel allant des modules NVIDIA Jetson à une unité de terrain robuste ou un ordinateur portable, selon le déploiement.
Link to this sectionPourquoi choisir les modèles Ultralytics YOLO ?#
Pour Scaleout, le plus grand avantage d'Ultralytics YOLO est la légèreté des modèles, ce qui rend l'entraînement fédéré pratique malgré des connexions médiocres. Plutôt que de déplacer des données brutes, Scaleout ne déplace que la mise à jour du modèle. Le modèle qu'ils utilisent le plus, Ultralytics YOLOv8 nano, fait environ 10,7 Mo, ce qui rend la mise à jour complète légère à envoyer, même lorsque la bande passante est limitée.
Le package Python Ultralytics offre également aux ingénieurs de Scaleout la flexibilité d'entraîner et de déployer sur des matériels variés. Le modèle compact YOLOv8 nano fonctionne sans problème sur des appareils périphériques contraints, tandis que les options d'exportation du package permettent un déploiement dans les différents environnements où travaille Scaleout. Comme les modèles sont faciles à affiner, les équipes peuvent itérer rapidement à mesure que les conditions de terrain changent.
Link to this sectionUltralytics YOLO aide Scaleout à mettre à jour ses modèles plus rapidement#
Avec Ultralytics YOLO, la partie la plus lourde du travail reste sur l'appareil. L'entraînement s'effectue sur des centaines de gigaoctets de séquences de terrain, mais ce qui circule réellement est un modèle d'environ 10 Mo. Cela représente une réduction d'environ dix fois des données devant être transférées, ce qui rend l'entraînement fédéré viable sur les réseaux limités dont dépendent ces déploiements.
Cette approche modifie également la rapidité avec laquelle un modèle amélioré revient sur le terrain. Ce qui prendrait normalement des semaines ou des mois — collecter des données, les envoyer vers un centre, réentraîner et redéployer — se réduit à quelques jours ou heures lorsque la boucle s'exécute à la périphérie.
Cela est particulièrement visible dans le travail de Scaleout avec les drones. En reconnaissance militaire, un drone suit un modèle de recherche et utilise un modèle embarqué Ultralytics YOLO pour détecter, identifier et géolocaliser des objets d'intérêt en temps réel, tout le traitement étant géré par l'ordinateur du drone lui-même plutôt que d'être envoyé pour analyse.
À mesure que les drones collectent de nouvelles images, ces données alimentent un Vision Ground Node où YOLO est affiné sur les nouveaux cadres, et un modèle mis à jour est renvoyé, le tout sans que les images ne quittent jamais le site. Les modèles de détection doivent suivre le rythme de conditions qui changent rapidement et de données qui ne peuvent pas être déplacées ; un modèle réentraîné localement reste utile là où un modèle statique, entraîné de manière centralisée, serait dépassé.

Fig 1. Exemple de la manière dont Scaleout et Ultralytics YOLO propulsent les drones IA (Source)
Le même schéma s'étend bien au-delà des drones. Dans des environnements industriels tels que les sites énergétiques et les installations distantes, où les données de chaque site sont sensibles, la plateforme améliore les modèles de détection sur de nombreux sites sans qu'aucune donnée brute ne traverse la limite de l'installation. Que les données se trouvent sur un drone ou une installation fixe, Scaleout maintient les images sur place et ne déplace que ce que le modèle a appris.
Link to this sectionConstruire une IA adaptative pour des environnements où les données ne peuvent pas bouger#
À mesure que Scaleout se développe, l'entreprise continue d'étendre sa vision par ordinateur fédérée et basée à la périphérie à davantage de contextes et de matériels. Ses modules pré-construits sont conçus pour réduire des mois d'intégration en quelques jours, permettant aux clients d'apporter leur propre matériel et d'adopter la boucle d'apprentissage adaptative sans avoir à reconstruire le code de machine learning sous-jacent.
Avec Ultralytics YOLO au cœur de son pipeline de détection, Scaleout rend possible l'entraînement et l'amélioration de l'IA exactement dans les environnements où les approches conventionnelles échouent, en conservant les données sur place, en restant opérationnel lors de pannes réseau, et en transformant des flottes d'appareils périphériques en un système qui continue d'apprendre dans son ensemble.
Prêt(e) à explorer ce que la Vision par IA peut faire pour toi ? Rends-toi sur notre dépôt GitHub pour découvrir comment les modèles YOLO transforment des domaines tels que l'IA dans la fabrication et la vision par ordinateur en robotique. Consulte nos options de licence et commence ton voyage vers une automatisation plus intelligente.






