Edge AI
Explore l'Edge AI et apprends à déployer Ultralytics YOLO26 sur du matériel local pour une inférence en temps réel, une latence réduite et une meilleure confidentialité des données en périphérie.
L'Edge AI désigne le déploiement d'algorithmes et de modèles d'intelligence artificielle (IA) directement sur des appareils matériels locaux — tels que les smartphones, les capteurs IoT, les drones et les véhicules connectés — plutôt que de dépendre de centres de cloud computing centralisés. Cette approche décentralisée permet de traiter les données à la source, réduisant considérablement la latence liée aux échanges avec des serveurs distants. En exécutant des tâches d'apprentissage automatique (ML) localement, les appareils peuvent prendre des décisions instantanées, fonctionner de manière fiable sans connexion Internet et renforcer la confidentialité des données en conservant les informations sensibles directement sur l'appareil.
Link to this sectionComment fonctionne l'Edge AI#
Le cœur de l'Edge AI consiste à exécuter un moteur d'inférence sur un système embarqué. Comme les appareils de périphérie ont généralement une autonomie et une puissance de calcul limitées par rapport aux serveurs cloud, les modèles d'IA doivent être très efficaces. Les développeurs emploient souvent des techniques comme la quantification de modèle ou l'élagage de modèle pour compresser de grands réseaux de neurones sans sacrifier de manière significative la précision.
Des accélérateurs matériels spécialisés sont fréquemment utilisés pour gérer ces charges de travail efficacement. On peut citer la plateforme NVIDIA Jetson pour la robotique et le Google Coral Edge TPU pour l'inférence basse consommation. Les frameworks logiciels jouent également un rôle essentiel ; des outils comme TensorRT et TFLite optimisent les modèles spécifiquement pour ces environnements contraints, garantissant une inférence en temps réel rapide.
Link to this sectionEdge AI vs Edge Computing#
Bien que ces termes soient souvent utilisés de manière interchangeable, il est utile de les distinguer :
- Edge Computing : Ce terme décrit l'infrastructure physique et la topologie réseau plus larges où le traitement des données se produit près de la source de données. C'est le « où » de l'équation.
- Edge AI : Cela fait spécifiquement référence aux applications intelligentes fonctionnant sur cette infrastructure. C'est le « quoi ». Par exemple, une caméra de sécurité agit comme un appareil d'edge computing, mais lorsqu'elle utilise la vision par ordinateur (CV) pour reconnaître une personne spécifique, elle effectue de l'Edge AI.
Link to this sectionApplications concrètes#
L'Edge AI transforme les industries en permettant une prise de décision autonome dans des scénarios critiques :
- Véhicules autonomes : Les voitures autonomes génèrent quotidiennement des téraoctets de données. Elles ne peuvent pas compter sur le cloud pour identifier les piétons ou les obstacles en raison de la latence du signal. Au lieu de cela, elles utilisent l'Edge AI embarqué pour une détection d'objets instantanée afin d'assurer la sécurité des passagers.
- Fabrication intelligente : Dans l'IIoT (Industrial IoT), les capteurs sur les sites de production utilisent l'Edge AI pour la maintenance prédictive. En analysant les données de vibration et de température localement, le système peut détecter des anomalies et prédire une défaillance de l'équipement en temps réel, évitant ainsi des temps d'arrêt coûteux.
- Santé : Les appareils médicaux portables équipés de Vision AI peuvent analyser des images médicales ou les signes vitaux des patients directement au point de soins, offrant un soutien au diagnostic immédiat dans des zones reculées avec une faible connectivité.
Link to this sectionDéploiement de modèles vers l'Edge#
Le déploiement d'un modèle à la périphérie implique généralement l'entraînement d'un modèle dans un environnement à haute puissance de calcul, puis son exportation vers un format compatible avec les appareils de périphérie, tel qu'ONNX ou OpenVINO. La Ultralytics Platform simplifie ce flux de travail, permettant aux utilisateurs d'entraîner et d'exporter automatiquement des modèles pour diverses cibles de périphérie.
The following example demonstrates how to export a lightweight YOLO26 model—specifically designed for efficiency—to a format suitable for mobile and edge deployment.
from ultralytics import YOLO
# Load the YOLO26 Nano model, which is optimized for speed on edge devices
model = YOLO("yolo26n.pt")
# Export the model to TFLite format for deployment on Android or Raspberry Pi
# This creates a 'yolo26n.tflite' file ready for edge inference
model.export(format="tflite")Advanced edge deployments often utilize containerization technologies like Docker to package applications, ensuring they run consistently across different device architectures, from Raspberry Pi units to industrial gateways.






