Glossaire

Apprentissage fédéré

Découvre l'apprentissage fédéré : une approche de l'IA axée sur la protection de la vie privée permettant l'entraînement décentralisé des modèles sur l'ensemble des appareils sans partager les données brutes.

Entraîne les modèles YOLO simplement
avec Ultralytics HUB

En savoir plus

L'apprentissage fédéré est une technique d'apprentissage machine (ML) conçue pour former des algorithmes à travers de multiples dispositifs de périphérie décentralisés ou des serveurs détenant des échantillons de données locales, sans échanger les données brutes elles-mêmes. Cette approche répond directement aux préoccupations essentielles concernant la confidentialité des données, la sécurité et les droits d'accès aux données, en permettant la formation collaborative de modèles à l'aide d'ensembles de données qui ne peuvent ou ne doivent pas être collectés de manière centralisée. Au lieu d'apporter les données à un modèle central, l'apprentissage fédéré apporte le processus de formation du modèle à l'emplacement des données, qui résident souvent sur des appareils d'IA Edge comme les smartphones ou les serveurs des hôpitaux. Il représente une évolution vers une intelligence artificielle (IA) plus sûre et plus respectueuse de la vie privée.

Concepts fondamentaux de l'apprentissage fédéré

L'apprentissage fédéré fonctionne selon un processus itératif généralement orchestré par un serveur central ou un coordinateur :

  1. Initialisation : Le serveur central démarre avec un modèle global initial (par exemple, un modèle générique). Ultralytics YOLO pour la détection d'objets).
  2. Distribution : Ce modèle global est envoyé à une sélection d'appareils clients (par exemple, des téléphones portables, des serveurs locaux).
  3. Formation locale : Chaque appareil client forme le modèle reçu à l'aide de ses propres données locales. Comme ces données ne quittent jamais l'appareil, la confidentialité est préservée. Cette étape utilise les ressources informatiques locales.
  4. Transmission des mises à jour : Au lieu d'envoyer des données brutes, les clients n'envoient au serveur central que les paramètres mis à jour du modèleweights and biases) ou les gradients calculés. Des techniques telles que l'agrégation sécurisée et la confidentialité différentielle peuvent être appliquées ici pour plus de sécurité.
  5. Agrégation : Le serveur central agrège les mises à jour des clients participants (par exemple, en calculant la moyenne des poids) afin d'améliorer le modèle global partagé.
  6. Itération : Les étapes 2 à 5 sont répétées jusqu'à ce que le modèle global atteigne le niveau de performance souhaité, souvent évalué à l'aide de mesures standard discutées dans des guides tels que YOLO Performance Metrics.

Ce processus permet au modèle global d'apprendre à partir d'une gamme vaste et diverse de données réparties dans de nombreux endroits sans compromettre la vie privée des utilisateurs. Tu peux explorer les recherches et les applications sur l'apprentissage fédéré pour en savoir plus.

Apprentissage fédéré vs. Formation distribuée

Bien que l'apprentissage fédéré implique une formation sur plusieurs machines, il diffère considérablement de la formation distribuée traditionnelle :

  • Distribution des données : La formation distribuée suppose généralement que les données sont collectées de manière centralisée, puis distribuées (souvent de manière identique et indépendante, ou IID) sur des nœuds dans un environnement contrôlé comme un centre de données. L'apprentissage fédéré suppose intrinsèquement que les données sont décentralisées dès le départ et qu'elles sont souvent non IID, ce qui reflète les variations des données du monde réel entre les utilisateurs ou les lieux.
  • Vie privée : La préservation de la vie privée est un objectif fondamental de l'apprentissage fédéré. L'objectif principal de la formation distribuée est généralement l'évolutivité et la rapidité, avec moins d'attention inhérente à la confidentialité des données pendant le processus de formation lui-même.
  • Réseau et matériel : L'apprentissage fédéré doit gérer des connexions réseau peu fiables et des capacités matérielles hétérogènes des appareils clients, alors que la formation distribuée fonctionne souvent sur des réseaux à large bande passante et un matériel plus uniforme.

Applications de l'apprentissage fédéré

L'apprentissage fédéré est particulièrement précieux dans les scénarios où les données sont sensibles, volumineuses ou intrinsèquement distribuées :

  • Santé : Former des modèles de diagnostic pour des tâches telles que l'analyse d'images médicales dans plusieurs hôpitaux sans partager les dossiers sensibles des patients. Cela permet de créer des modèles plus robustes en exploitant diverses données de patients tout en respectant des réglementations strictes en matière de confidentialité comme la HIPAA. Voir des exemples dans Apprentissage fédéré pour l'informatique de santé et explorer les solutions connexes d'IA dans le domaine de la santé.
  • Appareils mobiles : Améliorer les fonctions sur les appareils comme les claviers de texte prédictifs (par exemple, Gboard de Google), la reconnaissance des commandes de l'assistant vocal ou les recommandations personnalisées en entraînant les modèles directement sur les téléphones des utilisateurs sans télécharger les données personnelles ou l'historique des communications vers des serveurs centraux.
  • Finance : Détecter les transactions frauduleuses en entraînant des modèles sur des données de transactions détenues par différentes banques sans que celles-ci aient à partager des données confidentielles sur leurs clients.
  • IoT industriel : Développer des modèles de maintenance prédictive pour les machines en se basant sur des données de capteurs provenant de différentes usines ou sites sans centraliser des données opérationnelles potentiellement propriétaires.

Avantages de l'apprentissage fédéré

  • Confidentialité accrue : Les données brutes restent localisées sur l'appareil du client, ce qui réduit considérablement les risques de confidentialité.
  • Charge de communication réduite : la transmission des mises à jour de modèles est généralement beaucoup moins gourmande en bande passante que le transfert d'ensembles de données entiers.
  • Apprentissage en temps réel : Les modèles peuvent potentiellement être mis à jour plus fréquemment en utilisant les dernières données locales sur les appareils périphériques.
  • Exploite des données diverses : Permet d'accéder à des ensembles de données plus importants et plus variés qui ne peuvent pas être centralisés pour des raisons juridiques, éthiques ou logistiques, ce qui réduit potentiellement l'overfitting.

Les défis de l'apprentissage fédéré

Malgré ses avantages, Federated Learning est confronté à plusieurs obstacles :

  • Efficacité de la communication : La coordination et l'agrégation des mises à jour provenant potentiellement de milliers ou de millions d'appareils peuvent être lentes et complexes, en particulier avec une bande passante limitée ou des connexions peu fiables.
  • Hétérogénéité des systèmes : Les appareils clients varient grandement en termes de puissance de traitement (CPU/GPU), de mémoire, de connectivité réseau et de disponibilité de l'énergie.
  • Hétérogénéité statistique : Les données sur les appareils sont généralement non IID (non identiquement et indépendamment distribuées), ce qui peut biaiser le modèle global ou ralentir la convergence.
  • Problèmes de sécurité : Tout en améliorant la confidentialité des données, le système lui-même peut être vulnérable aux attaques adverses ciblant les mises à jour de modèles ou les failles de sécurité potentielles au niveau du serveur central. Il est donc essentiel de garantir la sécurité globale des données.
  • Gestion des clients : La sélection des clients appropriés, la gestion de la participation et le traitement des abandons sont des défis logistiques.

Des frameworks comme TensorFlow Federated et des bibliothèques d'organisations comme OpenMined visent à relever certains de ces défis. Bien que complexe, l'apprentissage fédéré est une voie prometteuse pour construire des systèmes d'IA à grande échelle et respectueux de la vie privée. Des plateformes comme Ultralytics HUB facilitent le cycle de vie global du déploiement et de la gestion des modèles, englobant potentiellement les modèles développés à l'aide d'approches fédérées. Tu peux explorer diverses options de déploiement de modèles au sein de l'écosystème Ultralytics . La combinaison de FL avec d'autres techniques telles que l'apprentissage actif est également un domaine de recherche en cours, comme indiqué dans l'article de blog sur l'apprentissage actif qui accélère le développement de la vision par ordinateur.

Tout lire