Connectez-vous à YOLO Vision 2025 !
25 septembre 2025
10:00 — 18:00, heure d'été britannique
Événement hybride
Yolo Vision 2024
Glossaire

Apprentissage fédéré

Découvrez l'apprentissage fédéré : une approche d'IA axée sur la confidentialité qui permet un entraînement de modèle décentralisé sur plusieurs appareils sans partage de données brutes.

L'apprentissage fédéré (FL) est une technique d'apprentissage automatique (AA) qui permet d'entraîner des modèles sur plusieurs appareils ou serveurs décentralisés contenant des échantillons de données locaux, sans échanger les données elles-mêmes. Cette approche répond aux préoccupations essentielles concernant la confidentialité des données et la sécurité en conservant les données brutes sur l'appareil de l'utilisateur. Au lieu de regrouper les données dans un serveur central pour l'entraînement du modèle, le FL fonctionne en envoyant un modèle global aux appareils locaux. Chaque appareil entraîne le modèle avec ses propres données, et seules les mises à jour du modèle qui en résultent—des améliorations mineures et ciblées—sont renvoyées à un serveur central pour être agrégées. Ce processus collaboratif améliore le modèle global partagé sans compromettre les informations de l'utilisateur.

Comment fonctionne l'apprentissage fédéré

Le processus d'apprentissage fédéré implique généralement un cycle répétitif d'étapes orchestrées par un serveur central de coordination :

  1. Distribution du modèle : Le serveur central initialise un modèle d'IA global, tel qu'un réseau neuronal, et le distribue à une sélection d'appareils clients (par exemple, des téléphones mobiles ou des ordinateurs d'hôpitaux).
  2. Entraînement local : Chaque appareil client entraîne le modèle sur son ensemble de données local. Étant donné que ces données ne quittent jamais l'appareil, elles restent privées. Cet entraînement local est un élément clé de l'intelligence embarquée, souvent associée à l'Edge AI.
  3. Soumission de mise à jour : Après quelques itérations d'entraînement, chaque client renvoie ses mises à jour de modèle calculées (telles que les gradients ou les poids du modèle) au serveur central. Il s'agit d'une charge utile beaucoup plus petite et plus sécurisée que les données brutes elles-mêmes.
  4. Agrégation sécurisée : Le serveur central agrège les mises à jour de tous les clients, par exemple en faisant leur moyenne, afin d'améliorer le modèle global. Des techniques telles que le calcul multipartite sécurisé peuvent être utilisées pour garantir que le serveur ne peut pas reconstituer les mises à jour individuelles.
  5. Amélioration du modèle : Le modèle global affiné est ensuite renvoyé aux clients pour le prochain cycle d'entraînement. Ce processus itératif se poursuit jusqu'à ce que la performance du modèle atteigne un niveau de précision souhaité.

Applications concrètes

L'apprentissage fédéré n'est pas qu'un concept théorique ; il alimente plusieurs applications courantes et transforme des secteurs où la sensibilité des données est primordiale.

  • Prédictions intelligentes du clavier : Des entreprises comme Google utilisent l'apprentissage fédéré pour améliorer le texte prédictif sur les claviers mobiles. Votre téléphone apprend de votre historique de frappe pour suggérer le mot suivant, et ces apprentissages sont partagés sous forme de mises à jour de modèles anonymisées afin d'améliorer le moteur de prédiction pour tous les utilisateurs sans que vos messages réels ne quittent jamais votre appareil.
  • Recherche médicale collaborative : L'apprentissage fédéré permet aux hôpitaux et aux institutions de recherche de collaborer à la création de modèles de diagnostic puissants pour des tâches telles que l'analyse d'images médicales afin de détecter les tumeurs. Chaque hôpital peut entraîner un modèle partagé sur ses données de patients, qui sont protégées par des lois sur la confidentialité comme HIPAA, sans jamais exposer les dossiers sensibles des patients à d'autres institutions ou à un référentiel central. Cela permet de créer des modèles plus robustes entraînés sur divers ensembles de données.

Apprentissage fédéré vs. Concepts connexes

Il est important de distinguer l'apprentissage fédéré (FL) des autres paradigmes d'apprentissage :

  • Entraînement centralisé : L'approche traditionnelle où toutes les données sont collectées en un seul endroit pour l'entraînement. L'apprentissage fédéré est l'opposé direct, conçu spécifiquement pour éviter la centralisation des données.
  • Apprentissage distribué : Cette technique utilise également plusieurs machines pour accélérer l'entraînement, mais elle suppose que les données d'entraînement sont stockées dans un emplacement central et peuvent être librement distribuées entre les nœuds d'entraînement. L'apprentissage fédéré, en revanche, fonctionne avec des données qui sont intrinsèquement décentralisées et ne peuvent pas être déplacées.
  • Apprentissage actif : Cette méthode se concentre sur la sélection efficace des points de données les plus informatifs à étiqueter afin de réduire les coûts d'annotation. Alors que l'apprentissage fédéré (FL) traite de l'endroit où l'entraînement a lieu, l'apprentissage actif traite des données utilisées. Les deux peuvent être combinés pour améliorer encore la confidentialité et l'efficacité, comme expliqué dans ce blog sur l'apprentissage actif.

Défis et Frameworks

Malgré ses avantages, l'apprentissage fédéré est confronté à des défis tels que des coûts de communication élevés, la gestion d'appareils avec une puissance de calcul variable (CPU/GPU) et le traitement de données non-IID (non identiquement et indépendamment distribuées), ce qui peut biaiser le modèle. Le système peut également être vulnérable aux attaques adversariales qui ciblent les mises à jour du modèle. Pour faire face à ces complexités, des frameworks tels que TensorFlow Federated et PySyft d'organisations comme OpenMined ont été développés. À mesure que la technologie mûrit, la gestion de l'ensemble du cycle de vie du déploiement du modèle et de la surveillance devient cruciale, un processus simplifié par des plateformes comme Ultralytics HUB.

Rejoignez la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant
Lien copié dans le presse-papiers