Glossaire

Apprentissage fédéré

Découvrez l'apprentissage fédéré : une approche d'IA axée sur la confidentialité qui permet un entraînement de modèle décentralisé sur plusieurs appareils sans partage de données brutes.

L'apprentissage fédéré est une approche décentralisée de l'apprentissage l 'apprentissage machine (ML) qui permet à plusieurs de former en collaboration un modèle de prédiction partagé sans déplacer les données de formation de leur source d'origine. Contrairement aux méthodes traditionnelles qui nécessitent l'agrégation des données dans un lac de données centralisées, l 'apprentissage fédéré apporte le modèle aux données. modèle aux données. Ce changement de paradigme permet de relever les défis cruciaux liés à la confidentialité et à la sécurité des données. à la confidentialité et à la sécurité des données, ce qui permet de construire des systèmes robustes tout en conservant les informations sensibles de l'utilisateur strictement sur les appareils locaux, tels que les smartphones, les capteurs IoT ou les serveurs hospitaliers, ou les serveurs des hôpitaux.

Comment fonctionne l'apprentissage fédéré

Le processus repose sur un cycle itératif de communication entre un serveur central et les dispositifs clients participants. Il suit généralement les étapes suivantes :

Initialisation: Un serveur central initialise un modèle de réseau un modèle de réseau neuronal global et le diffuse à un groupe sélectionné de dispositifs clients éligibles.
Formation locale: Chaque appareil client effectue l'apprentissage du modèle localement en utilisant ses propres données privées. Cela permet d'exploiter les capacités de l'Edge AI d'Edge AI, ce qui garantit que les données brutes ne ne quittent jamais l'appareil.
Transmission des mises à jour: Au lieu de partager les données, les clients n'envoient que les mises à jour du modèle mathématique mathématiques, c'est-à-dire les gradients ou les auserveur central.
Agrégation: Le serveur utilise des techniques telles que Federated Averaging (FedAvg) pour combiner ces mises à jour dans un nouveau modèle global amélioré, modèle global amélioré.
Itération: Le modèle global mis à jour est renvoyé aux clients et le cycle se répète jusqu'à ce que le modèle atteigne la précision souhaitée. atteigne la précision souhaitée.

Applications concrètes

L'apprentissage fédéré est passé de la recherche théorique au déploiement pratique dans les secteurs où la sensibilité des données est primordiale. données.

Soins de santé et imagerie médicale: Les hôpitaux utilisent l'apprentissage fédéré pour collaborer à l'analyse d'images médicales l'analyse d'images médicales pour la détection de tumeurs sans partager les dossiers des patients. Cela permet aux institutions de former de puissantes solutions d'IA dans le domaine de la santé sur divers ensembles de données. l 'IA dans les solutions de soins de santé sur divers ensembles de données tout en respectant strictement les réglementations telles que l'HIPAA.
Texte prédictif mobile: Les claviers de smartphones utilisent cette technologie pour améliorer le traitement du langage naturel (NLP). traitement du langage naturel (NLP) pour la prédiction du mot suivant. En apprenant localement à partir des habitudes de frappe, le système améliore l'expérience de l'utilisateur sans transmettre de messages textuels privés au nuage, une méthode défendue par la recherche en IA de Google AI research.

Apprentissage fédéré vs. formation distribuée

Bien que les deux concepts impliquent plusieurs machines, ils diffèrent fondamentalement en ce qui concerne la gouvernance des données et l'environnement réseau.

Apprentissage fédéré: Les données sont générées localement et restent décentralisées en raison de contraintes liées à la protection de la vie privée. Les appareils sont souvent hétérogènes (matériel différent) et ont des connexions réseau instables.
Formation distribuée: Se produit généralement dans un centre de données contrôlé où un ensemble de données central est réparti entre des nœuds de calcul (comme une grappe de GPU) afin d'accélérer le processus d'apprentissage et d'améliorer la qualité des données. cluster de GPU) afin d'accélérer le traitement traitement de grands ensembles de données.

Exemple de code : Simulation d'une mise à jour du client local

Dans une configuration fédérée, le rôle du client est d'affiner le modèle global sur les données locales. L'extrait Python suivant montre comment un client peut effectuer un cycle d'apprentissage local en utilisant la fonction Ultralytics YOLO11 avant que les poids ne soient extraits pour extraits pour l'agrégation.

from ultralytics import YOLO

# Load the global model received from the central server
# In a real scenario, this 'yolo11n.pt' comes from the aggregator
model = YOLO("yolo11n.pt")

# Perform local training on the client's private dataset
# 'epochs=1' simulates a single round of local computation
results = model.train(data="coco8.yaml", epochs=1, imgsz=640)

# After training, the updated model weights are saved
# These weights are what the client sends back to the server
print("Local training complete. Update ready for transmission.")

Avantages et défis

Le principal avantage de l'apprentissage fédéré est le respect de la vie privée dès la conception. Il permet d'utiliser des données synthétiques ou de données privées réelles qui seraient autrement inaccessibles en raison de restrictions légales ou éthiques. En outre, il réduit la consommation de bande passante du réseau puisque les grands ensembles de données ne sont pas transférés.

Cependant, des défis subsistent. L'hétérogénéité des systèmes signifie que les modèles doivent s'exécuter sur des appareils dont la puissance de calcul, qu'il s'agisse de puissants serveurs ou de capteurs IoT dont la batterie est limitée. Il y a aussi le risque de attaques adversesoù des clients malveillants pourraient soumettre des mises à jour empoisonnées pour corrompre le modèle global. Pour atténuer ce risque, les chercheurs techniques de confidentialité différentielle pour ajouter du bruit aux pour ajouter du bruit aux mises à jour, garantissant ainsi qu'aucune donnée d'un seul utilisateur ne peut faire l'objet d'une rétro-ingénierie.

Des frameworks tels que TensorFlow Federated et PySyft aident actuellement les développeurs à mettre en œuvre ces complexes. À mesure que la vision par ordinateur continue d'évoluer, l'apprentissage fédéré jouera un l'évolution de la vision par ordinateur, l'apprentissage fédéré jouera un rôle crucial dans le déploiement de systèmes intelligents qui respectent la vie privée des utilisateurs tout en produisant des résultats très performants. tout en fournissant des résultats de haute performance.

Apprentissage fédéré

Former les modèlesYOLO d'Ultralytics pour rationaliser les flux de travail dans tous les secteurs d'activité

Solution de licence d'entreprise flexible pour dynamiser votre innovation

Former des modèles d'IA en quelques secondes avec Ultralytics YOLO

Comment fonctionne l'apprentissage fédéré

Applications concrètes

Apprentissage fédéré vs. formation distribuée

Exemple de code : Simulation d'une mise à jour du client local

Avantages et défis

En savoir plus dans cette catégorie

Comprendre pourquoi l'annotation humaine est essentielle

Qu'est-ce que la distillation de jeux de données ? Un aperçu rapide

Les lunettes Oakley Meta AI redéfinissent les lunettes grâce à la technologie Vision AI.

Rejoindre la communauté Ultralytics