Glossar

Federated Learning

Entdecken Sie Federated Learning: ein datenschutzorientierter KI-Ansatz, der dezentrales Modelltraining über verschiedene Geräte hinweg ermöglicht, ohne Rohdaten auszutauschen.

Federated Learning (FL) ist eine Technik des maschinellen Lernens (ML), die es ermöglicht, Modelle über mehrere dezentrale Geräte oder Server zu trainieren, die lokale Datenbeispiele enthalten, ohne die Daten selbst auszutauschen. Dieser Ansatz berücksichtigt kritische Aspekte des Datenschutzes und der Datensicherheit, indem Rohdaten auf dem Gerät des Benutzers verbleiben. Anstatt Daten in einem zentralen Server für das Modelltraining zu bündeln, sendet FL ein globales Modell an lokale Geräte. Jedes Gerät trainiert das Modell mit seinen eigenen Daten, und nur die daraus resultierenden Modellaktualisierungen – kleine, fokussierte Verbesserungen – werden an einen zentralen Server zurückgesendet, um aggregiert zu werden. Dieser kollaborative Prozess verbessert das gemeinsam genutzte globale Modell, ohne die Benutzerinformationen zu gefährden.

Wie Federated Learning funktioniert

Der Federated-Learning-Prozess umfasst typischerweise einen sich wiederholenden Zyklus von Schritten, die von einem zentralen Koordinierungsserver gesteuert werden:

Modellverteilung: Der zentrale Server initialisiert ein globales KI-Modell, z. B. ein neuronales Netzwerk, und verteilt es an eine Auswahl von Client-Geräten (z. B. Mobiltelefone oder Krankenhauscomputer).
Lokales Training: Jedes Client-Gerät trainiert das Modell mit seinem lokalen Datensatz. Da diese Daten das Gerät nie verlassen, bleiben sie privat. Dieses lokale Training ist eine Schlüsselkomponente der On-Device-Intelligenz, die oft mit Edge AI in Verbindung gebracht wird.
Update Submission (Aktualisierungsübermittlung): Nach dem Training für einige Iterationen sendet jeder Client seine berechneten Modellaktualisierungen (wie z. B. Gradienten oder Modellgewichte) zurück an den zentralen Server. Dies ist eine viel kleinere und sicherere Nutzlast als die Rohdaten selbst.
Sichere Aggregation: Der zentrale Server aggregiert die Aktualisierungen von allen Clients—zum Beispiel durch Mittelung—, um das globale Modell zu verbessern. Techniken wie Secure Multiparty Computation können verwendet werden, um sicherzustellen, dass der Server einzelne Aktualisierungen nicht rekonstruieren kann.
Modellverbesserung: Das verfeinerte globale Modell wird dann zur nächsten Trainingsrunde an die Clients zurückgesendet. Dieser iterative Prozess wird fortgesetzt, bis die Leistung des Modells ein gewünschtes Maß an Genauigkeit erreicht.

Anwendungsfälle in der Praxis

Federated Learning ist nicht nur ein theoretisches Konzept; es treibt mehrere Mainstream-Anwendungen an und verändert Branchen, in denen Datenvertraulichkeit von größter Bedeutung ist.

Smart Keyboard Predictions: Unternehmen wie Google verwenden FL, um die Textvorhersage auf mobilen Tastaturen zu verbessern. Ihr Telefon lernt aus Ihrem Tippverlauf, um das nächste Wort vorzuschlagen, und diese Erkenntnisse werden als anonymisierte Modellaktualisierungen weitergegeben, um die Vorhersage-Engine für alle Benutzer zu verbessern, ohne dass Ihre tatsächlichen Nachrichten jemals Ihr Gerät verlassen.
Kollaborative medizinische Forschung: FL ermöglicht es Krankenhäusern und Forschungseinrichtungen, gemeinsam leistungsstarke Diagnosemodelle für Aufgaben wie die medizinische Bildanalyse zur Erkennung von Tumoren zu entwickeln. Jedes Krankenhaus kann ein gemeinsames Modell mit seinen Patientendaten trainieren, die durch Datenschutzgesetze wie HIPAA geschützt sind, ohne sensible Patientendaten an andere Institutionen oder ein zentrales Repository weiterzugeben. Dies ermöglicht die Erstellung robusterer Modelle, die mit verschiedenen Datensätzen trainiert wurden.

Federated Learning vs. verwandte Konzepte

Es ist wichtig, Federated Learning (FL) von anderen Lernparadigmen zu unterscheiden:

Zentralisiertes Training: Der traditionelle Ansatz, bei dem alle Daten an einem Ort für das Training gesammelt werden. Föderiertes Lernen (FL) ist das direkte Gegenteil und wurde speziell entwickelt, um die Zentralisierung von Daten zu vermeiden.
Verteiltes Training: Diese Technik verwendet ebenfalls mehrere Maschinen, um das Training zu beschleunigen, geht aber davon aus, dass die Trainingsdaten an einem zentralen Ort gespeichert sind und frei auf die Trainingsknoten verteilt werden können. FL hingegen arbeitet mit Daten, die von Natur aus dezentralisiert sind und nicht verschoben werden können.
Aktives Lernen: Diese Methode konzentriert sich auf die effiziente Auswahl der informativsten Datenpunkte, die zur Reduzierung der Annotationskosten gelabelt werden sollen. Während sich FL damit beschäftigt, wo das Training stattfindet, befasst sich Active Learning damit, welche Daten verwendet werden. Die beiden können kombiniert werden, um die Privatsphäre und Effizienz weiter zu verbessern, wie in diesem Blog über Active Learning erläutert wird.

Herausforderungen und Frameworks

Trotz seiner Vorteile steht FL vor Herausforderungen wie hohen Kommunikationskosten, der Verwaltung von Geräten mit unterschiedlicher Rechenleistung (CPU/GPU) und dem Umgang mit Non-IID-Daten (nicht identisch und unabhängig verteilt), was das Modell verzerren kann. Das System kann auch anfällig für Adversarial Attacks sein, die auf Modellaktualisierungen abzielen. Um diese Komplexität zu bewältigen, wurden Frameworks wie TensorFlow Federated und PySyft von Organisationen wie OpenMined entwickelt. Mit zunehmender Reife der Technologie wird die Verwaltung des gesamten Lebenszyklus der Modellbereitstellung und -überwachung entscheidend, ein Prozess, der durch Plattformen wie Ultralytics HUB vereinfacht wird.

Federated Learning

Trainieren Sie Ultralytics YOLO-Modelle, um Arbeitsabläufe in allen Branchen zu rationalisieren

Flexible Enterprise-Lizenzlösung zur Förderung Ihrer Innovationen

Trainieren Sie KI-Modelle in Sekundenschnelle mit Ultralytics YOLO

Wie Federated Learning funktioniert

Anwendungsfälle in der Praxis

Federated Learning vs. verwandte Konzepte

Herausforderungen und Frameworks

Mehr in dieser Kategorie lesen

Eine Kurzanleitung für Anfänger, wie man ein KI-Modell trainiert

Aus Dubai mit Einblicken: Die wichtigsten Erkenntnisse aus dem GDG MENA-T Summit 2025

Erforschung des Ensemble-Lernens und seiner Rolle in KI und ML

Treten Sie der Ultralytics-Community bei