Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Aprendizaje Federado

Descubra cómo el aprendizaje federado permite el entrenamiento descentralizado de modelos al tiempo que preserva la privacidad de los datos. Aprenda a entrenar Ultralytics en dispositivos periféricos de forma segura.

El aprendizaje federado es una técnica de aprendizaje automático descentralizada que permite que varios dispositivos entrenen de forma colaborativa un modelo sin compartir sus datos de entrenamiento sin procesar. A diferencia de los métodos centralizados tradicionales, en los que los datos se agregan en un único lago de datos o servidor, el aprendizaje federado lleva el modelo a los datos. Este enfoque cambia radicalmente la forma en que abordamos la privacidad y la seguridad de los datos, ya que permite a las organizaciones utilizar información confidencial ubicada en teléfonos inteligentes, dispositivos IoT o servidores privados, al tiempo que garantiza que los datos nunca salgan de su fuente original.

Cómo funciona el proceso federado

El mecanismo central del aprendizaje federado implica un ciclo iterativo de comunicación entre un servidor central y los dispositivos cliente participantes. Este proceso permite la mejora continua de una red neuronal global sin comprometer el anonimato de los usuarios .

  1. Inicialización del modelo global: un servidor central inicializa un modelo base genérico y lo transmite a un grupo seleccionado de dispositivos cliente elegibles.
  2. Entrenamiento local: cada cliente realiza el entrenamiento del modelo de forma independiente utilizando su propio conjunto de datos local y privado . Esto aprovecha las capacidades de Edge AI para calcular las actualizaciones en el dispositivo.
  3. Agregación de actualizaciones: En lugar de cargar imágenes o texto sin procesar, los clientes solo envían las actualizaciones de su modelo —concretamente, los gradientes calculados o los pesos del modelo— al servidor central.
  4. Mejora global: el servidor utiliza algoritmos como Federated Averaging (FedAvg) para combinar estas diversas actualizaciones en un nuevo modelo global superior.
  5. Iteración: El modelo mejorado se envía de vuelta a los clientes, y el ciclo se repite hasta que el sistema alcanza la precisión deseada.

Aprendizaje federado frente a formación distribuida

Es importante distinguir el aprendizaje federado de paradigmas de entrenamiento similares, ya que resuelven diferentes problemas de ingeniería.

  • Formación distribuida: Normalmente se produce en un entorno controlado, como un único centro de datos, donde un conjunto de datos masivo y centralizado se divide entre múltiples GPU para acelerar el cálculo. El objetivo principal es la velocidad de procesamiento, y los nodos están conectados por enlaces de gran ancho de banda.
  • Aprendizaje federado: Funciona en un entorno no controlado con dispositivos heterogéneos (como teléfonos móviles) que tienen diferentes duraciones de batería y conexiones de red. El objetivo principal es la privacidad y el acceso a los datos, no necesariamente la velocidad pura.

Aplicaciones en el mundo real

La capacidad de entrenar con datos descentralizados ha abierto nuevas puertas a sectores sujetos a estrictas normas de cumplimiento normativo.

  • IA en la asistencia sanitaria: Los hospitales pueden colaborar para entrenar modelos robustos de detección de tumores utilizando el análisis de imágenes médicas sin compartir los registros de los pacientes. Esto permite a las instituciones beneficiarse de un conjunto de datos más amplio, al tiempo que se cumplen las regulaciones de la HIPAA.
  • Teclados predictivos: los sistemas operativos móviles utilizan el aprendizaje federado para mejorar la predicción de la siguiente palabra y el procesamiento del lenguaje natural (NLP). Al aprender de los patrones de escritura a nivel local, el teléfono mejora la experiencia del usuario sin transmitir mensajes privados a la nube.
  • IA en automoción: Las flotas de vehículos autónomos pueden aprender de las condiciones locales de la carretera y de las intervenciones de los conductores. Esta información se agrega para actualizar las capacidades de conducción autónoma de la flota sin necesidad de cargar terabytes de imágenes de vídeo sin procesar en un servidor central.

Ejemplo de código: Simulación de una actualización de cliente local

En un flujo de trabajo federado, la tarea del cliente es ajustar el modelo global en un pequeño conjunto de datos local. El siguiente Python muestra cómo un cliente podría realizar una ronda de entrenamiento local utilizando el modelo de última generación YOLO26.

from ultralytics import YOLO

# Load the global model received from the central server
# In a real FL system, this weight file is downloaded from the aggregator
model = YOLO("yolo26n.pt")

# Perform local training on the client's private data
# We train for 1 epoch to simulate a single round of local contribution
results = model.train(data="coco8.yaml", epochs=1, imgsz=640)

# The updated 'best.pt' weights would now be extracted
# and sent back to the central server for aggregation
print("Local training round complete. Weights ready for transmission.")

Ventajas y perspectivas futuras

La principal ventaja del aprendizaje federado es la privacidad desde el diseño. Permite a los desarrolladores entrenar con datos sintéticos o casos extremos del mundo real que de otro modo serían inaccesibles debido a leyes de privacidad como el RGPD. Además, reduce los costes de ancho de banda de la red, ya que los datos de vídeo o imágenes de alta resolución permanecen en el ámbito local.

Sin embargo, siguen existiendo retos, especialmente en lo que respecta a la heterogeneidad del sistema (diferentes dispositivos con diferente potencia de procesamiento) y la seguridad frente a ataques adversarios. En teoría, los clientes malintencionados podrían enviar actualizaciones «envenenadas» para corromper el modelo global. Para mitigar esto, a menudo se integran técnicas avanzadas como la privacidad diferencial para añadir ruido estadístico a las actualizaciones, lo que garantiza que no se pueda aplicar ingeniería inversa a la contribución de ningún usuario individual.

Herramientas como la Ultralytics están evolucionando para ayudar a gestionar la complejidad de los modelos de entrenamiento en diversos entornos, garantizando que el futuro de la IA sea potente y privado. Marcos innovadores como TensorFlow y PySyft siguen ampliando los límites de lo que es posible con el aprendizaje automático descentralizado que preserva la privacidad.

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora