Glosario

Aprendizaje Federado

Descubre el aprendizaje federado: un enfoque de la IA centrado en la privacidad que permite el entrenamiento descentralizado de modelos a través de dispositivos sin compartir datos brutos.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

El Aprendizaje Federado es una técnica de Aprendizaje Automático (AM ) diseñada para entrenar algoritmos a través de múltiples dispositivos de borde descentralizados o servidores que contienen muestras de datos locales, sin intercambiar los propios datos brutos. Este enfoque aborda directamente las preocupaciones críticas en torno a la privacidad de los datos, la seguridad y los derechos de acceso a los datos, permitiendo el entrenamiento colaborativo de modelos utilizando conjuntos de datos que no pueden o no deben recopilarse de forma centralizada. En lugar de llevar los datos a un modelo central, el Aprendizaje Federado lleva el proceso de entrenamiento del modelo a la ubicación de los datos, que a menudo residen en dispositivos Edge AI como smartphones o servidores hospitalarios. Representa un cambio hacia una Inteligencia Artificial (IA) más segura y respetuosa con la privacidad.

Conceptos básicos del aprendizaje federado

El Aprendizaje Federado funciona mediante un proceso iterativo orquestado normalmente por un servidor central o coordinador:

  1. Inicialización: El servidor central comienza con un modelo global inicial (por ejemplo, un genérico Ultralytics YOLO genérico para la detección de objetos).
  2. Distribución: Este modelo global se envía a una selección de dispositivos cliente (por ejemplo, teléfonos móviles, servidores locales).
  3. Entrenamiento local: Cada dispositivo cliente entrena el modelo recibido utilizando sus propios datos locales. Como estos datos nunca salen del dispositivo, se mantiene la privacidad. Este paso utiliza recursos informáticos locales.
  4. Transmisión de actualizaciones: En lugar de enviar datos sin procesar, los clientes sólo envían al servidor central los parámetros actualizados del modeloweights and biases) o los gradientes calculados. Aquí pueden aplicarse técnicas como la agregación segura y la privacidad diferencial para mayor seguridad.
  5. Agregación: El servidor central agrega las actualizaciones de los clientes participantes (por ejemplo, promediando los pesos) para mejorar el modelo global compartido.
  6. Iteración: Los pasos 2-5 se repiten hasta que el modelo global alcanza el nivel de rendimiento deseado, a menudo evaluado utilizando métricas estándar comentadas en guías como YOLO Performance Metrics.

Este proceso permite que el modelo global aprenda de una amplia y diversa gama de datos distribuidos por muchas ubicaciones sin comprometer la privacidad del usuario. Puedes explorar la investigación y las aplicaciones del Aprendizaje Federado para obtener más información.

Aprendizaje Federado Vs. Formación Distribuida

Aunque el Aprendizaje Federado implica el entrenamiento en varias máquinas, difiere significativamente del Entrenamiento Distribuido tradicional:

  • Distribución de datos: El entrenamiento distribuido suele suponer que los datos se recogen de forma centralizada y luego se distribuyen (a menudo de forma idéntica e independiente, o IID) por los nodos de un entorno controlado, como un centro de datos. El Aprendizaje Federado asume inherentemente que los datos están descentralizados desde el principio y a menudo no son IID, reflejando las variaciones de datos del mundo real entre usuarios o ubicaciones.
  • La privacidad: La preservación de la privacidad es un objetivo fundamental del Aprendizaje Federado. El objetivo principal del entrenamiento distribuido suele ser la escalabilidad y la velocidad, con menos atención inherente a la privacidad de los datos durante el propio proceso de entrenamiento.
  • Red y hardware: El aprendizaje federado debe manejar conexiones de red poco fiables y capacidades de hardware heterogéneas de los dispositivos cliente, mientras que el entrenamiento distribuido suele funcionar en redes de gran ancho de banda y hardware más uniforme.

Aplicaciones del aprendizaje federado

El Aprendizaje Federado es especialmente valioso en situaciones en las que los datos son sensibles, grandes o están inherentemente distribuidos:

  • Sanidad: Entrenar modelos de diagnóstico para tareas como el Análisis de Imágenes Médicas en varios hospitales sin compartir los historiales sensibles de los pacientes. Esto permite la creación de modelos más sólidos aprovechando diversos datos de pacientes, al tiempo que se cumplen estrictas normas de privacidad como la HIPAA. Mira ejemplos en Aprendizaje Federado para Informática Sanitaria y explora soluciones relacionadas con la IA en la Sanidad.
  • Dispositivos móviles: Mejorar las funciones en los dispositivos, como los teclados de texto predictivo (por ejemplo, el Gboard de Google), el reconocimiento de comandos del asistente de voz o las recomendaciones personalizadas, entrenando los modelos directamente en los teléfonos de los usuarios, sin cargar los datos personales o el historial de comunicaciones en servidores centrales.
  • Finanzas: Detección de transacciones fraudulentas mediante el entrenamiento de modelos con datos de transacciones de distintos bancos, sin necesidad de que los bancos compartan datos confidenciales de los clientes.
  • IoT industrial: Desarrollar modelos de mantenimiento predictivo de maquinaria basados en datos de sensores de distintas fábricas o ubicaciones sin centralizar datos operativos potencialmente propietarios.

Ventajas del aprendizaje federado

  • Privacidad mejorada: Los datos en bruto permanecen localizados en el dispositivo cliente, lo que reduce significativamente los riesgos para la privacidad.
  • Menor carga de comunicación: Transmitir actualizaciones de modelos suele requerir mucho menos ancho de banda que transferir conjuntos de datos completos.
  • Aprendizaje en tiempo real: Los modelos pueden actualizarse potencialmente con mayor frecuencia utilizando los datos locales más recientes de los dispositivos de borde.
  • Aprovecha los Datos Diversos: Permite acceder a conjuntos de datos más amplios y variados que no pueden centralizarse por motivos legales, éticos o logísticos, reduciendo potencialmente el Sobreajuste.

Retos del aprendizaje federado

A pesar de sus ventajas, Federated Learning se enfrenta a varios obstáculos:

  • Eficacia de la comunicación: Coordinar y agregar actualizaciones de miles o millones de dispositivos puede ser lento y complejo, especialmente con un ancho de banda limitado o conexiones poco fiables.
  • Heterogeneidad de los sistemas: Los dispositivos cliente varían mucho en términos de potencia de procesamiento (CPU/GPU), memoria, conectividad de red y disponibilidad de energía.
  • Heterogeneidad estadística: Los datos de los dispositivos no suelen estar distribuidos de forma idéntica e independiente, lo que puede sesgar el modelo global o ralentizar la convergencia.
  • Problemas de seguridad: Aunque mejora la privacidad de los datos, el propio sistema puede ser vulnerable a ataques de adversarios dirigidos a actualizaciones de modelos o a posibles fallos de seguridad en el servidor central. Garantizar la seguridad general de los datos sigue siendo crucial.
  • Gestión de clientes: Seleccionar a los clientes adecuados, gestionar la participación y gestionar los abandonos son retos logísticos.

Los marcos como TensorFlow Federated y las bibliotecas de organizaciones como OpenMined pretenden abordar algunos de estos retos. Aunque complejo, el Aprendizaje Federado es una dirección prometedora para construir sistemas de IA a gran escala y respetuosos con la privacidad. Plataformas como Ultralytics HUB facilitan el ciclo de vida general de despliegue y gestión de modelos, abarcando potencialmente los modelos desarrollados mediante enfoques federados. Puedes explorar varias opciones de despliegue de modelos dentro del ecosistema Ultralytics . La combinación de FL con otras técnicas, como el Aprendizaje Activo, también es un área de investigación en curso, como se explica en la entrada del blog El Aprendizaje Activo acelera el desarrollo de la visión por ordenador.

Leer todo