¡Sintonice YOLO Vision 2025!
25 de septiembre de 2025
10:00 — 18:00 BST
Evento híbrido
Yolo Vision 2024
Glosario

Pérdida focal

Descubra cómo Focal Loss aborda el desequilibrio de clases en la detección de objetos, centrando el entrenamiento en ejemplos difíciles para mejorar la precisión en conjuntos de datos desequilibrados.

La pérdida focal es una función de pérdida especializada diseñada para abordar el problema del desequilibrio de clases durante el entrenamiento de modelos de aprendizaje automático. Este problema es especialmente común en las tareas de detección de objetos, en las que el número de ejemplos de fondo (clase negativa) puede superar ampliamente al de objetos de interés en primer plano (clase positiva). Al ajustar dinámicamente el peso de cada ejemplo, Focal Loss anima al modelo a centrar sus esfuerzos de aprendizaje en los ejemplos difíciles de clasificar, en lugar de verse abrumado por el gran número de ejemplos negativos fáciles de clasificar. Este enfoque mejora significativamente la precisión y el rendimiento de los modelos entrenados en conjuntos de datos desequilibrados.

Cómo funciona la pérdida focal

La pérdida focal es una mejora de la pérdida de entropía cruzada estándar, ampliamente utilizada en tareas de clasificación de imágenes. La innovación clave, introducida en el artículo RetinaNet por investigadores de Meta AI (antes Facebook AI Research), es un factor modulador que reduce la contribución a la pérdida de los ejemplos bien clasificados. De este modo, las actualizaciones de retropropagación del modelo se basan principalmente en los errores de los ejemplos difíciles de clasificar. La función incluye un "parámetro de enfoque" que controla la velocidad a la que se reduce la pérdida de los ejemplos fáciles. Al dar prioridad a estos ejemplos difíciles, el algoritmo de optimización puede realizar ajustes más significativos en las ponderaciones del modelo, lo que conduce a un mejor rendimiento general, especialmente para los detectores de objetos de una sola etapa como RetinaNet y algunas versiones de YOLO. En la documentación de Ultralytics puede consultar la implementación técnica de Focal Loss.

Aplicaciones en el mundo real

La pérdida focal es fundamental para entrenar modelos robustos en diversos escenarios del mundo real en los que el desequilibrio de clases es un reto importante.

  • Conducción autónoma: En el desarrollo de vehículos autónomos, los modelos deben detectar una amplia gama de objetos, algunos de los cuales aparecen con poca frecuencia, como peatones, ciclistas o señales de tráfico distantes. La mayor parte de una imagen puede ser la carretera o el cielo (fondo). La pérdida focal ayuda al modelo a prestar más atención a estos objetos críticos pero poco frecuentes, garantizando que no pasen desapercibidos. Esto es crucial para crear soluciones de IA seguras y fiables en el sector de la automoción. Instituciones como la Universidad Carnegie Mellon ofrecen una visión general de los retos en este campo.
  • Diagnóstico médico: en el análisis de imágenes médicas, los modelos se entrenan para detectar anomalías como tumores o lesiones a partir de exploraciones. A menudo, la región anómala es muy pequeña en comparación con el tejido sano circundante. La pérdida focal permite al modelo centrarse en la identificación de estas zonas sutiles y difíciles de detectar, que de otro modo podrían ignorarse en favor de la abrumadora clase de fondo. De este modo se obtienen herramientas de diagnóstico más precisas y fiables, como se observa en las aplicaciones para detectar tumores en conjuntos de datos médicos.

Comparación con otras funciones de pérdida

Es importante distinguir la Pérdida Focal de otras funciones de pérdida relacionadas que se utilizan en visión por ordenador.

  • Pérdida de entropía cruzada: La pérdida focal es una modificación directa de la pérdida de entropía cruzada. Mientras que la entropía cruzada trata todos los ejemplos por igual, la pérdida focal introduce un término para reducir el impacto de los ejemplos fáciles, lo que la hace más adecuada para datos de entrenamiento desequilibrados. Para una comprensión más profunda de la entropía cruzada, los apuntes CS231n de Stanford ofrecen una buena explicación.
  • Pérdida Varifocal: se trata de una función de pérdida más reciente que se basa en los principios de la Pérdida Focal. Mientras que Focal Loss trata todos los ejemplos positivos por igual, Varifocal Loss los pondera en función de su puntuación de clasificación, dando más peso a los ejemplos positivos de alta calidad. Puede obtener más información sobre su aplicación específica en la referencia de la función de pérdida de Ultralytics.
  • Pérdidas basadas en IoU: Funciones como la intersección generalizada sobre la unión (IoU), DIoU y CIoU se utilizan para medir la precisión de localización de un cuadro delimitador predicho. Se refieren a dónde está un objeto, mientras que la pérdida focal se refiere a qué es un objeto (su clasificación). En detectores modernos como Ultralytics YOLOv8, la pérdida por clasificación (como la pérdida focal) y la pérdida por regresión (como una pérdida basada en IoU) se utilizan conjuntamente para entrenar el modelo.

Únete a la comunidad de Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora
Enlace copiado al portapapeles