Glosario

Pérdida focal

Descubra cómo Focal Loss resuelve el desequilibrio de clases en el aprendizaje profundo. Aprenda a implementarlo con Ultralytics para centrarse en ejemplos difíciles y mejorar la precisión del modelo.

La pérdida focal es una función objetivo especializada que se utiliza principalmente en el aprendizaje profundo para abordar el reto que supone un grave desequilibrio de clases. En muchas tareas de visión por ordenador, como la detección de objetos, el número de ejemplos de fondo (muestras negativas ) supera con creces al de objetos de interés (muestras positivas). Los métodos estándar, como la ampliamente utilizada pérdida de entropía cruzada, tratan todos los errores por igual, lo que a menudo provoca que el modelo se vea abrumado por el gran volumen de datosclassify . La pérdida focal modifica el cálculo estándar de la pérdida para restar importancia a estos ejemplos fáciles, lo que obliga al algoritmo de optimización a centrar su capacidad de aprendizaje en los ejemplos «difíciles», es decir, losclassify raros yclassify que son cruciales para el rendimiento del modelo .

El mecanismo de enfoque

La innovación principal de Focal Loss reside en su capacidad para escalar dinámicamente la penalización asignada a cada muestra en función de la confianza del modelo. En un escenario típico de aprendizaje supervisado, un detector puede evaluar miles de ubicaciones candidatas en una imagen. Dado que la mayoría de estas ubicaciones no contienen objetos, una función de pérdida estándar acumula muchas señales de error pequeñas de estos negativos fáciles, lo que puede ahogar la valiosa señal de las pocas instancias positivas.

La pérdida focal introduce un factor modulador que reduce la contribución de la pérdida a medida que aumenta la confianza en la clase correcta . Esto significa que si un modelo ya tiene un 99 % de certeza de que un parche de fondo es realmente fondo, la pérdida para ese parche se reduce casi a cero. En consecuencia, los pesos del modelo se actualizan principalmente en función de las muestras clasificadas erróneamente o aquellas en las que el modelo no tiene certeza. Este enfoque específico es esencial para entrenar detectores de objetos de una sola etapa de alto rendimiento como YOLO26, lo que les permite alcanzar una alta precisión sin necesitar complejas etapas de muestreo.

Aplicaciones en el mundo real

El manejo de datos de entrenamiento desequilibrados es fundamental para implementar sistemas de IA robustos en entornos donde la seguridad y la precisión son primordiales.

IA en la asistencia sanitaria: En campos como el análisis de imágenes médicas, identificar patologías es a menudo comparable a encontrar una aguja en un pajar. Por ejemplo, en una resonancia magnética en la que se buscan pequeñas lesiones, el tejido sano puede constituir más del 99 % de los píxeles. Un modelo estándar podría maximizar la precisión simple al predecir «sano» en todas partes, pasando por alto el diagnóstico crítico. La pérdida focal permite al sistema suprimir la señal del abundante tejido sano y dar prioridad al aprendizaje de las características sutiles de las anomalías, mejorando así la recuperación de detecciones que salvan vidas.
Vehículos autónomos: Los sistemas de percepción para los coches autónomos deben detect los usuarios detect de la vía pública, como peatones o ciclistas, en entornos complejos con edificios, carreteras y cielo de fondo. Aunque el fondo se aprende fácilmente, los obstáculos pequeños o lejanos suponen un reto importante. Mediante el uso de Focal Loss, la IA en aplicaciones automovilísticas puede garantizar que la pila de percepción no ignore estosdetect , manteniendo los estándares de seguridad incluso cuando los peligros ocupan solo una pequeña fracción del campo visual.

Aplicación con Ultralytics

En ultralytics La biblioteca incluye implementaciones optimizadas de funciones de pérdida avanzadas para admitir modelos de última generación. Mientras que el Plataforma Ultralytics configura automáticamente estos hiperparámetros para un entrenamiento óptimo, los desarrolladores también pueden acceder a estos componentes directamente para realizar investigaciones personalizadas .

El siguiente ejemplo muestra cómo inicializar Focal Loss utilizando el ultralytics paquete de utilidades y calcular el error para un conjunto de predicciones.

import torch
from ultralytics.utils.loss import FocalLoss

# Initialize Focal Loss.
# The 'gamma' parameter controls the focusing strength (higher = more focus on hard examples).
criterion = FocalLoss(gamma=1.5)

# Example: Model predictions (logits) and binary Ground Truth labels
# requires_grad=True simulates model outputs that need backpropagation
predictions = torch.tensor([[0.8], [-1.5], [0.1]], requires_grad=True)
targets = torch.tensor([[1.0], [0.0], [1.0]])

# Calculate the loss value
loss = criterion(predictions, targets)
print(f"Computed Focal Loss: {loss.item():.4f}")

Distinción de conceptos afines

Comprender dónde encaja la pérdida focal en el panorama más amplio de la medición de errores ayuda a seleccionar la estrategia adecuada para tareas específicas de visión artificial.

Pérdida focal frente a pérdida de entropía cruzada: La entropía cruzada es la métrica fundamental para la clasificación que penaliza las predicciones basadas en el error logarítmico. La pérdida focal es estrictamente una extensión de la entropía cruzada; si el parámetro de enfoque se establece en cero, matemáticamente vuelve a la entropía cruzada estándar. La diferencia clave es la capacidad de la pérdida focal para reducir automáticamente el peso de los negativos fáciles , lo que la hace superior para conjuntos de datos desequilibrados como COCO.
Pérdida focal frente a IoU : Mientras que la pérdida focal está diseñada para la clasificación (determinar qué es un objeto), IoU se utiliza para la localización (determinar dónde está un objeto). Los detectores modernos utilizan una función de pérdida compuesta que combina la pérdida focal para las probabilidades de clase y las métricas IoU para la regresión del cuadro delimitador.
Pérdida focal frente a pérdida de Dice: La pérdida de Dice es otra técnica utilizada para manejar el desequilibrio, principalmente en tareas de segmentación de imágenes. Mientras que la pérdida focal opera sobre píxeles o muestras individuales basándose en la confianza, la pérdida de Dice optimiza la superposición entre las regiones predichas y las regiones de referencia globalmente. Es habitual ver ambas utilizadas conjuntamente en flujos de trabajo de segmentación complejos.

Pérdida focal

Entrene los modelosYOLO Ultralytics para agilizar los flujos de trabajo en todos los sectores

Solución de licencias empresariales flexible para impulsar su innovación

Entrene modelos de IA en segundos con Ultralytics YOLO

El mecanismo de enfoque

Aplicaciones en el mundo real

Aplicación con Ultralytics

Distinción de conceptos afines

Leer más en esta categoría

12 casos de uso de imágenes aéreas impulsados por la visión artificial

¿Qué es la estimación de profundidad monocular? Una visión general

Una mirada al uso deYOLO Ultralytics para la detección de amenazas mediante IA

Únase a la comunidad Ultralytics