Underfitting
Aprende a identificar y resolver el subajuste en el aprendizaje automático. Explora las causas, los indicadores y cómo optimizar los modelos de Ultralytics YOLO26 para una mejor precisión.
El underfitting se produce cuando un modelo de machine learning es demasiado simple o carece de la capacidad para capturar las tendencias y patrones subyacentes dentro de los datos de entrenamiento. Conceptualmente, es análogo a intentar ajustar una línea recta a través de puntos de datos que forman una curva distinta; el modelo no logra captar la complejidad de la relación entre las entradas y las salidas. Debido a que el modelo no ha aprendido los datos de forma eficaz, presenta un rendimiento deficiente no solo en el conjunto de entrenamiento, sino también en los datos de validación no vistos, lo que conduce a una baja precisión predictiva. Este fenómeno es a menudo el resultado de un alto sesgo en IA, donde el algoritmo hace suposiciones demasiado simplistas sobre la función objetivo.
Link to this sectionCausas e indicadores#
Varios factores pueden conducir a un modelo con underfitting. La causa más común es utilizar una arquitectura de modelo que no es lo suficientemente compleja para la tarea en cuestión, como aplicar regresión lineal a datos no lineales. Una duración de entrenamiento insuficiente, donde el modelo no recibe suficientes épocas para converger, también impide un aprendizaje adecuado. Además, una regularización excesiva —una técnica que normalmente se utiliza para prevenir el problema opuesto— puede limitar demasiado el modelo, impidiendo que capture características importantes.
Los ingenieros pueden identificar el underfitting supervisando las funciones de pérdida durante el entrenamiento. Si tanto el error de entrenamiento como el error de validación permanecen altos y no disminuyen significativamente, es probable que el modelo tenga underfitting. A diferencia de una ingeniería de características eficaz, que ayuda a los modelos a entender los datos, proporcionar muy pocas características también puede privar al modelo de información necesaria.
Link to this sectionUnderfitting frente a overfitting#
Es crucial distinguir el underfitting de su contraparte, el overfitting. Estos dos conceptos representan los extremos opuestos del compromiso sesgo-varianza.
- Underfitting (alto sesgo): El modelo es demasiado rígido. Se comporta mal tanto en los datos de entrenamiento como en los datos de prueba porque no ha aprendido la señal básica.
- Overfitting (alta varianza): El modelo es demasiado flexible. Memoriza los datos de entrenamiento, incluido el ruido, funcionando excepcionalmente bien durante el entrenamiento pero fallando al generalizar a nuevos ejemplos.
Encontrar el "punto óptimo" entre estos dos extremos es el objetivo principal de la optimización de modelos.
Link to this sectionAplicaciones en el mundo real#
Comprender el underfitting es vital para desarrollar sistemas de IA fiables en diversos sectores.
- Conducción autónoma: En el contexto de los vehículos autónomos, un modelo de detección de objetos con underfitting podría no distinguir entre un peatón y una farola en entornos urbanos complejos. Debido a que el modelo carece de los parámetros necesarios para aprender las diferencias visuales sutiles, pone en peligro la seguridad de la IA.
- Diagnóstico médico: Al aplicar el análisis de imágenes médicas para detectar anomalías como tumores, un modelo demasiado simple podría pasar por alto crecimientos pequeños o irregulares. Si la red neuronal es demasiado superficial, no puede aprender las texturas intrincadas necesarias para una alta sensibilidad y especificidad, lo que conduce a diagnósticos fallidos.
Link to this sectionAbordar el underfitting con código#
En computer vision, el underfitting a menudo ocurre al usar una variante de modelo que es demasiado pequeña para la dificultad de la tarea (por ejemplo, detectar objetos pequeños en imágenes de drones de alta resolución). El siguiente ejemplo en Python demuestra cómo cambiar de un modelo más pequeño a uno más grande y capaz utilizando la biblioteca ultralytics para resolver un posible underfitting.
from ultralytics import YOLO
# If 'yolo26n.pt' (Nano) is underfitting and yielding low accuracy,
# upgrade to a model with higher capacity like 'yolo26l.pt' (Large).
model = YOLO("yolo26l.pt")
# Train the larger model.
# Increasing epochs also helps the model converge if it was previously underfitting.
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)Al cambiar a un modelo de Ultralytics YOLO26 más grande y asegurar una duración de entrenamiento adecuada, el sistema obtiene los parámetros necesarios para aprender patrones complejos, mitigando eficazmente el underfitting. Para verificar que tu modelo ya no tiene underfitting, evalúalo siempre con un conjunto de datos de prueba robusto. Para gestionar conjuntos de datos y realizar un seguimiento de los experimentos a fin de detectar el underfitting a tiempo, la Ultralytics Platform ofrece herramientas integrales para la visualización y el análisis.






