¿Qué es el sobreajuste en visión artificial y cómo prevenirlo?
Aprende qué es el sobreajuste (overfitting) en visión artificial y cómo prevenirlo mediante aumento de datos, regularización y modelos preentrenados.

Los modelos de visión artificial están diseñados para reconocer patrones, detectar objetos y analizar imágenes. Sin embargo, su rendimiento depende de qué tan bien logren generalizar ante datos no vistos. La generalización es la capacidad de un modelo para funcionar bien con imágenes nuevas, no solo con aquellas con las que fue entrenado. Un problema común al entrenar estos modelos es el sobreajuste, en el cual el modelo aprende demasiado de sus datos de entrenamiento, incluyendo ruido innecesario, en lugar de identificar patrones significativos.
Cuando esto ocurre, el modelo funciona bien con los datos de entrenamiento pero tiene dificultades con imágenes nuevas. Por ejemplo, un modelo de detección de objetos entrenado solo con imágenes de alta resolución y bien iluminadas puede fallar si se le presentan imágenes borrosas o con sombras en condiciones del mundo real. El sobreajuste limita la capacidad de adaptación de un modelo, restringiendo su uso en aplicaciones del mundo real como la conducción autónoma, la imagenología médica y los sistemas de seguridad.
En este artículo, exploraremos qué es el sobreajuste, por qué sucede y cómo evitarlo. También analizaremos cómo los modelos de visión artificial como Ultralytics YOLO11 ayudan a reducir el sobreajuste y mejorar la generalización.
Link to this section¿Qué es el sobreajuste?#
El sobreajuste ocurre cuando un modelo memoriza los datos de entrenamiento en lugar de aprender patrones que se apliquen de manera general a nuevas entradas. El modelo se centra demasiado en los datos de entrenamiento, por lo que tiene problemas con imágenes nuevas o situaciones que no ha visto antes.
En visión artificial, el sobreajuste puede afectar a distintas tareas. Un modelo de clasificación entrenado solo con imágenes brillantes y claras puede tener dificultades en condiciones de baja iluminación. Un modelo de detección de objetos que aprenda de imágenes perfectas podría fallar en escenas concurridas o desordenadas. De igual modo, un modelo de segmentación de instancias puede funcionar bien en entornos controlados, pero tener problemas con sombras u objetos superpuestos.
Esto se convierte en un problema en las aplicaciones de IA del mundo real, donde los modelos deben ser capaces de generalizar más allá de las condiciones de entrenamiento controladas. Los coches autónomos, por ejemplo, deben ser capaces de detectar peatones en diferentes condiciones de luz, clima y entornos. Un modelo que sufre sobreajuste en su conjunto de entrenamiento no funcionará de forma fiable en escenarios tan impredecibles.
Link to this section¿Cuándo y por qué ocurre el sobreajuste?#
El sobreajuste ocurre normalmente debido a conjuntos de datos desequilibrados, una complejidad excesiva del modelo y un entrenamiento prolongado. Estas son las causas principales:
- Datos de entrenamiento limitados: Los conjuntos de datos pequeños hacen que los modelos memoricen patrones en lugar de generalizarlos. Un modelo entrenado solo con 50 imágenes de pájaros puede tener dificultades para detectar especies de pájaros fuera de ese conjunto de datos.
- Modelos complejos con demasiados parámetros: Las redes profundas con excesivas capas y neuronas tienden a memorizar detalles precisos en lugar de centrarse en las características esenciales.
- Falta de aumento de datos: Sin transformaciones como recortar, voltear o rotar, un modelo puede aprender solo a partir de sus imágenes de entrenamiento exactas.
- Entrenamiento prolongado: Si un modelo pasa por los datos de entrenamiento demasiadas veces, lo que se conoce como épocas, memoriza detalles en lugar de aprender patrones generales, volviéndose menos adaptable.
- Etiquetas inconsistentes o ruidosas: Los datos etiquetados de forma incorrecta hacen que el modelo aprenda patrones erróneos. Esto es común en conjuntos de datos etiquetados manualmente.
Un enfoque bien equilibrado respecto a la complejidad del modelo, la calidad del conjunto de datos y las técnicas de entrenamiento garantiza una mejor generalización.
Link to this sectionSobreajuste frente a subajuste#
El sobreajuste y el subajuste son dos problemas totalmente opuestos en el aprendizaje profundo.

Fig 1. Comparación del subajuste, aprendizaje óptimo y sobreajuste en modelos de visión artificial.
El sobreajuste sucede cuando un modelo es demasiado complejo, lo que lo hace centrarse excesivamente en los datos de entrenamiento. En lugar de aprender patrones generales, memoriza pequeños detalles, incluso aquellos irrelevantes como el ruido de fondo. Esto provoca que el modelo funcione bien con los datos de entrenamiento pero tenga problemas con imágenes nuevas, lo que significa que no ha aprendido realmente a reconocer patrones aplicables en diferentes situaciones.
El subajuste sucede cuando un modelo es demasiado básico, por lo que pasa por alto patrones importantes en los datos. Esto puede ocurrir cuando el modelo tiene muy pocas capas, poco tiempo de entrenamiento o los datos son limitados. Como resultado, no logra reconocer patrones importantes y realiza predicciones inexactas. Esto conduce a un rendimiento deficiente tanto en los datos de entrenamiento como en los de prueba, porque el modelo no ha aprendido lo suficiente para comprender la tarea adecuadamente.
Un modelo bien entrenado encuentra el equilibrio entre complejidad y generalización. Debe ser lo suficientemente complejo para aprender patrones relevantes, pero no tanto como para memorizar datos en lugar de reconocer las relaciones subyacentes.
Link to this sectionCómo identificar el sobreajuste#
Aquí tienes algunas señales que indican que un modelo está sufriendo sobreajuste:
- Si la precisión de entrenamiento es significativamente mayor que la precisión de validación, es probable que el modelo esté sufriendo sobreajuste.
- Una brecha cada vez mayor entre la pérdida de entrenamiento y la pérdida de validación es otro indicador clave.
- El modelo tiene demasiada confianza en respuestas incorrectas, lo que demuestra que ha memorizado detalles en lugar de entender patrones.
Para asegurar que un modelo generalice bien, debe probarse en diversos conjuntos de datos que reflejen condiciones del mundo real.
Link to this sectionCómo evitar el sobreajuste en visión artificial#
El sobreajuste no es inevitable y puede evitarse. Con las técnicas adecuadas, los modelos de visión artificial pueden aprender patrones generales en lugar de memorizar los datos de entrenamiento, haciéndolos más fiables en aplicaciones del mundo real.
Aquí tienes cinco estrategias clave para evitar el sobreajuste en visión artificial.
Link to this sectionAumenta la diversidad de datos con aumentación y datos sintéticos#
La mejor manera de ayudar a que un modelo funcione bien con datos nuevos es ampliar el conjunto de datos mediante la aumentación de datos y datos sintéticos. Los datos sintéticos son generados por ordenador en lugar de ser recopilados de imágenes del mundo real. Ayudan a cubrir carencias cuando no hay suficientes datos reales.

Fig 2. La combinación de datos reales y sintéticos reduce el sobreajuste y mejora la precisión de la detección de objetos.
La aumentación de datos altera ligeramente las imágenes existentes mediante volteos, rotaciones, recortes o ajustes de brillo, para que el modelo no solo memorice detalles, sino que aprenda a reconocer objetos en diferentes situaciones.
Los datos sintéticos son útiles cuando es difícil conseguir imágenes reales. Por ejemplo, los modelos de coches autónomos pueden entrenarse en escenas de carretera generadas por ordenador para aprender a detectar objetos en diferentes condiciones climáticas y de iluminación. Esto hace que el modelo sea más flexible y fiable sin necesidad de miles de imágenes del mundo real.
Link to this sectionOptimiza la complejidad y la arquitectura del modelo#
Una red neuronal profunda, que es un tipo de modelo de aprendizaje automático con muchas capas que procesan datos en lugar de una sola capa, no siempre es mejor. Cuando un modelo tiene demasiadas capas o parámetros, memoriza los datos de entrenamiento en lugar de reconocer patrones más amplios. Reducir la complejidad innecesaria puede ayudar a evitar el sobreajuste.
Para lograr esto, un enfoque es la poda, que elimina neuronas y conexiones redundantes, haciendo que el modelo sea más ligero y eficiente.
Otro es simplificar la arquitectura reduciendo el número de capas o neuronas. Los modelos pre-entrenados como YOLO11 están diseñados para generalizar bien en distintas tareas con menos parámetros, lo que los hace más resistentes al sobreajuste que entrenar un modelo profundo desde cero.
Encontrar el equilibrio adecuado entre la profundidad del modelo y la eficiencia le ayuda a aprender patrones útiles sin limitarse a memorizar los datos de entrenamiento.
Link to this sectionAplica técnicas de regularización#
Las técnicas de regularización evitan que los modelos se vuelvan demasiado dependientes de características específicas en los datos de entrenamiento. Aquí tienes algunas técnicas utilizadas habitualmente:
- Dropout desactiva partes aleatorias del modelo durante el entrenamiento para que aprenda a reconocer diferentes patrones en lugar de depender demasiado de unas pocas características.
- Decaimiento de peso (regularización L2) desaconseja valores de peso extremos, manteniendo bajo control la complejidad del modelo.
- Normalización por lotes (Batch normalization) ayuda a estabilizar el entrenamiento asegurando que el modelo sea menos sensible a variaciones en el conjunto de datos.
Estas técnicas ayudan a mantener la flexibilidad y adaptabilidad del modelo, reduciendo el riesgo de sobreajuste mientras se preserva la precisión.
Link to this sectionSupervisa el entrenamiento con validación y parada temprana#
Para evitar el sobreajuste, es importante hacer un seguimiento de cómo aprende el modelo y asegurar que generaliza bien con datos nuevos. Aquí tienes un par de técnicas para ayudar con esto:
- Parada temprana: Termina automáticamente el entrenamiento cuando el modelo deja de mejorar, para que no siga aprendiendo detalles innecesarios.
- Validación cruzada: Divide los datos en partes y entrena el modelo en cada una. Esto le ayuda a aprender patrones en lugar de memorizar imágenes específicas.
Estas técnicas ayudan al modelo a mantenerse equilibrado para que aprenda lo suficiente para ser preciso sin centrarse demasiado solo en los datos de entrenamiento.
Link to this sectionUtiliza modelos pre-entrenados y mejora el etiquetado del conjunto de datos#
En lugar de entrenar desde cero, utilizar modelos pre-entrenados como YOLO11 puede reducir el sobreajuste. YOLO11 está entrenado con conjuntos de datos a gran escala, lo que le permite generalizar bien en diferentes condiciones.

Fig 3. Los modelos de visión artificial pre-entrenados mejoran la precisión y evitan el sobreajuste.
Ajustar (fine-tuning) un modelo pre-entrenado le ayuda a conservar lo que ya sabe mientras aprende nuevas tareas, por lo que no simplemente memoriza los datos de entrenamiento.
Además, es esencial asegurar una alta calidad en el etiquetado del conjunto de datos. Los datos mal etiquetados o desequilibrados pueden inducir a los modelos a aprender patrones incorrectos. Limpiar los conjuntos de datos, corregir imágenes mal etiquetadas y equilibrar las clases mejora la precisión y reduce el riesgo de sobreajuste. Otro enfoque eficaz es el entrenamiento adversarial, donde el modelo se expone a ejemplos ligeramente alterados o más desafiantes diseñados para probar sus límites.
Link to this sectionConclusiones clave#
El sobreajuste es un problema común en la visión artificial. Un modelo puede funcionar bien con los datos de entrenamiento pero tener dificultades con imágenes del mundo real. Para evitar esto, técnicas como la aumentación de datos, la regularización y el uso de modelos pre-entrenados como YOLO11 ayudan a mejorar la precisión y la adaptabilidad.
Al aplicar estos métodos, los modelos de IA pueden seguir siendo fiables y funcionar bien en diferentes entornos. A medida que el aprendizaje profundo mejora, asegurarse de que los modelos generalicen correctamente será la clave para el éxito de la IA en el mundo real.
¡Únete a nuestra creciente comunidad! Explora nuestro repositorio de GitHub para aprender más sobre IA. ¿Estás listo para comenzar tus propios proyectos de visión artificial? Consulta nuestras opciones de licencia. ¡Descubre la IA de visión en la conducción autónoma y la IA en la atención sanitaria visitando nuestras páginas de soluciones!






