Explorando el aprendizaje supervisado vs no supervisado en visión artificial
Aprende las diferencias entre el aprendizaje supervisado y no supervisado en visión artificial y cómo elegir el enfoque correcto para tus datos y objetivos de proyecto.
La inteligencia artificial (IA) se basa en el concepto fundamental de enseñar a las máquinas a aprender y razonar de formas que se asemejan a la inteligencia humana. Al igual que las personas aprenden mediante diferentes métodos, como la instrucción directa o la observación de patrones y experiencias, los sistemas de IA y aprendizaje automático están diseñados para seguir estos mismos enfoques.
Concretamente, cuando hablamos de algoritmos de aprendizaje automático, los sistemas se entrenan para aprender a partir de datos en lugar de ser programados explícitamente para cada tarea. En vez de depender de reglas fijas, los modelos de aprendizaje automático identifican patrones en los datos y los usan para realizar predicciones o tomar decisiones.
Por ejemplo, la visión artificial es una rama de la IA y el aprendizaje automático que se centra en permitir que los sistemas interpreten y comprendan la información visual, como imágenes y vídeos. Desde el reconocimiento de objetos hasta la identificación de patrones ocultos en grandes conjuntos de datos, estos sistemas dependen en gran medida de cómo han sido entrenados para aprender.
Se utilizan diversas técnicas de aprendizaje de IA para entrenar estos sistemas, dependiendo del tipo de datos disponibles y del problema que se quiera resolver.
Algunos modelos de visión artificial aprenden de datos etiquetados, donde cada entrada va acompañada de una respuesta correcta, lo que significa que cada imagen o punto de datos viene con una etiqueta predefinida que le indica al modelo lo que representa. Esto permite al modelo aprender la relación entre la entrada y la salida esperada, mejorando su capacidad para realizar predicciones precisas sobre datos nuevos y no vistos.
Otros modelos de visión aprenden de datos no etiquetados, donde no se proporcionan respuestas predefinidas, y se centran en identificar patrones y relaciones dentro de los propios datos. Estos enfoques se conocen, respectivamente, como aprendizaje supervisado y aprendizaje no supervisado, y constituyen la base de muchos sistemas de visión artificial de vanguardia.
En este artículo, exploraremos el aprendizaje supervisado y el no supervisado, cómo se utilizan en la visión artificial y cómo elegir el enfoque que mejor se adapte a tu proyecto de IA de visión. ¡Empecemos!
Link to this sectionCómo los enfoques de aprendizaje de IA impulsan la visión artificial#
Puedes considerar la inteligencia artificial como un paraguas que cubre una serie de tecnologías que permiten a las máquinas realizar tareas que normalmente requieren inteligencia humana. Dentro de este paraguas, el aprendizaje automático es un área clave que hace posible que los sistemas aprendan de los datos en lugar de depender únicamente de reglas fijas.
Dentro del aprendizaje automático, diferentes técnicas determinan cómo aprende y mejora un modelo con el tiempo. Enfoques como el aprendizaje supervisado (aprender de datos etiquetados con respuestas correctas), el aprendizaje no supervisado (identificar patrones en datos sin etiquetar), el aprendizaje por refuerzo (aprender mediante ensayo y error usando retroalimentación o recompensas) y el aprendizaje semisupervisado (que combina una pequeña cantidad de datos etiquetados con una gran cantidad de datos sin etiquetar) definen cómo los sistemas procesan los datos de entrada y generan datos de salida.

Fig 1. Una visión general de los métodos de aprendizaje de IA (Fuente)
En particular, los sistemas de visión artificial se construyen utilizando dichos enfoques de aprendizaje para interpretar y comprender los datos visuales. El aprendizaje supervisado es el método más utilizado, ya que permite a los modelos aprender a partir de ejemplos claramente etiquetados y producir resultados precisos y fiables.
Por ejemplo, un modelo puede entrenarse con imágenes etiquetadas como "gato" y "perro", aprendiendo características como la forma, las orejas y la estructura facial para poder clasificar correctamente nuevas imágenes mediante algoritmos de clasificación. Mientras tanto, el aprendizaje no supervisado y el semisupervisado también se utilizan en visión artificial, a menudo para explorar patrones en los datos o para mejorar el rendimiento cuando los datos etiquetados son limitados.
Link to this sectionUn vistazo al uso de modelos de aprendizaje supervisado en visión artificial#
Puedes comparar los algoritmos de aprendizaje supervisado con un entorno de aula, donde un profesor proporciona ejemplos junto con las respuestas correctas para que los alumnos aprendan qué es lo correcto y qué no. En el aprendizaje automático, los modelos aprenden de forma similar utilizando datos etiquetados, donde cada entrada se empareja con una salida conocida.
Supongamos que trabajas en la creación de un sistema de visión artificial que automatiza el análisis de partidos de béisbol. Podrías entrenar un modelo como Ultralytics YOLO26 con imágenes o fotogramas de vídeo en los que se etiqueten objetos como la pelota, el bate y los jugadores.
Cada objeto se marcaría con su ubicación y categoría, lo que permitiría al modelo aprender qué buscar. Con el tiempo, el modelo puede detectar y localizar estos objetos en nuevo material, lo que permite casos de uso como el seguimiento de la pelota y la detección de jugadores a través de los fotogramas.

Fig 2. Un ejemplo de detección de objetos habilitada por el aprendizaje supervisado (Fuente)
Más allá de la detección de objetos, el aprendizaje supervisado se utiliza ampliamente en una serie de tareas de visión artificial como la clasificación de imágenes, la segmentación de instancias y la estimación de poses, donde la precisión y la coherencia son importantes. En cada una de estas tareas, los modelos aprenden de datos etiquetados para identificar patrones específicos y realizar predicciones fiables sobre nuevas entradas.
Estos modelos suelen construirse mediante el aprendizaje profundo, un tipo de aprendizaje automático que utiliza redes neuronales para aprender patrones directamente de los datos. Las redes neuronales están diseñadas para procesar la información de una forma inspirada vagamente en cómo funciona el cerebro humano, lo que permite a los modelos aprender características visuales complejas a partir de grandes conjuntos de datos.
Los primeros enfoques de visión artificial a menudo se basaban en características diseñadas manualmente combinadas con algoritmos como las máquinas de vectores de soporte (las SVM son modelos que clasifican los datos encontrando el mejor límite entre categorías) o los árboles de decisión (modelos que toman decisiones dividiendo los datos en ramas).
Por el contrario, los modelos de visión artificial actuales utilizan el aprendizaje profundo para aprender automáticamente estas características a partir de los datos, lo que los hace más eficaces a la hora de manejar tareas visuales detalladas y a gran escala.
Link to this sectionComprender la necesidad de modelos de aprendizaje no supervisado en IA de visión#
Aunque el aprendizaje supervisado es el enfoque preferente en visión artificial, existen determinadas aplicaciones de visión donde los datos etiquetados no están disponibles o resultan demasiado caros y lentos de crear.
En estos casos, los algoritmos de aprendizaje no supervisado pueden ser una alternativa útil. Supongamos que tienes una gran colección de fotos no etiquetadas de una cámara de fauna salvaje.
No hay etiquetas que indiquen lo que contiene cada imagen, pero aun así quieres organizar o entender los datos. Un modelo no supervisado puede analizar estas imágenes y agrupar las similares, separando a los animales que se parecen en grupos, incluso sin conocer sus etiquetas exactas.
Link to this sectionCómo funciona el aprendizaje no supervisado en visión artificial#
Entonces, ¿cómo funciona el aprendizaje automático no supervisado? En lugar de aprender de respuestas correctas, el modelo aprende identificando patrones y estructuras dentro de los datos por sí mismo. Busca similitudes y diferencias en los datos sin depender de ejemplos etiquetados.
Un caso de uso común es la detección de anomalías, donde el modelo aprende cómo son los datos normales y luego identifica cualquier cosa que se desvíe de ellos. La detección de anomalías y valores atípicos es una de las aplicaciones industriales con mayor impacto. Algunos ejemplos son la detección de artículos defectuosos en una línea de fabricación, el marcado de escaneos médicos inusuales para su revisión por parte de un radiólogo o la detección de actividades sospechosas en grabaciones de vigilancia. Dado que los defectos y las anomalías suelen ser raros y variados, etiquetar todos los casos posibles no es práctico, lo que convierte a los enfoques no supervisados en una opción natural.
Para apoyarlo, a menudo se utilizan técnicas como la agrupación (clustering) y la reducción de dimensionalidad, normalmente sobre características extraídas de las imágenes en lugar de las imágenes en bruto. Los métodos de agrupación, como la agrupación k-means, agrupan imágenes similares basándose en patrones compartidos, mientras que las técnicas de reducción de dimensionalidad, como el análisis de componentes principales (PCA), simplifican los datos centrándose en las características más importantes.
Esto facilita al modelo la identificación de patrones y estructuras significativas dentro de conjuntos de datos grandes y complejos. La principal ventaja del aprendizaje no supervisado es que funciona bien con datos no etiquetados y puede revelar patrones que no son inmediatamente obvios. Sin embargo, es más difícil de evaluar y ofrece menos control sobre el resultado final en comparación con el aprendizaje supervisado.
Link to this sectionAprendizaje autosupervisado y semisupervisado en visión artificial#
A medida que explores el aprendizaje supervisado y el no supervisado, quizá te preguntes si existe un punto intermedio entre ambos. Curiosamente, el aprendizaje autosupervisado y el semisupervisado cierran la brecha entre el aprendizaje supervisado y el no supervisado.
Estos enfoques hacen posible que los modelos aprendan de datos no etiquetados de forma más eficaz. En lugar de depender únicamente de ejemplos etiquetados, crean sus propias tareas de aprendizaje a partir de los datos o combinan un pequeño conjunto de datos etiquetados con uno mayor sin etiquetar.
En el aprendizaje autosupervisado, el modelo aprende resolviendo tareas creadas a partir de los propios datos. Por ejemplo, se le puede dar una imagen a la que le falta una parte y aprender a predecir lo que debería rellenar ese espacio, o puede aprender a reconocer diferentes vistas del mismo objeto. Esto ayuda al modelo a aprender características útiles sin necesidad de etiquetas manuales.
Por otro lado, en el aprendizaje semisupervisado, se utiliza una pequeña cantidad de datos etiquetados junto con un conjunto mayor de datos no etiquetados para mejorar el rendimiento. En algunos casos, el modelo puede generar etiquetas para los datos no etiquetados y utilizarlas para seguir aprendiendo.
La ventaja clave de estos enfoques es que reducen la necesidad de grandes conjuntos de datos etiquetados, que a menudo son caros y lentos de crear. Sin embargo, pueden ser más complejos de diseñar y evaluar en comparación con los métodos totalmente supervisados.
Link to this sectionDiferencias clave entre el aprendizaje supervisado y el no supervisado#
La diferencia entre el aprendizaje supervisado y el no supervisado reside en cómo aprende un modelo y qué intenta conseguir. Mientras que el aprendizaje supervisado depende de datos etiquetados y de una orientación clara para aprender tareas específicas, el aprendizaje no supervisado trabaja sin respuestas predefinidas y se centra en descubrir patrones y estructuras dentro de los datos.
Por ejemplo, en un sistema de control de tráfico, un modelo de aprendizaje supervisado puede entrenarse con imágenes etiquetadas para detectar vehículos, peatones o señales de tráfico. Por el contrario, un modelo no supervisado podría analizar grandes cantidades de material de vídeo para agrupar patrones de tráfico similares o identificar eventos inusuales, como una congestión inesperada o un movimiento anormal, sin que se le indique explícitamente qué buscar.
Link to this sectionCuándo utilizar el aprendizaje supervisado en visión artificial#
El aprendizaje supervisado es una gran opción para tareas de visión artificial en las que el objetivo está claramente definido y el modelo necesita asignar datos de entrada a salidas precisas. Funciona especialmente bien cuando dispones de un conjunto de datos etiquetado fiable y necesitas resultados coherentes y predecibles.

Fig 3. Tareas de visión artificial impulsadas por el aprendizaje supervisado (Fuente)
Se utiliza habitualmente para problemas en los que el modelo debe distinguir entre categorías conocidas o predecir resultados específicos. En lugar de explorar patrones, el objetivo es aprender relaciones precisas a partir de datos etiquetados, lo que facilita guiar al modelo hacia un resultado deseado.
Otra ventaja clave es el control. Con el aprendizaje supervisado, es más fácil medir el rendimiento utilizando métricas claras, ajustar el modelo y garantizar un comportamiento estable durante el despliegue. Esto lo hace perfecto para sistemas que requieren coherencia y fiabilidad a lo largo del tiempo.
Sin embargo, esto conlleva un inconveniente. El modelo depende en gran medida de la calidad y la escala de los datos etiquetados, y la recopilación y anotación de dichos datos puede llevar mucho tiempo.
Link to this sectionEjemplos reales de visión artificial supervisada#
Los modelos de IA de visión como los modelos YOLO de Ultralytics utilizan el aprendizaje supervisado para realizar tareas como la detección de objetos con gran precisión, especialmente en aplicaciones en tiempo real. Aquí tienes algunos casos de uso comunes de visión en el mundo real donde el aprendizaje supervisado marca la diferencia:
- Atención sanitaria e imagen médica: Los médicos pueden utilizar sistemas de visión artificial entrenados con escaneos etiquetados, como radiografías o resonancias magnéticas, donde se utilizan clasificadores para identificar afecciones como tumores o fracturas, lo que ayuda a realizar diagnósticos más rápidos y precisos.
- Inspección de calidad industrial: En entornos de fabricación, los sistemas de visión entrenados con datos etiquetados pueden inspeccionar productos analizando una serie de características relacionadas con la calidad, como la forma, los defectos superficiales, la textura y el tamaño. Al aprender de ejemplos de productos tanto aceptables como defectuosos, estos sistemas pueden identificar fallos de forma coherente y mantener los estándares de producción.
- Conducción autónoma: Los sistemas de conducción autónoma dependen de modelos entrenados con datos de conducción etiquetados para reconocer carriles, vehículos, peatones y señales de tráfico, lo que ayuda a los vehículos a navegar con seguridad en tiempo real.
- Sistemas de venta al por menor y pago: Las tiendas utilizan modelos entrenados con imágenes de productos etiquetadas para identificar artículos en los estantes o en la caja, lo que permite la facturación automatizada y una gestión de inventario más eficiente. Estos sistemas también pueden admitir tareas como la segmentación de clientes cuando se combinan con datos adicionales, lo que ayuda a las empresas a comprender mejor los patrones de compra.
- Agricultura y monitorización de cultivos: Los agricultores pueden utilizar modelos entrenados con imágenes etiquetadas para detectar y clasificar cultivos, como identificar y contar patatas sanas y dañadas, mejorando el control de calidad y reduciendo las pérdidas.

Fig 4. Uso de YOLO para detectar y contar patatas sanas y defectuosas
Link to this sectionQué tipos de problemas puede resolver el aprendizaje no supervisado en visión artificial#
El aprendizaje no supervisado es útil cuando no tienes suficientes datos etiquetados o cuando tus datos no vienen con respuestas claras. En estas situaciones, el objetivo no es realizar predicciones exactas, sino comprender los patrones y la estructura de los datos.
A menudo se utiliza cuando se explora un conjunto de datos no etiquetado por primera vez. En lugar de decirle al modelo qué debe buscar, le permites identificar similitudes, agrupar imágenes relacionadas o resaltar patrones inusuales por sí mismo.
En una gran colección de imágenes, un enfoque no supervisado puede ayudar a organizar imágenes similares o marcar valores atípicos que puedan requerir una atención mayor. Esto lo convierte en un punto de partida útil en los proyectos de ciencia de datos.
Los modelos generativos, incluidos los GAN, los autocodificadores variacionales y los modelos de difusión, aprenden la distribución subyacente de las imágenes para crear otras completamente nuevas. Estos modelos impulsan aplicaciones como la síntesis de imágenes, la restauración (inpainting), la superresolución y la transferencia de estilo, y forman la base de los sistemas de IA generativa actuales.
En la segmentación no supervisada, algunos métodos agrupan píxeles o regiones en segmentos coherentes sin depender de máscaras etiquetadas, lo que es útil cuando la anotación es demasiado costosa o cuando el objetivo es descubrir estructuras en lugar de coincidir con categorías predefinidas.
El aprendizaje no supervisado también tiene impacto cuando se trabaja con grandes conjuntos de datos donde el etiquetado consume mucho tiempo o no resulta práctico. En tales casos, te permite obtener información a partir de los datos sin depender de datos de entrenamiento etiquetados.
También se utiliza habitualmente en áreas como la IA generativa (modelos que crean nuevos datos como imágenes, texto o audio) y el aprendizaje de representación (modelos que aprenden características o patrones útiles a partir de datos brutos), donde los modelos aprenden características generales a partir de grandes cantidades de datos. En general, si tu problema implica exploración, descubrimiento de patrones o trabajar con datos no etiquetados, el aprendizaje no supervisado es un enfoque flexible y práctico a tener en cuenta.
Link to this sectionEjemplos reales de aprendizaje no supervisado en visión artificial#
Aquí tienes algunos ejemplos de casos de uso donde se aplica el aprendizaje no supervisado en visión artificial:
- Detección de anomalías en la fabricación: Los modelos pueden aprender cómo son los productos normales y pueden marcar defectos o irregularidades sin necesidad de ejemplos etiquetados de cada posible defecto.
- Organización y búsqueda de imágenes: Las grandes colecciones de imágenes, como las bibliotecas de fotos o los catálogos de comercio electrónico, pueden agruparse automáticamente basándose en la similitud visual, lo que facilita a los científicos de datos organizar, explorar y buscar en grandes conjuntos de datos.
- Vigilancia y seguridad: Los sistemas pueden analizar grabaciones de vídeo para identificar patrones o comportamientos inusuales, como movimientos inesperados o cambios en la multitud, sin haber sido entrenados explícitamente con eventos etiquetados.
- Preprocesamiento y exploración de datos: Los métodos no supervisados se utilizan a menudo para explorar y estructurar datos de imagen brutos antes de entrenar modelos supervisados, lo que ayuda a mejorar la calidad de los datos y reducir el esfuerzo manual.
Link to this sectionLimitaciones prácticas del aprendizaje supervisado y no supervisado#
A pesar de las ventajas de ambos enfoques de aprendizaje, existen ciertas limitaciones a tener en cuenta. Aquí tienes algunos factores prácticos que debes tener presentes al crear modelos de visión artificial:
- Sobreajuste (overfitting) en modelos supervisados: En el aprendizaje supervisado, un modelo puede aprender los datos de entrenamiento demasiado de cerca en lugar de aprender patrones generales. Esto suele ocurrir cuando el conjunto de datos es pequeño o no es lo suficientemente diverso. Por ejemplo, un modelo entrenado para detectar defectos en un tipo de producto puede fallar cuando se prueba con nuevos datos que consisten en productos o condiciones de iluminación ligeramente diferentes.
- Desafíos con los algoritmos de agrupación: En el aprendizaje no supervisado, un modelo puede agrupar puntos de datos similares. Sin embargo, esto puede fallar cuando los datos son ruidosos, incoherentes o carecen de una estructura clara. Por ejemplo, en tareas de agrupación de imágenes, las imágenes con colores similares pero objetos diferentes podrían agruparse incorrectamente.
- Importancia de un preprocesamiento adecuado: Antes del entrenamiento, los datos deben limpiarse y prepararse. Esto se hace habitualmente utilizando bibliotecas de Python que gestionan el procesamiento de imágenes y la transformación de datos. Es especialmente importante en visión artificial, donde las imágenes pueden variar en tamaño, calidad o iluminación. Sin un preprocesamiento adecuado, los modelos pueden aprender del ruido en lugar de patrones significativos, lo que conduce a un rendimiento deficiente.
Link to this sectionConclusiones clave#
En la visión artificial, tanto el aprendizaje supervisado como el no supervisado desempeñan papeles importantes. El enfoque adecuado depende del tipo de datos que tengas, de si están etiquetados o no, así como del problema que intentes resolver y de tus necesidades de despliegue.
Si tu objetivo es una alta precisión y resultados claramente definidos, el aprendizaje automático supervisado suele ser la mejor elección. Si estás explorando datos o trabajando sin etiquetas, el aprendizaje no supervisado puede ser más adecuado.
¿Quieres saber más sobre IA? Consulta nuestra comunidad y nuestro repositorio de GitHub. Explora nuestras páginas de soluciones para aprender sobre IA en robótica y visión artificial en agricultura. ¡Descubre nuestras opciones de licencia y empieza hoy mismo a construir con visión artificial!






