Yolo Vision Shenzhen
Shenzhen
Únete ahora

Análisis comparativo entre el aprendizaje supervisado y el no supervisado en la visión artificial

Descubre las diferencias entre el aprendizaje supervisado y el no supervisado en la visión artificial, y cómo elegir el enfoque más adecuado para tus datos y los objetivos de tu proyecto.

Amplíe sus proyectos de visión artificial con Ultralytics.

Comience ahora

La inteligencia artificial (IA) se basa en el concepto fundamental de enseñar a las máquinas a aprender y a razonar de formas que se asemejan a la inteligencia humana. Al igual que las personas aprenden mediante diferentes métodos, como la enseñanza directa o la observación de patrones y experiencias, los sistemas de IA y de aprendizaje automático están diseñados para seguir estos mismos enfoques.

En concreto, en lo que respecta a los algoritmos de aprendizaje automático, los sistemas se entrenan para aprender a partir de los datos, en lugar de programarse explícitamente para cada tarea. En lugar de basarse en reglas fijas, los modelos de aprendizaje automático identifican patrones en los datos y los utilizan para realizar predicciones o tomar decisiones.

Por ejemplo, la visión artificial es una rama de la inteligencia artificial y el aprendizaje automático que se centra en capacitar a los sistemas para interpretar y comprender la información visual, como imágenes y vídeos. Desde el reconocimiento de objetos hasta la identificación de patrones ocultos en grandes conjuntos de datos, estos sistemas dependen en gran medida de cómo se les entrena para aprender.

Para entrenar estos sistemas se utilizan diversas técnicas de aprendizaje de la inteligencia artificial, en función del tipo de datos disponibles y del problema que se pretenda resolver. 

Algunos modelos de visión artificial aprenden a partir de datos etiquetados, en los que cada entrada se asocia a una respuesta correcta, lo que significa que cada imagen o punto de datos viene acompañado de una etiqueta predefinida que indica al modelo lo que representa. Esto permite al modelo aprender la relación entre la entrada y el resultado esperado, mejorando así su capacidad para realizar predicciones precisas sobre datos nuevos y desconocidos.

Otros modelos de visión artificial aprenden a partir de datos sin etiquetar, en los que no se proporcionan respuestas predefinidas, y se centran, en cambio, en identificar patrones y relaciones dentro de los propios datos. Estos enfoques se conocen, respectivamente, como aprendizaje supervisado y aprendizaje no supervisado, y constituyen la base de muchos sistemas de visión artificial de vanguardia.

En este artículo, analizaremos el aprendizaje supervisado y no supervisado, cómo se utilizan en la visión artificial y cómo elegir el enfoque que mejor se adapte a tu proyecto de IA aplicada a la visión. ¡Empecemos!

Cómo los enfoques de aprendizaje de la IA impulsan la visión artificial

Podemos pensar en la inteligencia artificial como un paraguas que abarca una serie de tecnologías que permiten a las máquinas realizar tareas que normalmente requieren inteligencia humana. Dentro de este paraguas, el aprendizaje automático es un ámbito clave que permite a los sistemas aprender a partir de los datos, en lugar de basarse únicamente en reglas fijas.

En el ámbito del aprendizaje automático, las diferentes técnicas de aprendizaje determinan cómo un modelo aprende y mejora con el tiempo. Enfoques como el aprendizaje supervisado (aprender a partir de datos etiquetados con respuestas correctas), el aprendizaje no supervisado (identificar patrones en datos no etiquetados), el aprendizaje por refuerzo (aprender mediante ensayo y error utilizando retroalimentación o recompensas) y el aprendizaje semisupervisado (combinar una pequeña cantidad de datos etiquetados con una gran cantidad de datos no etiquetados) definen cómo los sistemas procesan los datos de entrada y generan datos de salida.

Fig. 1. Resumen de los métodos de aprendizaje de la IA (Fuente)

En concreto, los sistemas de visión artificial se desarrollan utilizando estos enfoques de aprendizaje para interpretar y comprender los datos visuales. El aprendizaje supervisado es el método más utilizado, ya que permite a los modelos aprender a partir de ejemplos claramente etiquetados y generar resultados precisos y fiables. 

Por ejemplo, se puede entrenar un modelo con imágenes etiquetadas como «gato» y «perro», de modo que aprenda características como la forma, las orejas y la estructura facial para poder classify correctamente classify imágenes mediante algoritmos de clasificación. Por otra parte, el aprendizaje no supervisado y el aprendizaje semisupervisado también se utilizan en la visión artificial, a menudo para explorar patrones en los datos o para mejorar el rendimiento cuando los datos etiquetados son limitados.

Una introducción al uso de modelos de aprendizaje supervisado en la visión artificial

Los algoritmos de aprendizaje supervisado pueden compararse con una clase, en la que el profesor ofrece ejemplos junto con las respuestas correctas para que los alumnos aprendan qué está bien y qué está mal. En el aprendizaje automático, los modelos aprenden de forma similar utilizando datos etiquetados, en los que cada entrada se empareja con una salida conocida.

Imaginemos que estás trabajando en el desarrollo de un sistema de visión artificial que automatiza el análisis de partidos de béisbol. Podrías entrenar un modelo como Ultralytics con imágenes o fotogramas de vídeo en los que estén etiquetados objetos como la pelota, el bate y los jugadores. 

Cada objeto se marcaría con su ubicación y categoría, lo que permitiría al modelo aprender qué debe buscar. Con el tiempo, el modelo podrá detect localizar estos objetos en nuevas grabaciones, lo que facilitará aplicaciones como el seguimiento del balón y la detección de jugadores entre fotogramas.

Fig. 2. Ejemplo de detección de objetos mediante aprendizaje supervisado (Fuente)

Más allá de la detección de objetos, el aprendizaje supervisado se utiliza ampliamente en una amplia gama de tareas de visión artificial, como la clasificación de imágenes, la segmentación de instancias y la estimación de poses, en las que la precisión y la coherencia son fundamentales. En cada una de estas tareas, los modelos aprenden a partir de datos etiquetados para identificar patrones específicos y realizar predicciones fiables sobre nuevas entradas.

Estos modelos suelen crearse mediante el aprendizaje profundo, un tipo de aprendizaje automático que utiliza redes neuronales para aprender patrones directamente a partir de los datos. Las redes neuronales están diseñadas para procesar la información de una forma que se inspira, en líneas generales, en el funcionamiento del cerebro humano, lo que permite a los modelos aprender características visuales complejas a partir de grandes conjuntos de datos.

Los primeros enfoques de visión artificial solían basarse en características diseñadas manualmente, combinadas con algoritmos como las máquinas de vectores de soporte (las SVM son modelos que classify buscando el mejor límite entre categorías) o los árboles de decisión (modelos que toman decisiones dividiendo los datos en ramas). 

Por el contrario, los modelos de visión artificial actuales utilizan el aprendizaje profundo para extraer automáticamente estas características de los datos, lo que los hace más eficaces a la hora de gestionar tareas visuales a gran escala y con gran nivel de detalle.

Comprender la necesidad de modelos de aprendizaje no supervisado en la IA aplicada a la visión

Aunque el aprendizaje supervisado es el método más habitual en la visión artificial, hay ciertas aplicaciones de visión en las que no se dispone de datos etiquetados o cuya creación resulta demasiado costosa y requiere demasiado tiempo. 

En estos casos, los algoritmos de aprendizaje no supervisado pueden ser una alternativa útil. Supongamos que tienes una gran colección de fotos sin etiquetar tomadas con una cámara de vigilancia de la fauna silvestre. 

No hay etiquetas que indiquen qué contiene cada imagen, pero aun así quieres organizar o comprender los datos. Un modelo no supervisado puede analizar estas imágenes y agrupar las similares, separando en clústeres a los animales que se parecen entre sí, incluso sin conocer sus etiquetas exactas.

Cómo funciona el aprendizaje no supervisado en la visión artificial

Entonces, ¿cómo funciona el aprendizaje automático no supervisado? En lugar de aprender a partir de respuestas correctas, el modelo aprende identificando por sí mismo patrones y estructuras dentro de los datos. Busca similitudes y diferencias en los datos sin basarse en ejemplos etiquetados.

Un caso de uso habitual es la detección de anomalías, en la que el modelo aprende cómo son los datos normales y, a continuación, identifica cualquier elemento que se desvíe de ellos. La detección de anomalías y valores atípicos es una de las aplicaciones industriales de mayor impacto. Algunos ejemplos son la identificación de artículos defectuosos en una línea de fabricación, el marcado de exploraciones médicas inusuales para su revisión por parte de un radiólogo o la detección de actividades sospechosas en grabaciones de vigilancia. Dado que los defectos y las anomalías suelen ser poco frecuentes y variados, etiquetar todos los casos posibles resulta poco práctico, lo que hace que los enfoques no supervisados sean la opción más adecuada.

Para ello, se suelen emplear técnicas como la agrupación en clústeres y la reducción de dimensionalidad, normalmente aplicadas a las características extraídas de las imágenes, más que a las propias imágenes sin procesar. Los métodos de agrupación en clústeres, como el de k-means, agrupan imágenes similares basándose en patrones comunes, mientras que las técnicas de reducción de dimensionalidad, como el análisis de componentes principales (ACP), simplifican los datos centrándose en las características más importantes. 

Esto facilita que el modelo identifique patrones y estructuras significativas dentro de conjuntos de datos grandes y complejos. La principal ventaja del aprendizaje no supervisado es que funciona bien con datos sin etiquetar y puede revelar patrones que no son evidentes a primera vista. Sin embargo, es más difícil de evaluar y ofrece menos control sobre el resultado final en comparación con el aprendizaje supervisado.

Aprendizaje autosupervisado y semisupervisado en visión artificial

A medida que te adentras en el aprendizaje supervisado y no supervisado, quizá te preguntes si existe un término medio entre ambos. Curiosamente, el aprendizaje autosupervisado y el semisupervisado sirven de puente entre el aprendizaje supervisado y el no supervisado.

Estos enfoques permiten que los modelos aprendan de datos sin etiquetar de forma más eficaz. En lugar de basarse únicamente en ejemplos etiquetados, crean sus propias tareas de aprendizaje a partir de los datos o combinan un pequeño conjunto de datos etiquetados con otro más grande sin etiquetar.

En el aprendizaje autosupervisado, el modelo aprende resolviendo tareas generadas a partir de los propios datos. Por ejemplo, se le puede proporcionar una imagen a la que le falta una parte y aprender a predecir qué debería ocupar ese espacio, o puede aprender a reconocer diferentes perspectivas del mismo objeto. Esto ayuda al modelo a aprender características útiles sin necesidad de etiquetas manuales.

Por otro lado, en el aprendizaje semisupervisado se utiliza una pequeña cantidad de datos etiquetados junto con un conjunto más amplio de datos sin etiquetar para mejorar el rendimiento. En algunos casos, el modelo puede generar etiquetas para los datos sin etiquetar y utilizarlas para seguir aprendiendo.

La principal ventaja de estos enfoques es que reducen la necesidad de disponer de grandes conjuntos de datos etiquetados, cuya creación suele resultar costosa y llevar mucho tiempo. Sin embargo, su diseño y evaluación pueden resultar más complejos en comparación con los métodos totalmente supervisados.

Diferencias clave entre el aprendizaje supervisado y el no supervisado

La diferencia entre el aprendizaje supervisado y el no supervisado radica en cómo aprende un modelo y qué es lo que pretende lograr. Mientras que el aprendizaje supervisado se basa en datos etiquetados y en una orientación clara para aprender tareas específicas, el aprendizaje no supervisado funciona sin respuestas predefinidas y se centra en descubrir patrones y estructuras dentro de los datos.

Por ejemplo, en un sistema de control del tráfico, un modelo de aprendizaje supervisado puede entrenarse con imágenes etiquetadas para detect , peatones o semáforos. Por el contrario, un modelo no supervisado podría analizar grandes cantidades de material de vídeo para agrupar patrones de tráfico similares o identificar sucesos inusuales, como atascos inesperados o movimientos anómalos, sin que se le indique explícitamente qué debe buscar.

Cuándo utilizar el aprendizaje supervisado en la visión artificial

El aprendizaje supervisado es una excelente opción para tareas de visión artificial en las que el objetivo está claramente definido y el modelo debe asignar datos de entrada a resultados precisos. Funciona especialmente bien cuando se dispone de un conjunto de datos etiquetados fiable y se necesitan resultados coherentes y predecibles.

Fig. 3. Tareas de visión artificial basadas en el aprendizaje supervisado (Fuente)

Se utiliza habitualmente para problemas en los que el modelo debe distinguir entre categorías conocidas o predecir resultados específicos. En lugar de explorar patrones, se centra en aprender relaciones precisas a partir de datos etiquetados, lo que facilita orientar al modelo hacia el resultado deseado.

Otra ventaja clave es el control. Con el aprendizaje supervisado, resulta más fácil medir el rendimiento mediante métricas claras, ajustar el modelo y garantizar un comportamiento estable durante la implementación. Esto lo hace ideal para sistemas que requieren consistencia y fiabilidad a lo largo del tiempo.

Sin embargo, esto tiene sus inconvenientes. El modelo depende en gran medida de la calidad y la cantidad de los datos etiquetados, y la recopilación y anotación de dichos datos puede llevar mucho tiempo.

Ejemplos prácticos de visión artificial supervisada

Los modelos de visión artificial, como YOLO Ultralytics , utilizan el aprendizaje supervisado para realizar tareas como la detección de objetos con gran precisión, especialmente en aplicaciones en tiempo real. A continuación se presentan algunos casos de uso habituales de la visión artificial en el mundo real en los que el aprendizaje supervisado marca la diferencia:

  • Sanidad e imagen médica: Los médicos pueden utilizar sistemas de visión artificial entrenados con imágenes etiquetadas, como radiografías o resonancias magnéticas, en los que se emplean clasificadores para identificar afecciones como tumores o fracturas, lo que permite realizar diagnósticos más rápidos y precisos.
  • Inspección de calidad industrial: En entornos de fabricación, los sistemas de visión entrenados con datos etiquetados pueden inspeccionar productos mediante el análisis de una serie de características relacionadas con la calidad, como la forma, los defectos superficiales, la textura y el tamaño. Al aprender a partir de ejemplos tanto de productos aceptables como defectuosos, estos sistemas pueden identificar fallos de forma sistemática y mantener los estándares de producción.
  • Conducción autónoma: los sistemas de conducción autónoma se basan en modelos entrenados con datos de conducción etiquetados para reconocer carriles, vehículos, peatones y señales de tráfico, lo que ayuda a los vehículos a circular con seguridad en tiempo real.
  • Sistemas de venta al por menor y de caja: Las tiendas utilizan modelos entrenados con imágenes de productos etiquetadas para identificar los artículos en las estanterías o en la caja, lo que permite la facturación automática y una gestión más eficiente del inventario. Estos sistemas también pueden facilitar tareas como la segmentación de clientes cuando se combinan con datos adicionales, lo que ayuda a las empresas a comprender mejor los patrones de compra.
  • Agricultura y seguimiento de cultivos: los agricultores pueden utilizar modelos entrenados con imágenes etiquetadas para detect classify , por ejemplo, identificando y contando patatas sanas y dañadas, mejorando el control de calidad y reduciendo las pérdidas.
Fig. 4. Uso de YOLO detect contar patatas sanas y defectuosas

¿Qué tipo de problemas en el campo de la visión artificial puede resolver el aprendizaje no supervisado?

El aprendizaje no supervisado resulta útil cuando no se dispone de suficientes datos etiquetados o cuando los datos no incluyen respuestas claras. En estas situaciones, el objetivo no es realizar predicciones exactas, sino comprender los patrones y la estructura de los datos.

Se suele utilizar cuando se analiza por primera vez un conjunto de datos sin etiquetar. En lugar de indicar al modelo qué debe buscar, se le permite identificar similitudes, agrupar imágenes relacionadas o destacar patrones inusuales por sí mismo.

En una gran colección de imágenes, un enfoque no supervisado puede ayudar a agrupar imágenes similares o a señalar valores atípicos que puedan requerir una atención especial. Esto lo convierte en un punto de partida útil para los proyectos de ciencia de datos.

Los modelos generativos, entre los que se incluyen las GAN, los autoencodificadores variacionales y los modelos de difusión, aprenden la distribución subyacente de las imágenes para crear otras totalmente nuevas. Estos modelos sustentan aplicaciones como la síntesis de imágenes, el relleno de huecos, la superresolución y la transferencia de estilos, y constituyen la columna vertebral de los sistemas actuales de IA generativa.

Segmentación no supervisada: algunos métodos agrupan píxeles o regiones en segmentos coherentes sin recurrir a máscaras etiquetadas, lo cual resulta útil cuando la anotación resulta demasiado costosa o cuando el objetivo es descubrir la estructura en lugar de hacer coincidir categorías predefinidas.

El aprendizaje no supervisado también resulta muy útil cuando se trabaja con grandes conjuntos de datos en los que el etiquetado requiere mucho tiempo o no es viable. En tales casos, permite extraer información de los datos sin depender de datos de entrenamiento etiquetados. 

También se utiliza habitualmente en ámbitos como la IA generativa (modelos que crean nuevos datos, como imágenes, texto o audio) y el aprendizaje de representaciones (modelos que aprenden características o patrones útiles a partir de datos sin procesar), en los que los modelos aprenden características generales a partir de grandes cantidades de datos. En general, si tu problema implica la exploración, el descubrimiento de patrones o el trabajo con datos sin etiquetar, el aprendizaje no supervisado es un enfoque flexible y práctico que debes tener en cuenta.

Ejemplos prácticos de aprendizaje no supervisado en la visión artificial

A continuación se presentan algunos ejemplos de casos de uso en los que se aplica el aprendizaje no supervisado a la visión artificial:

  • Detección de anomalías en la fabricación: los modelos pueden aprender cómo son los productos normales y señalar defectos o irregularidades sin necesidad de ejemplos etiquetados de todos los defectos posibles.
  • Organización y búsqueda de imágenes: Las grandes colecciones de imágenes, como las bibliotecas de fotos o los catálogos de comercio electrónico, pueden agruparse automáticamente en función de su similitud visual, lo que facilita a los científicos de datos la organización, la exploración y la búsqueda en grandes conjuntos de datos.
  • Vigilancia y seguridad: los sistemas pueden analizar las grabaciones de vídeo para identificar patrones o comportamientos inusuales, como movimientos inesperados o cambios en la composición de la multitud, sin haber sido entrenados explícitamente con eventos etiquetados.
  • Preprocesamiento y exploración de datos: los métodos no supervisados se utilizan a menudo para explorar y estructurar los datos de imagen sin procesar antes de entrenar modelos supervisados, lo que contribuye a mejorar la calidad de los datos y a reducir el trabajo manual. 

Limitaciones prácticas del aprendizaje supervisado y no supervisado

A pesar de las ventajas que presentan ambos enfoques de aprendizaje, hay que tener en cuenta ciertas limitaciones. A continuación se indican algunos factores prácticos que conviene tener en cuenta a la hora de crear modelos de visión artificial:

  • Sobreatamiento en los modelos supervisados: En el aprendizaje supervisado, un modelo puede adaptarse excesivamente a los datos de entrenamiento en lugar de aprender patrones generales. Esto suele ocurrir cuando el conjunto de datos es pequeño o no lo suficientemente variado. Por ejemplo, un modelo entrenado para detect en un tipo de producto puede fallar cuando se prueba con datos nuevos que incluyen productos ligeramente diferentes o condiciones de iluminación distintas.
  • Retos de los algoritmos de agrupamiento: En el aprendizaje no supervisado, un modelo puede agrupar puntos de datos similares. Sin embargo, esto puede fallar cuando los datos contienen ruido, son inconsistentes o carecen de una estructura clara. Por ejemplo, en tareas de agrupamiento de imágenes, es posible que se agrupen incorrectamente imágenes con colores similares pero con objetos diferentes.
  • Importancia de un preprocesamiento adecuado: antes del entrenamiento, es necesario limpiar y preparar los datos. Esto se suele hacer utilizando Python especializadas en el procesamiento de imágenes y la transformación de datos. Es especialmente importante en la visión artificial, donde las imágenes pueden variar en cuanto a tamaño, calidad o iluminación. Sin un preprocesamiento adecuado, los modelos pueden aprender a partir del ruido en lugar de patrones significativos, lo que da lugar a un rendimiento deficiente.

Conclusiones clave

En la visión artificial, tanto el aprendizaje supervisado como el no supervisado desempeñan un papel importante. El enfoque adecuado depende del tipo de datos de que se disponga —ya sean etiquetados o no—, así como del problema que se intente resolver y de las necesidades de implementación. 

Si tu objetivo es obtener una alta precisión y resultados bien definidos, el aprendizaje automático supervisado suele ser la mejor opción. Si estás explorando datos o trabajando sin etiquetas, el aprendizaje no supervisado puede ser más adecuado.

¿Quiere saber más sobre la IA? Consulte nuestra comunidad y nuestro repositorio de GitHub. Explore nuestras páginas de soluciones para obtener más información sobre la IA en robótica y la visión artificial en la agricultura. Descubra nuestras opciones de licencia y comience a construir con visión artificial hoy mismo. 

¡Construyamos juntos el futuro de la IA!

Comience su viaje con el futuro del aprendizaje automático