Al hacer clic en “Aceptar todas las cookies”, aceptas el almacenamiento de cookies en tu dispositivo para mejorar la navegación del sitio, analizar el uso del sitio y ayudar en nuestros esfuerzos de marketing. Más información
Configuración de cookies
Al hacer clic en “Aceptar todas las cookies”, aceptas el almacenamiento de cookies en tu dispositivo para mejorar la navegación del sitio, analizar el uso del sitio y ayudar en nuestros esfuerzos de marketing. Más información
Aprenda cómo se utiliza el aprendizaje activo en la visión artificial para minimizar los esfuerzos de anotación y explore sus aplicaciones en el mundo real en diversas industrias.
Entrenar un modelo de visión artificial es muy parecido a enseñarle a un niño a reconocer los colores. Primero, necesitarías una colección de objetos de colores. Luego, guiarías al niño para que identifique correctamente cada color, una tarea que a menudo requiere mucho tiempo y es repetitiva.
Al igual que un niño necesita muchos ejemplos para aprender, un modelo de visión necesita un gran conjunto de datos etiquetados para reconocer patrones y objetos en las imágenes. Sin embargo, etiquetar grandes cantidades de datos requiere mucho tiempo y esfuerzo, sin mencionar los recursos. Técnicas como el aprendizaje activo pueden ayudar a simplificar este proceso.
El aprendizaje activo es un proceso paso a paso en el que se seleccionan y etiquetan los datos más importantes de un gran conjunto de datos. El modelo aprende de estos datos etiquetados, haciéndolo más preciso y eficaz. Centrarse solo en los datos más valiosos reduce la cantidad de etiquetado necesario y acelera el desarrollo del modelo.
En este artículo, analizaremos cómo el aprendizaje activo ayuda con el entrenamiento de modelos, reduce los costes de etiquetado y mejora la precisión general del modelo.
Los conjuntos de datos de imágenes no son fáciles de construir
Los conjuntos de datos son la base de los modelos de visión artificial y aprendizaje profundo. Los conjuntos de datos populares como ImageNet ofrecen millones de imágenes con diversas categorías de objetos. Sin embargo, la creación y el mantenimiento de volúmenes tan grandes de conjuntos de datos de alta calidad conlleva varios desafíos.
Por ejemplo, recopilar y etiquetar datos lleva tiempo, recursos y anotadores capacitados, lo que hace que el proceso sea desafiante según la aplicación específica. Se necesitan soluciones innovadoras y más eficientes para mantenerse al día con la creciente demanda de conjuntos de datos de imágenes, y eso es exactamente lo que el aprendizaje activo pretende resolver.
El aprendizaje activo ofrece una solución perfecta al optimizar el proceso de etiquetado de datos. Al seleccionar estratégicamente los puntos de datos más informativos para la anotación, el aprendizaje activo maximiza el rendimiento del modelo al tiempo que minimiza los esfuerzos de etiquetado.
¿Qué es el aprendizaje activo?
El aprendizaje activo es una técnica iterativa de aprendizaje automático en la que el modelo selecciona los puntos de datos más importantes para etiquetar de un gran conjunto de datos no etiquetados. Estos puntos de datos seleccionados se etiquetan manualmente y se añaden al conjunto de datos de entrenamiento.
A continuación, el modelo se vuelve a entrenar con el conjunto de datos actualizado y selecciona el siguiente conjunto de puntos de datos para etiquetar. Este proceso se repite, con el modelo mejorando continuamente al centrarse en los puntos de datos más informativos. El ciclo continúa hasta que el modelo alcanza la precisión deseada o cumple con los criterios de etiquetado establecidos de antemano.
Fig. 1. Una visión general del aprendizaje activo.
Comprender cómo funciona el aprendizaje activo
Puede que se pregunte cómo la técnica de aprendizaje activo decide qué puntos de datos necesitan etiquetado manual y cuáles etiquetar a continuación. Entendamos cómo funciona el aprendizaje activo comparándolo con el estudio para un examen: se centra en los temas de los que no está seguro y también se asegura de cubrir una variedad de temas para estar bien preparado.
Para el conjunto inicial de procesos de selección de datos, el aprendizaje activo utiliza estrategias como el muestreo de incertidumbre y el muestreo basado en la diversidad. El muestreo de incertidumbre prioriza los puntos de datos en los que el modelo tiene menos confianza en sus predicciones, con el objetivo de mejorar la precisión en los casos difíciles. El muestreo basado en la diversidad selecciona puntos de datos que cubren una amplia gama de características, lo que garantiza que el modelo se generalice bien a datos no vistos al exponerlo a diversos ejemplos.
Fig 2. Muestreo de incertidumbre (a la izquierda) y muestreo basado en la diversidad (a la derecha).
Después de la selección inicial de datos, el aprendizaje activo utiliza dos enfoques principales para el etiquetado: el muestreo basado en pool y el muestreo basado en stream, que son similares a la forma en que un profesor ayuda a un estudiante a centrarse en lo más importante.
En el muestreo basado en pool, el modelo escanea un gran pool de datos no etiquetados y selecciona los ejemplos más desafiantes o informativos para etiquetar, de forma muy parecida a como un estudiante prioriza las tarjetas que le resultan más difíciles. Con respecto al muestreo basado en stream, el modelo procesa los datos a medida que llegan, decidiendo si etiquetarlos u omitirlos, de forma similar a como un estudiante pide ayuda solo cuando está atascado. En ambos casos, los datos etiquetados se añaden al conjunto de entrenamiento y el modelo se vuelve a entrenar, mejorando constantemente con cada iteración.
Explorando aplicaciones del aprendizaje activo
El aprendizaje activo desempeña un papel clave en las aplicaciones de visión artificial, como las imágenes médicas y la conducción autónoma, al mejorar la precisión del modelo y agilizar el proceso de etiquetado de datos. Un ejemplo interesante de esto son los modelos de visión artificial utilizados en los coches autónomos para detectar peatones u objetos en condiciones de poca luz o niebla. El aprendizaje activo puede mejorar la precisión centrándose en escenarios de conducción diversos y desafiantes.
Específicamente, el aprendizaje activo se puede utilizar para identificar datos o fotogramas inciertos de tales escenarios para el etiquetado selectivo. Agregar estos ejemplos etiquetados al conjunto de entrenamiento hace que el modelo reconozca mejor a los peatones y objetos en entornos difíciles, como durante condiciones climáticas adversas o conducción nocturna.
Por ejemplo, NVIDIA ha utilizado el aprendizaje activo para mejorar la detección de peatones por la noche en sus modelos de conducción autónoma. Al seleccionar estratégicamente los datos más informativos para el entrenamiento, particularmente en escenarios desafiantes, el rendimiento del modelo aumenta sustancialmente.
Fig. 3. Detección de un peatón con un paraguas mediante aprendizaje activo.
El aprendizaje activo puede reducir los costes de etiquetado
Otro aspecto clave del aprendizaje activo es su potencial para reducir los costes de etiquetado. Esto lo hace centrándose únicamente en los puntos de datos más importantes, en lugar de requerir anotaciones para todo el conjunto de datos. Este enfoque específico ahorra tiempo, esfuerzo y dinero. Al centrarse en muestras inciertas o diversas, el aprendizaje activo reduce el número de anotaciones necesarias, manteniendo al mismo tiempo una alta precisión del modelo.
De hecho, la investigación muestra que el aprendizaje activo puede reducir los costes de etiquetado en un 40-60% sin sacrificar el rendimiento. Esto es especialmente útil en industrias como la atención sanitaria y la fabricación, donde el etiquetado de datos es costoso. Al simplificar el proceso de anotación, el aprendizaje activo ayuda a las empresas a desarrollar modelos más rápido y a implementarlos de forma más eficiente, manteniendo la precisión.
Beneficios del aprendizaje activo
Estas son algunas de las otras ventajas clave que el aprendizaje activo puede ofrecer:
Abordar el desequilibrio de clases: El aprendizaje activo puede ayudar a abordar los problemas de desequilibrio de clases etiquetando instancias de clases de datos minoritarias. El modelo puede tener un mejor rendimiento en escenarios raros con datos limitados.
Ciclos de desarrollo más rápidos: Etiquetar menos datos significa indirectamente acelerar el proceso de desarrollo de modelos de aprendizaje automático y visión artificial, lo que permite más tiempo y recursos para iteraciones y experimentos adicionales.
Adaptabilidad: Puede mejorar continuamente los datos de entrenamiento iterando sobre muestras inciertas o de casos límite, lo que lo hace muy adecuado para conjuntos de datos dinámicos o en evolución.
El aprendizaje activo y AutoML pueden trabajar juntos
El Aprendizaje Automático Automatizado (AutoML) se centra en la automatización de las tareas iterativas y que consumen mucho tiempo que implica la construcción e implementación de modelos de aprendizaje automático. Simplifica los flujos de trabajo de aprendizaje automático mediante la automatización de tareas como la selección de modelos y la evaluación del rendimiento para reducir la necesidad de esfuerzo manual.
Cuando se integra con el aprendizaje activo, AutoML puede acelerar y optimizar el ciclo de vida del desarrollo de modelos. El componente de aprendizaje activo selecciona estratégicamente los puntos de datos más informativos para el etiquetado, mientras que AutoML refina el modelo automatizando la elección de la arquitectura, los parámetros y el ajuste.
Entendamos esta combinación de tecnologías con un ejemplo.
Supongamos que está intentando detectar afecciones raras en imágenes médicas (un caso de uso en el que los conjuntos de datos etiquetados son limitados y costosos de obtener). El aprendizaje activo puede identificar y seleccionar datos inciertos, como cambios sutiles en las radiografías, que el modelo no puede clasificar. Luego, los datos inciertos se pueden priorizar para la anotación manual para mejorar la comprensión del modelo.
Con los datos anotados, AutoML puede optimizar el modelo explorando varias arquitecturas, hiperparámetros y otras técnicas de aumento de datos. El proceso iterativo acelera el desarrollo de modelos de visión fiables como Ultralytics YOLO11 que ayudan a los profesionales de la salud a realizar diagnósticos precisos.
Desafíos del aprendizaje activo
El aprendizaje activo y sus técnicas ofrecen numerosas ventajas, pero hay algunas consideraciones que hay que tener en cuenta a la hora de implementar estas estrategias:
Selección de la estrategia de consulta: El aprendizaje activo implica muchas técnicas, y la elección del mejor método impacta significativamente en la efectividad del modelo. Seleccionar una estrategia inapropiada puede reducir el rendimiento del modelo para una aplicación específica.
Costos de reentrenamiento: La naturaleza iterativa del aprendizaje activo requiere costosos recursos computacionales, especialmente para grandes conjuntos de datos. El modelo se vuelve a entrenar después de cada ronda de etiquetado, lo que aumenta su complejidad.
Calidad inicial del modelo: La eficacia del aprendizaje activo depende de la calidad del modelo inicial. Un modelo inicial con un rendimiento deficiente puede no identificar con precisión los puntos de datos informativos, lo que lleva a solicitudes de etiquetas deficientes y a una reducción del rendimiento general.
El camino a seguir para el aprendizaje activo y AutoML
Con los recientes avances en IA y visión artificial, el aprendizaje activo está preparado para abordar desafíos más complejos y optimizar los flujos de trabajo de aprendizaje automático. La combinación del aprendizaje activo con técnicas como el aprendizaje federado y el aprendizaje autosupervisado puede mejorar aún más la eficiencia y la escalabilidad de los modelos de visión.
El aprendizaje federado permite que un modelo se entrene en múltiples dispositivos o servidores con un marco distribuido sin requerir que los datos salgan de su ubicación original. Considere industrias como la atención médica, donde la privacidad de los datos es importante, el aprendizaje federado hace posible entrenar directamente con datos locales confidenciales mientras los mantiene seguros. En lugar de compartir datos sin procesar, solo se comparten las actualizaciones o los conocimientos del modelo, lo que garantiza que la información privada permanezca protegida mientras contribuye al proceso de entrenamiento.
Mientras tanto, el aprendizaje autosupervisado ayuda a reducir la necesidad de datos etiquetados al pre-entrenar modelos con datos no etiquetados. Este proceso crea una base sólida para el modelo. El aprendizaje activo puede entonces construir sobre esto identificando y seleccionando los puntos de datos más importantes para la anotación humana, refinando aún más el modelo.
Del aprendizaje activo al impacto activo
El aprendizaje activo proporciona una forma práctica de abordar los principales retos de la visión artificial, como el elevado coste de la anotación de datos y la necesidad de modelos más precisos. Al centrarse en el etiquetado únicamente de los puntos de datos más valiosos, reduce el esfuerzo requerido por los humanos al tiempo que aumenta el rendimiento del modelo.
Cuando se combina con tecnologías como AutoML, el aprendizaje activo agiliza el desarrollo de modelos al automatizar tareas que consumen mucho tiempo. A medida que los avances continúan, el aprendizaje activo está destinado a convertirse en una herramienta esencial para la construcción de sistemas de visión artificial más inteligentes y eficientes.