Al hacer clic en "Aceptar todas las cookies", usted acepta el almacenamiento de cookies en su dispositivo para mejorar la navegación por el sitio, analizar el uso del sitio y ayudar en nuestros esfuerzos de marketing. Más información en
Configuración de cookies
Al hacer clic en "Aceptar todas las cookies", usted acepta el almacenamiento de cookies en su dispositivo para mejorar la navegación por el sitio, analizar el uso del sitio y ayudar en nuestros esfuerzos de marketing. Más información en
Explore las diferencias entre el aprendizaje de pocos disparos, el aprendizaje de disparo cero y el aprendizaje por transferencia en la visión por ordenador y cómo estos paradigmas conforman el entrenamiento de modelos de IA.
Los sistemas de inteligencia artificial (IA) pueden realizar tareas complejas como reconocer caras, clasificar imágenes y conducir coches con una intervención humana mínima. Lo hacen estudiando datos, reconociendo patrones y utilizándolos para hacer predicciones o tomar decisiones. A medida que avanza la IA, vemos formas cada vez más sofisticadas en que los modelos de IA pueden aprender, adaptarse y realizar tareas con notable eficacia.
Por ejemplo, la visión por ordenador es una rama de la IA que se centra en capacitar a las máquinas para interpretar y comprender la información visual del mundo. El desarrollo tradicional de modelos de visión por ordenador depende en gran medida de grandes conjuntos de datos anotados para el entrenamiento. Recopilar y etiquetar estos datos puede llevar mucho tiempo y ser costoso.
Para hacer frente a estos retos, los investigadores han introducido enfoques innovadores como el aprendizaje de pocos disparos (FSL), que aprende a partir de ejemplos limitados; el aprendizaje de disparo cero (ZSL), que identifica objetos no vistos; y el aprendizaje por transferencia (TL), que aplica los conocimientos de modelos preentrenados a nuevas tareas.
En este artículo analizaremos el funcionamiento de estos paradigmas de aprendizaje, destacaremos sus principales diferencias y estudiaremos sus aplicaciones en el mundo real. Pongámonos manos a la obra.
Panorama de los paradigmas de aprendizaje
Exploremos qué son el aprendizaje de pocos disparos, el aprendizaje de cero disparos y el aprendizaje por transferencia con respecto a la visión por ordenador y cómo funcionan.
Aprendizaje con pocos disparos
El aprendizaje con pocas imágenes es un método en el que los sistemas aprenden a reconocer nuevos objetos utilizando sólo un pequeño número de ejemplos. Por ejemplo, si muestras a un modelo unas cuantas fotos de un pingüino, un pelícano y un frailecillo (este pequeño grupo se denomina "conjunto de apoyo"), aprende qué aspecto tienen estas aves.
Más tarde, si se le muestra una nueva imagen, como un pingüino, el modelo la compara con las de su conjunto de apoyo y elige la más parecida. Cuando es difícil reunir una gran cantidad de datos, este método es beneficioso porque el sistema puede seguir aprendiendo y adaptándose con sólo unos pocos ejemplos.
Fig. 1. Visión general del funcionamiento del aprendizaje de pocos disparos.
Aprendizaje sin disparos
El aprendizaje cero es una forma de que las máquinas reconozcan cosas que nunca han visto antes sin necesidad de ejemplos de ellas. Utiliza información semántica, como descripciones, para ayudar a establecer conexiones.
Por ejemplo, si una máquina ha aprendido sobre animales como gatos, leones y caballos entendiendo características como "pequeño y esponjoso", "gran gato salvaje" o "cara larga", puede utilizar este conocimiento para identificar un animal nuevo, como un tigre. Incluso si nunca ha visto un tigre, puede utilizar una descripción como "un animal parecido al león con rayas oscuras" para identificarlo correctamente. Esto facilita el aprendizaje y la adaptación de las máquinas sin necesidad de muchos ejemplos.
Fig. 2. El aprendizaje sin disparos identifica nuevos objetos mediante descripciones.
Aprendizaje por transferencia
El aprendizaje por transferencia es un paradigma de aprendizaje en el que un modelo utiliza lo aprendido en una tarea para ayudar a resolver una nueva tarea similar. Esta técnica es especialmente útil en tareas de visión por ordenador como la detección de objetos, la clasificación de imágenes y el reconocimiento de patrones.
Por ejemplo, en visión por ordenador, un modelo preentrenado puede reconocer objetos generales, como animales, y luego afinarse mediante aprendizaje por transferencia para identificar otros específicos, como distintas razas de perros. Al reutilizar conocimientos de tareas anteriores, el aprendizaje por transferencia facilita el entrenamiento de modelos de visión por ordenador en conjuntos de datos más pequeños, lo que ahorra tiempo y esfuerzo.
Fig. 3. Visión general del funcionamiento del aprendizaje por transferencia.
Quizá se pregunte qué tipo de modelos admiten el aprendizaje por transferencia. Ultralytics YOLO11 es un buen ejemplo de modelo de visión por ordenador que puede hacerlo. Se trata de un modelo de detección de objetos de última generación que primero se preentrena en un gran conjunto de datos generales. Después, puede ajustarse y entrenarse de forma personalizada en un conjunto de datos más pequeño y especializado para tareas específicas.
Comparación de paradigmas de aprendizaje
Ahora que hemos hablado del aprendizaje de pocos disparos, del aprendizaje de cero disparos y del aprendizaje por transferencia, vamos a compararlos para ver en qué se diferencian.
Fig. 4. Diferencias clave entre aprendizaje de pocos disparos, cero disparos y transferencia Imagen del autor.
El aprendizaje de pocos ejemplos es útil cuando sólo se dispone de una pequeña cantidad de datos etiquetados. Permite que un modelo de IA aprenda a partir de unos pocos ejemplos. En cambio, el aprendizaje de cero disparos no requiere datos etiquetados. En su lugar, utiliza descripciones o contexto para ayudar al sistema a manejar nuevas tareas. Por su parte, el aprendizaje por transferencia adopta un enfoque diferente al utilizar los conocimientos de modelos preentrenados, lo que les permite adaptarse rápidamente a nuevas tareas con un mínimo de datos adicionales. Cada método tiene sus puntos fuertes, dependiendo del tipo de datos y de la tarea en la que se trabaje.
Aplicaciones reales de diversos paradigmas de aprendizaje
Estos paradigmas de aprendizaje ya están marcando la diferencia en muchos sectores, resolviendo problemas complejos con soluciones innovadoras. Veamos más de cerca cómo pueden aplicarse en el mundo real.
Diagnóstico de enfermedades raras con aprendizaje de pocos disparos
El aprendizaje a partir de pocos datos cambia las reglas del juego en el sector sanitario, sobre todo en el de la imagen médica. Puede ayudar a los médicos a diagnosticar enfermedades raras utilizando sólo unos pocos ejemplos o incluso descripciones, sin necesidad de grandes cantidades de datos. Esto es especialmente útil cuando los datos son limitados, lo que suele ocurrir porque recopilar grandes conjuntos de datos sobre enfermedades raras puede ser complicado.
Por ejemplo, SHEPHERD utiliza el aprendizaje de pocos datos y los grafos de conocimiento biomédico para diagnosticar trastornos genéticos raros. Mapea la información del paciente, como síntomas y resultados de pruebas, en una red de genes y enfermedades conocidos. Esto ayuda a determinar la causa genética probable y a encontrar casos similares, incluso cuando los datos son limitados.
Fig. 5. El modelo Shepherd diagnostica enfermedades raras con datos mínimos.
Mejora de la detección de enfermedades de las plantas mediante el aprendizaje sin disparos
En la agricultura, es esencial identificar rápidamente las enfermedades de las plantas, ya que los retrasos en la detección pueden provocar daños generalizados en los cultivos, una reducción de los rendimientos e importantes pérdidas económicas. Los métodos tradicionales suelen basarse en grandes conjuntos de datos y conocimientos de expertos, que no siempre son accesibles, especialmente en zonas remotas o con recursos limitados. Aquí es donde entran en juego los avances de la IA, como el aprendizaje por disparo cero.
Supongamos que un agricultor cultiva tomates y patatas y observa síntomas como hojas amarillentas o manchas marrones. El aprendizaje cero puede ayudar a identificar enfermedades como el tizón tardío sin necesidad de grandes conjuntos de datos. Utilizando descripciones de los síntomas, el modelo puede clasificar enfermedades que no ha visto antes. Este método es rápido, escalable y permite a los agricultores detectar diversos problemas de las plantas. Les ayuda a controlar la salud de los cultivos de forma más eficaz, tomar medidas a tiempo y reducir las pérdidas.
Fig. 6. Uso del aprendizaje de disparo cero para identificar enfermedades de las plantas.
Vehículos autónomos y aprendizaje por transferencia
Los vehículos autónomos necesitan a menudo adaptarse a distintos entornos para navegar con seguridad. El aprendizaje por transferencia les ayuda a utilizar conocimientos previos para adaptarse rápidamente a nuevas condiciones sin tener que empezar su entrenamiento desde cero. Combinadas con la visión por ordenador, que ayuda a los vehículos a interpretar la información visual, estas tecnologías permiten una navegación más fluida por distintos terrenos y condiciones meteorológicas, lo que hace que la conducción autónoma sea más eficiente y fiable.
Un buen ejemplo de ello es un sistema de gestión de aparcamientos que utiliza YOLO11 de Ultralytics para controlar las plazas de aparcamiento. YOLO11, un modelo de detección de objetos preentrenado, puede ajustarse mediante aprendizaje por transferencia para identificar plazas de aparcamiento vacías y ocupadas en tiempo real. Al entrenar el modelo en un conjunto de datos más pequeño de imágenes de aparcamientos, aprende a detectar con precisión plazas abiertas, plazas llenas e incluso zonas reservadas.
Fig. 7. Gestión de aparcamientos mediante Ultralytics YOLO11.
Integrado con otras tecnologías, este sistema puede guiar a los conductores hasta la plaza disponible más cercana, ayudando a reducir el tiempo de búsqueda y la congestión del tráfico. El aprendizaje por transferencia lo hace posible basándose en las capacidades de detección de objetos existentes de YOLO11, lo que le permite adaptarse a las necesidades específicas de la gestión de aparcamientos sin empezar de cero. Este enfoque ahorra tiempo y recursos al tiempo que crea una solución altamente eficiente y escalable que mejora las operaciones de aparcamiento y mejora la experiencia general del usuario.
Nuevas tendencias en los paradigmas de aprendizaje
El futuro de los paradigmas de aprendizaje en visión por ordenador se inclina hacia el desarrollo de sistemas de IA de visión más inteligentes y sostenibles. En concreto, una tendencia creciente es el uso de enfoques híbridos que combinan el aprendizaje de pocos disparos, el aprendizaje de cero disparos y el aprendizaje por transferencia. Combinando los puntos fuertes de estos métodos, los modelos pueden aprender nuevas tareas con un mínimo de datos y aplicar sus conocimientos en distintas áreas.
Un ejemplo interesante es el uso de incrustaciones profundas adaptadas para afinar los modelos utilizando conocimientos de tareas anteriores y una pequeña cantidad de datos nuevos, lo que facilita el trabajo con conjuntos de datos limitados.
Del mismo modo, el aprendizaje X-shot está diseñado para manejar tareas con diferentes cantidades de datos. Utiliza una supervisión débil, en la que los modelos aprenden a partir de etiquetas limitadas o ruidosas, e instrucciones claras para ayudarles a adaptarse rápidamente, incluso con pocos o ningún ejemplo previo disponible. Estos enfoques híbridos muestran cómo la integración de distintos métodos de aprendizaje puede ayudar a los sistemas de IA a afrontar los retos con mayor eficacia.
Principales conclusiones
El aprendizaje de pocos disparos, el aprendizaje de cero disparos y el aprendizaje por transferencia abordan retos específicos de la visión por ordenador, por lo que son adecuados para diferentes tareas. El enfoque adecuado depende de la aplicación específica y de la cantidad de datos disponibles. Por ejemplo, el aprendizaje de pocos disparos funciona bien con datos limitados, mientras que el aprendizaje de cero disparos es ideal para tratar clases desconocidas.
De cara al futuro, es probable que la combinación de estos métodos para crear modelos híbridos que integren la visión, el lenguaje y el audio sea un objetivo clave. Con estos avances se pretende que los sistemas de IA sean más flexibles, eficientes y capaces de abordar problemas complejos, abriendo nuevas posibilidades de innovación en este campo.