Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Aprendizaje con Pocos Ejemplos

Descubra cómo el aprendizaje con pocos ejemplos permite que la IA se adapte con datos mínimos, transformando campos como el diagnóstico médico y la conservación de la vida silvestre.

Few-Shot Learning (FSL) es un subcampo especializado del aprendizaje automático (AM) que se centra en modelos de inteligencia artificial para categorizar, detect o comprender nuevos conceptos utilizando sólo un número muy reducido de ejemplos etiquetados. En el deep learning (DL) tradicional, los modelos a menudo requieren miles de imágenes por clase para lograr una alta precisión. Sin embargo, FSL imita la capacidad humana de generalizar rápidamente a partir de una experiencia limitada. experiencia limitada, del mismo modo que un niño puede reconocer una jirafa tras ver solo una o dos imágenes. Esta capacidad es crucial para aplicaciones en las que la adquisición de de datos de entrenamiento es costosa, lenta o prácticamente imposible.

Mecanismos básicos del aprendizaje de pocos disparos

El objetivo principal de FSL es reducir la dependencia de conjuntos de datos masivos aprovechando el conocimiento previo. En lugar de En lugar de aprender nuevos patrones desde cero, el modelo utiliza la información aprendida de un conjunto de datos base para interpretar los pocos ejemplos disponibles para una nueva tarea. ejemplos disponibles para una nueva tarea. Esto se consigue a menudo mediante distintos enfoques:

  • Metaaprendizaje: A menudo descrito como "aprender a aprender", el El metaaprendizaje capacita a los modelos para adaptarse nuevas tareas. Algoritmos como el metaaprendizaje agnóstico de modelos (MAML) optimizan los parámetros internos del modelo para que unos pocos pasos de gradiente en una nueva tarea conduzcan a un buen rendimiento. los parámetros internos del modelo para que unos pocos pasos de gradiente en una nueva tarea conduzcan a un buen rendimiento.
  • Aprendizaje basado en métricas: Este enfoque mapea los datos de entrada en un espacio de características en el que los elementos similares están similares están muy juntos y los que no lo son están muy separados. Técnicas como redes prototípicas calculan una representación media (prototipo) para cada clase y clasifican las nuevas muestras de consulta en función de su distancia a estos prototipos. para cada clase y classify las nuevas muestras de consulta en función de su distancia a estos prototipos. sofisticado k-Nearest Neighbors (k-NN).
  • Aumento de datos: Cuando las muestras son escasas, los investigadores suelen ampliar artificialmente el conjunto de datos. Las técnicas avanzadas de aumento de datos pueden generar variaciones sintéticas de las pocas imágenes disponibles, lo que ayuda a evitar que el modelo se ajuste en exceso a los ejemplos limitados. que el modelo se ajuste en exceso a los ejemplos limitados.

Aplicación del aprendizaje de pocos disparos con YOLO11

En escenarios prácticos de visión por computador (CV), FSL se aplica con frecuencia a través del aprendizaje por transferencia. Tomando un modelo robusto como YOLO11que ya ha aprendido representaciones de conjuntos de datos masivos como COCO, los desarrolladores pueden afinar el modelo en un pequeño conjunto de datos personalizado. Los pesos preentrenados sirven como un potente extractor de características, permitiendo que el modelo converja en nuevas clases con muy pocas muestras. que permite al modelo converger en nuevas clases con muy pocas muestras.

El siguiente código Python muestra cómo aplicar este concepto utilizando la función ultralytics paquete. En un modelo preentrenado y entrenando durante un breve periodo de tiempo en un pequeño conjunto de datos, básicamente se realiza una adaptación de pocos disparos. adaptación.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model to leverage learned feature representations
model = YOLO("yolo11n.pt")

# Fine-tune the model on a small dataset (e.g., 'coco8.yaml' has only 4 images per batch)
# The model adapts its existing knowledge to the new few-shot task
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# The model can now detect objects from the small dataset with high efficiency

Distinción entre pocos disparos y conceptos afines

Para entender dónde encaja el FSL en el panorama de la IA, es útil diferenciarlo de paradigmas de aprendizaje similares:

  • Aprendizaje de disparo cero (ZSL): Mientras que FSL requiere al menos un pequeño conjunto de ejemplos (el "conjunto de apoyo"), ZSL no requiere ejemplos visuales durante el entrenamiento de la inferencia para la clase objetivo específica. En su lugar, la ZSL se basa en descripciones semánticas o atributos atributos (por ejemplo, incrustaciones de texto) para reconocer categorías no vistas.
  • Aprendizaje único: Se trata de un caso extremo de FSL en el que el modelo debe aprender una nueva clase a partir de exactamente un ejemplo etiquetado. Se trata de estándar en los sistemas de reconocimiento un teléfono se desbloquea tras ver la cara del usuario una sola vez.
  • Aprendizaje por transferencia: El FSL es una aplicación específica del aprendizaje por transferencia. El aprendizaje por transferencia estándar podría seguir utilizando cientos de imágenes para para el ajuste fino, mientras que el FSL se dirige explícitamente a escenarios con regímenes de datos muy bajos (por ejemplo, de 5 a 10 imágenes por clase).

Aplicaciones en el mundo real

Few-Shot Learning está liberando potencial en industrias donde los datos son naturalmente escasos o las anomalías distintivas son raras.

Diagnóstico médico

En el análisis de imágenes médicas, obtener miles de exploraciones etiquetadas para patologías poco frecuentes suele ser imposible. FSL permite modelos de IA identificar tipos de tumores o enfermedades genéticas raras utilizando sólo un puñado de estudios de casos anotados. Instituciones como Stanford Medicine están explorando activamente estas técnicas para democratizar la IA para el diagnóstico de enfermedades subrepresentadas.

Control de calidad de la fabricación

La IA moderna en la fabricación se basa en la detección de defectos para garantizar la calidad. Sin embargo, es posible que determinados defectos sólo se produzcan una vez cada millón de unidades. En lugar de esperar meses para recopilar un gran conjunto de datos de "defectos", los ingenieros para entrenar sistemas de detección de objetos un nuevo defecto, lo que permite implantar de inmediato protocolos actualizados de garantía de calidad.

Robótica y adaptación

Los robots que operan en entornos dinámicos se encuentran a menudo con objetos que no han visto antes. Con FSL, los sistemas robóticos pueden aprender a agarrar o manipular una herramienta manipular una herramienta nueva tras haber visto una demostración unas pocas veces. Esta capacidad es esencial para la automatización flexible almacenamiento y la logística, en los que se centran empresas como Boston Dynamics.

Retos y perspectivas

A pesar de sus promesas, la FSL se enfrenta a problemas de fiabilidad. Los modelos pueden ser sensibles a los pocos ejemplos específicos Si el conjunto de ejemplos no es representativo, el rendimiento disminuye considerablemente. La investigación actual se centra en mejorar la solidez de las incrustaciones y desarrollar mejores métodos de estimación de la incertidumbre. Se han desarrollado marcos como PyTorch y TensorFlow siguen evolucionando, proporcionando a los investigadores las herramientas los límites del aprendizaje eficiente de datos. Modelos como YOLO26 se acerquen a su lanzamiento, esperamos capacidades aún mayores en el aprendizaje a partir de entradas de datos mínimas.

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora