Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Volver al glosario de Ultralytics

Zero-Shot Learning

Explora el aprendizaje Zero-Shot (ZSL) para detectar y clasificar objetos sin datos de entrenamiento. Aprende cómo Ultralytics YOLO-World permite la detección de vocabulario abierto en tiempo real.

El aprendizaje Zero-Shot (ZSL) es un paradigma de aprendizaje automático que permite a los modelos de inteligencia artificial reconocer, clasificar o detectar objetos que nunca han encontrado durante su fase de entrenamiento. En el aprendizaje supervisado tradicional, un modelo requiere miles de ejemplos etiquetados para cada categoría específica que necesita identificar. El ZSL elimina esta estricta dependencia aprovechando información auxiliar (normalmente descripciones de texto, atributos semánticos o embeddings) para cerrar la brecha entre las clases vistas y no vistas. Esta capacidad permite que los sistemas de inteligencia artificial (IA) sean significativamente más flexibles, escalables y capaces de manejar entornos dinámicos donde recopilar datos exhaustivos para cada objeto posible resulta poco práctico.

Link to this sectionCómo funciona el aprendizaje Zero-Shot#

El mecanismo central del ZSL implica transferir el conocimiento de conceptos familiares a otros desconocidos utilizando un espacio semántico compartido. En lugar de aprender a reconocer una "cebra" memorizando únicamente patrones de píxeles de rayas blancas y negras, el modelo aprende la relación entre características visuales y atributos semánticos (por ejemplo, "forma parecida a un caballo", "patrón de rayas", "cuatro patas") derivados del procesamiento de lenguaje natural (NLP).

Este proceso a menudo depende de modelos multimodales que alinean representaciones de imágenes y texto. Por ejemplo, investigaciones fundamentales como CLIP de OpenAI demuestran cómo los modelos pueden aprender conceptos visuales a partir de la supervisión del lenguaje natural. Cuando un modelo ZSL encuentra un objeto no visto, extrae las características visuales y las compara con un diccionario de vectores semánticos. Si las características visuales se alinean con la descripción semántica de la nueva clase, el modelo puede clasificarla correctamente, realizando de forma efectiva una predicción "zero-shot". Este enfoque es fundamental para los modelos fundacionales modernos que generalizan en una amplia gama de tareas.

Link to this sectionAplicaciones en el mundo real#

El aprendizaje Zero-Shot está impulsando la innovación en diversas industrias al permitir que los sistemas generalicen más allá de sus datos de entrenamiento iniciales.

  1. Open-Vocabulary Object Detection: Modern architectures like YOLO-World utilize ZSL to detect objects based on user-defined text prompts. This allows for object detection in scenarios where defining a fixed list of classes beforehand is impossible, such as searching for specific items in vast video archives. Researchers at Google Research continue to push the boundaries of these open-vocabulary capabilities.

  2. Diagnóstico médico: En la IA en el cuidado de la salud, obtener datos etiquetados para enfermedades raras suele ser difícil y costoso. Los modelos ZSL pueden entrenarse con afecciones comunes y descripciones de síntomas poco frecuentes procedentes de la literatura médica encontrada en bases de datos como PubMed, lo que permite al sistema marcar posibles anomalías raras en imágenes médicas sin necesidad de un conjunto de datos masivo de casos positivos.

  3. Conservación de la vida silvestre: Para la IA en la agricultura y la ecología, identificar especies en peligro de extinción que rara vez se fotografían es fundamental. El ZSL permite a los conservacionistas detectar a estos animales mediante descripciones basadas en atributos definidos en bases de datos biológicas como la Encyclopedia of Life.

Link to this sectionDetección Zero-Shot con Ultralytics#

El modelo Ultralytics YOLO-World ejemplifica el aprendizaje Zero-Shot en acción. Permite a los usuarios definir clases personalizadas de forma dinámica en tiempo de ejecución sin volver a entrenar el modelo. Esto se logra conectando una robusta columna vertebral de detección con un codificador de texto que comprende el lenguaje natural.

El siguiente ejemplo de Python demuestra cómo utilizar YOLO-World para detectar objetos que no formaban parte explícitamente de un conjunto de entrenamiento estándar utilizando el paquete ultralytics.

from ultralytics import YOLOWorld

# Load a pre-trained YOLO-World model capable of Zero-Shot Learning
model = YOLOWorld("yolov8s-world.pt")

# Define custom classes via text prompts (e.g., specific accessories)
# The model adjusts to detect these new classes without retraining
model.set_classes(["blue backpack", "red apple", "sunglasses"])

# Run inference on an image to detect the new zero-shot classes
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Display the results
results[0].show()

Link to this sectionDistinción de conceptos relacionados#

Para entender completamente el ZSL, es útil distinguirlo de estrategias de aprendizaje similares utilizadas en visión por ordenador (CV):

  • Aprendizaje Few-Shot (FSL): Mientras que el ZSL no requiere ejemplos de la clase objetivo, el FSL proporciona al modelo un conjunto de apoyo muy pequeño (normalmente de 1 a 5 ejemplos) para adaptarse. El ZSL se considera generalmente más difícil, ya que depende totalmente de la inferencia semántica en lugar de ejemplos visuales.
  • Aprendizaje One-Shot: Un subconjunto de FSL donde el modelo aprende a partir de exactamente un ejemplo etiquetado. El ZSL difiere fundamentalmente porque funciona sin necesidad de una sola imagen de la nueva categoría.
  • Aprendizaje por transferencia (Transfer Learning): Este término amplio se refiere a la transferencia de conocimientos de una tarea a otra. El ZSL es un tipo específico de aprendizaje por transferencia que utiliza atributos semánticos para transferir conocimientos a clases no vistas sin necesidad de realizar un fine-tuning tradicional con nuevos datos.

Link to this sectionDesafíos y perspectivas de futuro#

Aunque el ZSL ofrece un potencial inmenso, se enfrenta a desafíos como el problema del desplazamiento de dominio (domain shift problem), donde los atributos semánticos aprendidos durante el entrenamiento no se asignan perfectamente a la apariencia visual de las clases no vistas. Además, los modelos ZSL pueden sufrir sesgos, donde la precisión de la predicción es significativamente mayor para las clases vistas en comparación con las no vistas.

Las investigaciones de organizaciones como el AI Lab de la Universidad de Stanford y la IEEE Computer Society siguen abordando estas limitaciones. A medida que las herramientas de visión por ordenador se vuelven más robustas, se espera que el ZSL se convierta en una característica estándar, reduciendo la dependencia de los esfuerzos masivos de etiquetado de datos. Para los equipos que buscan gestionar conjuntos de datos de manera eficiente antes de implementar modelos avanzados, la Plataforma Ultralytics ofrece herramientas integrales para la anotación y gestión de conjuntos de datos.

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático