Active Learning
Descubre cómo el aprendizaje activo optimiza el entrenamiento de IA. Aprende a usar YOLO26 de Ultralytics para identificar datos informativos, reducir costos de etiquetado y aumentar la precisión.
El aprendizaje activo es un enfoque estratégico en el aprendizaje automático (ML) en el que el algoritmo selecciona proactivamente los puntos de datos más informativos para el etiquetado, en lugar de aceptar pasivamente un conjunto de datos preetiquetado. En el aprendizaje supervisado tradicional, los modelos a menudo requieren cantidades masivas de datos anotados, cuya creación puede ser costosa y consumir mucho tiempo. El aprendizaje activo optimiza este proceso identificando ejemplos "inciertos" o "difíciles" —aquellos cercanos al límite de decisión o donde el modelo carece de confianza— y solicitando a los anotadores humanos que etiqueten solo esas instancias específicas. Este bucle iterativo permite a los modelos alcanzar una alta precisión con muchas menos muestras etiquetadas, lo que lo hace altamente eficiente para proyectos con presupuestos limitados o restricciones de tiempo.
Link to this sectionCómo funciona el ciclo de aprendizaje activo#
El núcleo del aprendizaje activo es un bucle de retroalimentación a menudo denominado human-in-the-loop. En lugar de entrenar una vez en un conjunto de datos estático, el modelo evoluciona a través de ciclos de consulta y actualización.
-
Inicialización: El proceso comienza con un pequeño conjunto de datos de entrenamiento etiquetados que se utilizan para entrenar un modelo inicial, como Ultralytics YOLO26.
-
Selección de consulta: El modelo evalúa un gran conjunto de datos sin etiquetar. Utilizando una estrategia de consulta (la más común es el muestreo por incertidumbre), selecciona las imágenes o textos donde sus predicciones son menos seguras.
-
Anotación: Estas muestras de alta prioridad se envían a un experto humano, a menudo llamado "oráculo" en la literatura sobre aprendizaje activo, para el etiquetado de datos.
-
Reentrenamiento: Los nuevos datos etiquetados se añaden al conjunto de entrenamiento y el modelo se vuelve a entrenar. Este modelo actualizado está entonces mejor equipado para seleccionar el siguiente lote de muestras confusas.
Link to this sectionAplicaciones en el mundo real#
El aprendizaje activo es indispensable en sectores donde los datos son abundantes pero el etiquetado requiere conocimientos especializados o altos costes.
- Análisis de imágenes médicas: En campos como la radiología, el etiquetado requiere expertos certificados cuyo tiempo es extremadamente valioso. En lugar de pedir a un médico que anote miles de escaneos claros, un sistema de aprendizaje activo puede filtrar casos ambiguos —como tumores en etapa temprana o anomalías raras— permitiendo al experto centrarse solo en imágenes que realmente mejoren la capacidad diagnóstica del modelo.
- Vehículos autónomos: Los coches autónomos generan petabytes de datos de vídeo. Etiquetar cada fotograma es imposible. El aprendizaje activo ayuda a los ingenieros a identificar casos límite, como peatones con disfraces o conducción en nieve intensa, que los modelos estándar de detección de objetos podrían pasar por alto. Al priorizar estos escenarios raros, las empresas mejoran la seguridad sin desperdiciar recursos en grabaciones repetitivas de autopistas.
Link to this sectionEjemplo en Python: Filtrado de predicciones inciertas#
El siguiente ejemplo demuestra una lógica sencilla de "muestreo por incertidumbre" utilizando Ultralytics YOLO26. Cargamos un modelo, ejecutamos la inferencia en imágenes y marcamos aquellas donde la puntuación de confianza está por debajo de un cierto umbral para su revisión manual.
from ultralytics import YOLO
# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")
# List of unlabeled image paths
unlabeled_images = ["https://ultralytics.com/images/bus.jpg", "https://ultralytics.com/images/zidane.jpg"]
# Run inference
results = model(unlabeled_images)
# Identify samples with low confidence for active learning
uncertain_threshold = 0.6
for result in results:
# Check if any detection confidence is below the threshold
if result.boxes.conf.numel() > 0 and result.boxes.conf.min() < uncertain_threshold:
print(f"Active Learning Query: {result.path} needs human labeling.")Link to this sectionDistinguir conceptos relacionados#
Es importante diferenciar el aprendizaje activo de paradigmas de entrenamiento similares:
- Aprendizaje semisupervisado: Aunque ambos métodos utilizan datos sin etiquetar, el aprendizaje semisupervisado asigna automáticamente pseudoetiquetas a los datos basados en las predicciones de alta confianza del modelo. Por el contrario, el aprendizaje activo solicita explícitamente la intervención humana en predicciones de baja confianza.
- Aprendizaje por transferencia: Esto implica tomar un modelo preentrenado (como uno entrenado en ImageNet) y adaptarlo a una nueva tarea. El aprendizaje activo se centra en qué datos etiquetar, mientras que el aprendizaje por transferencia se centra en reutilizar características aprendidas.
- Aprendizaje por refuerzo: Aquí, un agente aprende interactuando con un entorno y recibiendo recompensas. El aprendizaje activo es diferente porque busca etiquetas de verdad fundamental estáticas de un oráculo, en lugar de optimizar una secuencia de acciones para obtener una recompensa.
Link to this sectionIntegración con MLOps#
Implementar el aprendizaje activo de manera efectiva requiere una infraestructura robusta de Operaciones de Aprendizaje Automático (MLOps). Necesitas infraestructura para gestionar el control de versiones de datos, activar tareas de reentrenamiento y servir la interfaz de anotación a los humanos. Las herramientas que se integran con el ecosistema Ultralytics permiten a los usuarios moverse sin problemas entre la inferencia, la curación de datos y el entrenamiento. Por ejemplo, el uso de scripts de entrenamiento personalizados permite a los desarrolladores incorporar rápidamente nuevos lotes de datos de aprendizaje activo en sus modelos YOLO.
Para profundizar en las estrategias de muestreo, los investigadores suelen consultar encuestas exhaustivas en la literatura sobre aprendizaje activo. Además, comprender las métricas de evaluación de modelos es crucial para verificar que el bucle de aprendizaje activo realmente esté mejorando el rendimiento.






