¡Aumente la precisión predictiva con métodos de conjunto! Aprenda cómo la combinación de múltiples modelos mejora el rendimiento en la detección de objetos, el PNL y más.
Los métodos de ensamblaje representan una estrategia aprendizaje automático (AM) en la que se combinan múltiples modelos distintos se combinan para optimizar el rendimiento global. Al agregar los resultados de diversos algoritmos, este enfoque pretende reducir los errores que un único modelo podría cometer de forma aislada, aprovechando de forma eficaz la "sabiduría de la multitud". El objetivo principal es mejorar la precisión y la estabilidad de las predicciones, lo que sistema final sea más generalizable a datos desconocidos. Esta técnica es especialmente eficaz para mitigar problemas comunes como sobreajuste y el de sesgo-varianza, garantizando que el modelo modelo capta los verdaderos patrones subyacentes en lugar del ruido de los datos de entrenamiento.
Existen varias estrategias fundamentales para construir conjuntos, cada una de las cuales manipula el proceso de aprendizaje de forma diferente para lograr la diversidad entre los modelos base.
Los métodos de ensamblaje son fundamentales en entornos en los que hay mucho en juego y en los que la precisión y la fiabilidad son primordiales. donde la precisión y la fiabilidad son primordiales.
Mientras que frameworks como PyTorch y TensorFlow permiten ensamblajes personalizados complejos, también puedes realizar ensamblajes básicos básicos ejecutando múltiples modelos entrenados y agregando sus resultados. El siguiente ejemplo demuestra cargar dos modelos Ultralytics YOLO para generar predicciones sobre la misma imagen.
from ultralytics import YOLO
# Load two distinct YOLO11 models (e.g., Nano and Small versions)
model_n = YOLO("yolo11n.pt")
model_s = YOLO("yolo11s.pt")
# Run inference on a sample image
image_url = "https://ultralytics.com/images/bus.jpg"
results_n = model_n(image_url)
results_s = model_s(image_url)
# Compare the number of detected objects from each model
print(f"Nano Model Detections: {len(results_n[0].boxes)}")
print(f"Small Model Detections: {len(results_s[0].boxes)}")
Es útil distinguir "Ensemble" de conceptos similares que se encuentran en la literatura de ML:
El aprendizaje por conjuntos sigue siendo una piedra angular de la ciencia de datos moderna, dominando con frecuencia las tablas de clasificación en las competiciones de Kaggle. competiciones Kaggle e impulsando aplicaciones de última generación. Al comprender combinar modelos de forma eficaz, los desarrolladores pueden superar los límites de la la visión por ordenador y el análisis predictivo.