Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Seguimiento de experimentos

Siga los experimentos de ML: registre hiperparámetros, conjuntos de datos, métricas y artefactos para un entrenamiento de modelos reproducible. Aprenda a organizar ejecuciones con Ultralytics YOLO11.

El seguimiento de experimentos es el proceso sistemático de registrar todos los datos, metadatos y resultados relevantes asociados con las ejecuciones de entrenamiento de modelos de aprendizaje automático. Al servir como un cuaderno de laboratorio digital para científicos de datos e ingenieros de IA, esta práctica garantiza que cada paso de la fase de investigación y desarrollo esté documentado, sea reproducible y analizable. Al capturar entradas como hiperparámetros y versiones de conjuntos de datos, junto con salidas como métricas de rendimiento y artefactos de modelos, el seguimiento de experimentos transforma la naturaleza a menudo caótica de prueba y error del entrenamiento de modelos en un flujo de trabajo estructurado y científico. Esta organización es fundamental para los equipos que desean crear sistemas robustos de inteligencia artificial (IA) de manera eficiente.

Componentes básicos del seguimiento de experimentos

Para gestionar eficazmente el ciclo de vida de un proyecto de visión artificial, un sistema de seguimiento de experimentos normalmente registra tres categorías distintas de información. La organización de estos componentes permite a los desarrolladores comparar diferentes iteraciones e identificar la configuración óptima para su caso de uso específico.

  • Parámetros y configuración: Esto incluye las variables establecidas antes de comenzar el entrenamiento, conocidas como hiperparámetros. Algunos ejemplos son la tasa de aprendizaje, el tamaño del lote, el tipo de optimizador (por ejemplo, Adam ) y la arquitectura específica del modelo que se utiliza, como YOLO11.
  • Métricas de rendimiento: Son medidas cuantitativas registradas durante y después del entrenamiento para evaluar el éxito. Las métricas comunes incluyen funciones de pérdida para medir el error, la precisión para las tareas de clasificación y la precisión media (mAP) para la detección de objetos.
  • Artefactos y código fuente: Los artefactos se refieren a los resultados tangibles de una ejecución, como los pesos del modelo entrenado , los gráficos de visualización (como las matrices de confusión) y los registros. El seguimiento de la versión específica del código y el conjunto de datos utilizados también es vital para garantizar que el experimento pueda reproducirse más adelante.

Relevancia en aplicaciones del mundo real

La aplicación rigurosa del seguimiento de experimentos es esencial en industrias donde la precisión y la seguridad son primordiales. Permite a los equipos de ingeniería revisar datos históricos para comprender por qué un modelo se comporta de cierta manera.

Imágenes médicas y diagnósticos

En el campo de la atención sanitaria, los investigadores utilizan el análisis de imágenes médicas para ayudar a los médicos a diagnosticar enfermedades. Por ejemplo, al entrenar un modelo para la detección de tumores cerebrales, los ingenieros pueden realizar cientos de experimentos variando las técnicas de aumento de datos y las arquitecturas de los modelos . El seguimiento de los experimentos les permite aislar qué combinación específica de pasos de preprocesamiento produjo la mayor sensibilidad, lo que garantiza que el agente de IA implementado minimice los falsos negativos en escenarios de diagnóstico críticos .

Seguridad de los vehículos autónomos

El desarrollo de vehículos autónomos requiere procesar grandes cantidades de datos de sensores para detect , señales y obstáculos. Los equipos que trabajan en la detección de objetos para coches autónomos deben optimizar tanto la precisión como la latencia de inferencia. Mediante el seguimiento de los experimentos, pueden analizar la relación entre el tamaño del modelo y la velocidad, garantizando que el sistema final reaccione en tiempo real sin comprometer las normas de seguridad establecidas por organizaciones como la Administración Nacional de Seguridad Vial en Carreteras (NHTSA).

Diferenciar conceptos relacionados

Aunque el seguimiento de experimentos es una parte fundamental de MLOps (operaciones de aprendizaje automático), a menudo se confunde con otros términos similares. Comprender las diferencias es importante para implementar un flujo de trabajo correcto.

  • Seguimiento de experimentos frente a supervisión de modelos: El seguimiento de experimentos se produce durante la fase de desarrollo y formación («offline»). Por el contrario, la supervisión de modelos tiene lugar después de que el modelo se haya implementado en producción («online»). La supervisión se centra en detectar problemas como la deriva de datos o la degradación del rendimiento en datos en tiempo real, mientras que el seguimiento se centra en optimizar el modelo antes de que llegue a los usuarios.
  • Seguimiento de experimentos frente a control de versiones: herramientas como Git proporcionan control de versiones para el código, realizando un seguimiento de los cambios en los archivos fuente a lo largo del tiempo. El seguimiento de experimentos va un paso más allá al vincular una versión específica de ese código (un hash de confirmación) a los datos, parámetros y resultados específicos de una ejecución de entrenamiento . Mientras que el control de versiones responde a la pregunta «¿Cómo ha cambiado el código?», el seguimiento de experimentos responde a la pregunta «¿Qué código y parámetros han producido el mejor modelo?».

Aplicación con Ultralytics YOLO

Los marcos modernos de IA simplifican el seguimiento de los experimentos al integrarse con herramientas de registro populares. Al utilizar Ultralytics , el seguimiento se puede organizar de manera eficaz definiendo nombres de proyectos y ejecuciones. Esta estructura crea una jerarquía de directorios que separa las diferentes hipótesis experimentales.

El siguiente ejemplo muestra cómo entrenar un YOLO11 nombrando explícitamente el proyecto y la ejecución del experimento para garantizar que las métricas y los pesos se guarden de forma organizada.

from ultralytics import YOLO

# Load the latest YOLO11 nano model
model = YOLO("yolo11n.pt")

# Train the model, specifying 'project' and 'name' for organized tracking
# Results, logs, and weights will be saved to 'runs/detect/experiment_tracking_demo'
results = model.train(data="coco8.yaml", epochs=5, project="runs/detect", name="experiment_tracking_demo")

Herramientas e integraciones populares

Para visualizar y gestionar los datos registrados, los desarrolladores utilizan software especializado. Estas herramientas suelen incluir paneles de control que permiten comparar las curvas de entrenamiento y las tablas de métricas.

  • MLflow: una plataforma de código abierto que gestiona el ciclo de vida del aprendizaje automático, incluyendo la experimentación, la reproducibilidad y la implementación. La integraciónUltralytics permite un registro fluido de métricas durante YOLO .
  • TensorBoard: Desarrollado originalmente para TensorFlow, este kit de herramientas de visualización se utiliza ampliamente en diversos marcos, incluido PyTorch, para inspeccionar curvas de pérdida y elementos visuales. Puede visualizar fácilmente las métricas de entrenamiento con la integración de TensorBoard.
  • Weights & Biases: una plataforma para MLOps centrada en los desarrolladores que ayuda a los equipos track , modelar versiones y visualizar resultados. La Weights & Biases proporciona gráficos interactivos y completos para analizar ejecuciones de entrenamiento complejas.
  • DVC (Control de versiones de datos): DVC amplía el concepto de seguimiento a conjuntos de datos y modelos, manejando archivos grandes que Git no puede manejar. El uso de la integración DVC ayuda a mantener un estricto control de versiones de los datos utilizados en cada experimento.
  • ClearML: una plataforma de código abierto que automatiza el seguimiento de experimentos y ayuda a organizar las cargas de trabajo. La ClearML ofrece una interfaz unificada para la gestión de experimentos.

Al aprovechar estas herramientas y metodologías, los profesionales de la IA pueden ir más allá del desarrollo basado en la intuición, asegurándose de que cada mejora de sus redes neuronales esté basada en datos, documentada y sea reproducible.

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora