Yolo Vision Shenzhen
Shenzhen
Únete ahora

Descubre cómo entrenar YOLO más rápidamente con Ultralytics , un entorno integral diseñado para acelerar el proceso desde los datos hasta la implementación.

Amplíe sus proyectos de visión artificial con Ultralytics.

Comience ahora

La semana pasada, Ultralytics la Ultralytics , un espacio de trabajo unificado diseñado para simplificar la forma en que los equipos crean, entrenan e implementan modelos de visión artificial. En lugar de tener que hacer malabarismos con múltiples herramientas, la plataforma reúne todo en un solo lugar. Pasar de la idea a la implementación con modelos de IA de visión artificial se convierte en un proceso sencillo. 

Esto es fundamental, ya que la visión artificial se está convirtiendo rápidamente en un elemento clave de diversos sectores. Es la base de aplicaciones como la inspección en la fabricación, el análisis de datos en el comercio minorista y la navegación autónoma.

La conversión de estas aplicaciones basadas en la visión en sistemas fiables depende de la calidad del entrenamiento de los modelos. El entrenamiento de los modelos consiste en aprender a partir de datos etiquetados para que el modelo pueda reconocer patrones y realizar predicciones precisas. En general, los modelos bien entrenados ofrecen un mejor rendimiento y resultados más fiables en aplicaciones del mundo real.

Sin embargo, entrenar un modelo de visión artificial no siempre es sencillo. Implica diversos aspectos, como la configuración de entornos, la selección de los recursos informáticos adecuados, el ajuste de hiperparámetros y el seguimiento de múltiples experimentos de entrenamiento. Cuando estos pasos se distribuyen entre diferentes herramientas y sistemas, el flujo de trabajo de entrenamiento se vuelve rápidamente complejo y difícil de gestionar.

Ultralytics resuelve este problema al reunir todo el proceso de entrenamiento en un único panel de control unificado. Puedes configurar, ejecutar y supervisar los trabajos de entrenamiento desde un solo lugar, tanto si trabajas en la nube, de forma local o en Google . 

Fig. 1. Una visión general del entrenamiento de modelos en Ultralytics (Fuente)

En este artículo, veremos cómo Ultralytics agiliza el entrenamiento de modelos y por qué puede ofrecerte una ventaja competitiva en tus proyectos de IA visual. ¡Empecemos!

Los modelos de visión artificial aprenden de los datos mediante el entrenamiento de los modelos

Antes de profundizar en cómo funciona el entrenamiento de modelos en Ultralytics , demos primero un paso atrás y repasemos qué es el entrenamiento de modelos y en qué consiste.

El entrenamiento de modelos es el proceso mediante el cual un modelo de visión artificial aprende a interpretar datos visuales. Analiza imágenes o vídeos y ajusta gradualmente sus parámetros internos para realizar con precisión tareas de visión como la detección de objetos, la clasificación de imágenes y la segmentación de instancias. Con el tiempo, el modelo mejora al aprender patrones directamente de los datos que procesa.

La calidad del entrenamiento depende en gran medida de los conjuntos de datos. Puedes imaginarte un conjunto de datos como un juego de fichas que utilizaría un profesor para enseñar a un alumno, en el que cada ejemplo ayuda al modelo a aprender qué debe buscar.

Un conjunto de datos típico de visión artificial incluye imágenes, normalmente en formatos como JPG o PNG, y anotaciones que describen lo que aparece en cada imagen. Estas anotaciones, que suelen almacenarse en archivos JSON o TXT, proporcionan las etiquetas y el contexto que el modelo necesita para aprender de forma eficaz.

Pero el entrenamiento no consiste simplemente en introducir datos en un modelo. Implica varios pasos clave, desde la preparación del conjunto de datos hasta la selección del modelo adecuado y la configuración del proceso de entrenamiento. A continuación, veamos más de cerca algunos de estos pasos.

Una visión general de cómo se preparan los conjuntos de datos

Podría parecer que, una vez que se dispone de un conjunto de datos, se puede empezar a entrenar un modelo de inmediato, pero primero hay que seguir algunos pasos, como dividir el conjunto de datos.

Por lo general, un conjunto de datos se divide en tres partes: el conjunto de entrenamiento, el conjunto de validación y el conjunto de prueba. Las imágenes de entrenamiento se utilizan para enseñar al modelo los patrones presentes en los datos, mientras que el conjunto de validación sirve para supervisar y ajustar el rendimiento durante el entrenamiento. 

El conjunto de prueba se utiliza al final para evaluar el rendimiento del modelo con datos completamente nuevos y desconocidos. Esta configuración ayuda a garantizar que el modelo no se limite a memorizar los datos, sino que sea capaz de generalizar a situaciones del mundo real.

Elegir el modelo adecuado para el entrenamiento

Otro paso importante antes del entrenamiento es elegir el modelo que se desea utilizar. En muchos casos, esto implica seleccionar un modelo preentrenado. Modelos comoYOLO Ultralytics YOLO ya han sido entrenados con grandes conjuntos de datos y han aprendido patrones visuales generales, lo que los convierte en un excelente punto de partida.

El uso de estos modelos es un ejemplo de aprendizaje por transferencia, en el que se parte de los conocimientos existentes y se adapta el modelo a una tarea concreta. Este enfoque ayuda a acelerar el entrenamiento y a mejorar los resultados, sobre todo cuando se trabaja con datos limitados.

Estos modelos también están disponibles en diferentes tamaños, cada uno de los cuales ofrece un equilibrio entre velocidad y precisión. Los modelos más pequeños son más rápidos y eficientes, mientras que los más grandes suelen ofrecer una mayor precisión, pero requieren más recursos de cálculo.

Configuración de los parámetros de entrenamiento para modelos de visión

Una vez que tengas un conjunto de datos preparado y hayas seleccionado un modelo, el siguiente paso es configurar cómo aprende el modelo.

Un modelo de visión artificial se entrena utilizando un conjunto de parámetros que determinan cómo procesa los datos, actualiza sus pesos y mejora con el tiempo. Estos ajustes influyen directamente tanto en la velocidad del entrenamiento como en la precisión final, por lo que son esenciales para obtener buenos resultados.

Estos son algunos de los parámetros de entrenamiento más utilizados:

  • Épocas: indica cuántas veces recorre el modelo todo el conjunto de datos durante el entrenamiento. Al aumentar el número de épocas, el modelo tiene más oportunidades de aprender patrones a partir de los datos.
  • Tamaño del lote: es el número de imágenes que se procesan juntas en un solo paso del entrenamiento. Los lotes más grandes pueden acelerar el entrenamiento, pero requieren más memoria.
  • Tamaño de la imagen: especifica la resolución de las imágenes de entrada utilizadas durante el entrenamiento. Una resolución más alta puede mejorar la precisión de la detección, pero aumenta el coste computacional.
  • Tasa de aprendizaje: es la velocidad a la que el modelo actualiza sus parámetros internos durante el entrenamiento. Unos valores demasiado altos o demasiado bajos pueden provocar inestabilidad en el entrenamiento.
  • Optimizador: es el algoritmo encargado de actualizar los parámetros del modelo en función del error calculado durante cada iteración del entrenamiento.

En los flujos de trabajoYOLO Ultralytics , estas configuraciones suelen definirse en un archivo YAML. Este archivo especifica las rutas de los conjuntos de datos, los nombres de las clases y cómo se dividen los datos. Actúa como una configuración central que indica al modelo cómo interpretar el conjunto de datos.

De flujos de trabajo fragmentados a una experiencia unificada con Ultralytics

Acabamos de analizar algunos de los pasos clave que implica el entrenamiento de un modelo de visión artificial, desde la preparación de los conjuntos de datos hasta la selección del modelo y la configuración de los parámetros de entrenamiento. En la práctica, el proceso suele ir más allá e incluye la realización de experimentos de seguimiento, la comparación de múltiples rondas de entrenamiento y el perfeccionamiento continuo de los modelos a lo largo del tiempo.

Estos pasos rara vez se gestionan en un único lugar. Los conjuntos de datos pueden prepararse en una herramienta, los procesos de entrenamiento ejecutarse en otro entorno y el seguimiento de los experimentos gestionarse por separado. A medida que los proyectos crecen, esta fragmentación aumenta la complejidad, ralentiza las iteraciones y dificulta mantener todo organizado.

Ultralytics elimina esta complejidad al reunir todo el flujo de trabajo de entrenamiento en un único entorno. En lugar de tener que cambiar de una herramienta a otra, puedes gestionar conjuntos de datos, configurar el entrenamiento, realizar experimentos y supervisar los resultados, todo ello desde un mismo lugar.

A continuación, veamos cómo Ultralytics optimiza el entrenamiento de modelos. 

Opciones de entrenamiento compatibles con Ultralytics

En aplicaciones del mundo real, el entrenamiento de un modelo de visión artificial suele requerir entornos flexibles. Dependiendo del tamaño del conjunto de datos, la complejidad del modelo y el hardware disponible, puedes optar por ejecutar el entrenamiento en la nube, en un equipo local o mediante entornos de notebook externos.

Ultralytics ofrece las siguientes opciones de formación para satisfacer estas necesidades:

  • Entrenamiento en la nube: el entrenamiento se lleva a cabo en unidades de procesamiento gráfico (GPU) Ultralytics. Esta opción es ideal para conjuntos de datos de gran tamaño o modelos más complejos que requieren importantes recursos computacionales.
  • Entrenamiento local: esta opción utiliza el hardware disponible en tu equipo y resulta ideal para realizar experimentos rápidos, probar configuraciones o trabajar con conjuntos de datos más pequeños. Para cargas de trabajo más escalables, el entrenamiento también se puede ejecutar en tu propio entorno de nube, como AWS o GCP.
  • Google : Con Ultralytics , puedes ejecutar modelos entrenados en el entorno de cuadernos alojados Google , lo que permite un flujo de trabajo flexible y basado en navegador sin necesidad de configurar un equipo local.

Descubre la formación sobre la nube en Ultralytics

En lo que respecta a los proyectos de visión artificial, entrenar modelos de forma local o mediante entornos de notebook no siempre resulta fácil.

Por ejemplo, en el caso del entrenamiento local, el rendimiento depende totalmente del hardware, lo que puede limitar la potencia de cálculo y ralentizar la experimentación. Las GPU son esenciales para un entrenamiento eficiente, pero no todas las configuraciones cuentan con un acceso fiable a ellas. 

Aunque entornos de cuadernos de trabajo como Google ofrecen una alternativa al proporcionar GPU en la nube, las sesiones suelen ser temporales y pueden interrumpir los procesos de entrenamiento más largos. A medida que los conjuntos de datos crecen y los flujos de trabajo se vuelven más complejos, estas limitaciones pueden convertirse rápidamente en cuellos de botella, lo que ralentiza el entrenamiento y lo hace menos fiable.

Ultralytics resuelve este problema con su opción de entrenamiento en la nube. Ofrece un entorno listo para usar en el que Python y los marcos de trabajo como PyTorch preconfigurados, lo que te permite comenzar el entrenamiento sin necesidad de configuraciones adicionales.

Desde un único panel de control, puedes iniciar tareas de entrenamiento y supervisar su progreso en tiempo real. Esto te permite centrarte en mejorar tus modelos en lugar de tener que gestionar la infraestructura.

Ahora, veamos cómo empezar con la formación sobre la nube en Ultralytics .

Paso 1: Selecciona un modelo básico

El primer paso es elegir un modelo base para tu proceso de entrenamiento. Puedes seleccionar un YOLO Ultralytics ya entrenado, clonar un modelo de la comunidad o cargar tus propios pesos preentrenados para satisfacer requisitos personalizados.

La plataforma es compatible con todosYOLO Ultralytics , incluido Ultralytics , Ultralytics YOLO11, Ultralytics YOLOv8, y Ultralytics YOLOv5, cada uno disponible en diferentes variantes de tamaño, como nano (n), pequeño (s), mediano (m), grande (l) y extragrande (x). Con diferentes variantes de modelo que ofrecen un equilibrio entre velocidad y precisión, puedes elegir el modelo que mejor se adapte a tus requisitos de rendimiento y computación.

Estos modelos admiten una amplia gama de tareas de visión artificial con las queYOLO Ultralytics YOLO ya están familiarizados, entre las que se incluyen la detección de objetos, la segmentación de instancias, la clasificación de imágenes, la detección de cuadros delimitadores orientados (OBB) y la estimación de la pose.

Si tienes requisitos específicos, también puedes cargar tus propios pesos de modelo preentrenados. Esto significa que puedes continuar entrenando o ajustar un modelo existente, como un detector de objetos, dentro de la plataforma, en lugar de empezar desde cero. Resulta especialmente útil si ya has entrenado un modelo en otro lugar o si deseas adaptar un modelo a un caso de uso más específico.

Paso 2: Selecciona un conjunto de datos

El siguiente paso es seleccionar un conjunto de datos para el entrenamiento. En la Ultralytics , puedes utilizar conjuntos de datos ya existentes, como el COCO , clonar conjuntos de datos de la comunidad o subir tu propio conjunto de datos personalizado, adaptado a tu aplicación específica.

La plataforma es compatible con formatos de anotación habituales, como Ultralytics YOLO COCO, y también admite la subida de imágenes sin procesar si tienes pensado anotar datos personalizados directamente en la plataforma.

Una vez cargados, los conjuntos de datos se procesan automáticamente, lo que incluye la validación, la normalización, el análisis de etiquetas y la generación de estadísticas. Esto te permite obtener una visión inmediata de tus datos, incluidas las distribuciones de clases y la estructura del conjunto de datos, y ayuda a garantizar que todo esté listo para el entrenamiento.

Los conjuntos de datos también se vinculan automáticamente a las ejecuciones de entrenamiento, lo que te permite track datos se utilizaron para cada modelo y mantener la coherencia entre los distintos experimentos.

Paso 3: Configurar los parámetros de entrenamiento

Una vez seleccionado el conjunto de datos, puedes configurar los parámetros de entrenamiento que determinan cómo aprende el modelo. Entre ellos se incluyen el número de épocas, el tamaño del lote, el tamaño de las imágenes y el nombre de la ejecución para el registro de entrenamiento. Muchos de estos parámetros influyen tanto en la duración del entrenamiento como en el rendimiento final del modelo.

Para un entrenamiento más controlado, la plataforma también permite ajustar parámetros avanzados, como la tasa de aprendizaje, el tipo de optimizador, la configuración del aumento de color y otras opciones de entrenamiento. Estos ajustes permiten afinar el proceso de entrenamiento para mejorar la precisión y la estabilidad del modelo.

Paso 4: Selecciona una GPU

A continuación, puedes seleccionar la GPU para tu sesión de entrenamiento. La elección de GPU adecuada GPU de factores como el tamaño del conjunto de datos, el tamaño del lote, la resolución de las imágenes y la complejidad del modelo. Encontrar el equilibrio adecuado ayuda a mantener la eficiencia del entrenamiento sin utilizar más recursos de cálculo de los necesarios.

Ultralytics ofrece 22 GPU con diferentes niveles de VRAM (memoria de la GPU) y potencia de cálculo, lo que permite gestionar desde pequeñas tareas hasta cargas de trabajo a gran escala.

De este modo, podrás adaptar el hardware a tus necesidades específicas, tanto si estás entrenando modelos ligeros como si trabajas con conjuntos de datos grandes y complejos. Para obtener más información, consulta la lista de GPU disponibles en la páginade documentación sobre entrenamiento de la plataforma Ultralytics .

Fig. 2. Algunas de las GPU habilitadas a través de Ultralytics (Fuente)

Paso 5: Empieza la formación sobre la nube

Una vez seleccionados el modelo, el conjunto de datos, los parámetros de entrenamiento y la opción de cálculo, iniciar una sesión de entrenamiento es muy rápido. Desde el panel de control, puedes iniciar el entrenamiento con un solo clic, y la plataforma se encarga del resto: inicializa el entorno y ejecuta el trabajo en la GPU seleccionada.

Una vez que comience el entrenamiento, podrá supervisar el progreso directamente desde la plataforma. La pestaña «Entrenamiento» ofrece información en tiempo real sobre métricas clave, como los indicadores de rendimiento, las curvas de pérdidas, el uso del sistema y los registros de entrenamiento en directo.

Si quieres saber más sobre el entrenamiento local o sobre cómo utilizar Google con Ultralytics , puedes consultar otros tutoriales en ladocumentación oficial dela plataforma Ultralytics .

Evaluación y comparación de modelos en Ultralytics

Una vez finalizado el entrenamiento, el siguiente paso es evaluar el rendimiento de tu modelo. En Ultralytics , puedes comparar varias ejecuciones de entrenamiento dentro de un mismo proyecto, lo que te ofrece una visión clara del rendimiento de los distintos experimentos.

Al desarrollar modelos, el entrenamiento suele repetirse varias veces con diferentes parámetros, como el cambio de la tasa de aprendizaje, el tamaño del lote o el tamaño del modelo, con el fin de mejorar los resultados. Cada una de estas ejecuciones genera un modelo ligeramente diferente, por lo que compararlos resulta fundamental.

Los proyectos sirven de centro neurálgico donde se organizan conjuntamente los modelos y los experimentos. Permiten track , revisar los resultados y mantener la concentración sin tener que cambiar entre diferentes herramientas o vistas.

Desde esta vista unificada, también puedes analizar métricas clave de rendimiento, como la precisión, la recuperación y mAP precisión media), para comprender el rendimiento de tu modelo en las diferentes clases. Además, puedes comparar las ejecuciones de entrenamiento en paralelo para identificar qué configuraciones ofrecen los mejores resultados. 

Para complementar estos parámetros, puedes utilizar la pestaña «Predict» para probar rápidamente los modelos entrenados con imágenes o datos de muestra, lo que te ayudará a validar visualmente el rendimiento y detectar posibles problemas.

Con esta información, puedes seleccionar el modelo con mejor rendimiento —que suele guardarse como punto de control «best.pt»— y pasar a la siguiente fase, ya sea una evaluación más exhaustiva, el uso del modelo para realizar inferencias o la implementación del modelo a través de la plataforma.

Fig. 3. Ejemplo de visualización de métricas en Ultralytics (Fuente)

Cálculo del coste de la formación en la Ultralytics

El entrenamiento de modelos de detección de objetos en la nube conlleva costes de computación, especialmente cuando se utilizan GPU de alto rendimiento. Para facilitar este proceso, Ultralytics ofrece una estimación de los costes antes de que comience el entrenamiento.

Te ofrece una visión clara del uso previsto, lo que te ayuda a planificar las cargas de trabajo, gestionar los presupuestos y evitar gastos inesperados antes de iniciar un trabajo de entrenamiento. A continuación te explicamos cómo puedes consultar los costes estimados antes de iniciar el entrenamiento.

Cómo se calcula la duración del entrenamiento

Para calcular el coste con precisión, la plataforma calcula primero cuánto tiempo durará una sola época de entrenamiento. Esto depende de factores como el tamaño del conjunto de datos, el tamaño del modelo, la resolución de las imágenes, el tamaño del lote y la velocidad de la GPU seleccionada.

A partir de estos datos, calcula el tiempo estimado por época y lo extrapola a toda la sesión de entrenamiento. La duración total se calcula sumando el tiempo de todas las épocas y añadiendo un pequeño margen inicial.

La sobrecarga corresponde a tareas como la inicialización del entorno, la carga de los conjuntos de datos y la preparación de GPU, lo que garantiza que la estimación refleje el proceso de entrenamiento completo, y no solo el bucle de entrenamiento.

Cómo se calcula el coste de la formación

Una vez calculado el tiempo total de entrenamiento, la plataforma lo convierte en un coste utilizando la tarifa por hora GPU seleccionada.

Si combinamos la duración del entrenamiento con GPU , podemos obtener una estimación clara de cuánto costará la ejecución incluso antes de que comience.

Disponer de información previa facilita el ajuste de la configuración, como optimizar los parámetros de entrenamiento o seleccionar una GPU diferente, lo que te permite equilibrar el rendimiento y el coste de forma más eficaz.

Fig. 4. Configuración del entrenamiento del modelo y estimación de costes en Ultralytics (Fuente)

Ventajas clave del uso de la Ultralytics para el entrenamiento de modelos

Hasta ahora, hemos repasado los pasos clave que implica el entrenamiento de modelos de visión artificial y cómo se integran en la Ultralytics . 

Además de estas funciones básicas, existen otras capacidades que mejoran el flujo de trabajo de entrenamiento. A continuación se ofrece una descripción general de algunas de las principales ventajas de utilizar Ultralytics para el entrenamiento de modelos:

  • Reproducibilidad de los experimentos integrada: cada sesión de entrenamiento se registra automáticamente con su configuración completa, incluyendo el modelo, el conjunto de datos, los parámetros y la configuración de cálculo. Esto facilita volver a revisar los experimentos y reproducir los resultados de forma fiable.
  • Información sobre el entrenamiento a lo largo del tiempo: en lugar de limitarte a consultar los resultados finales, puedes track del rendimiento a lo largo de las épocas, lo que te ayudará a comprender mejor el comportamiento del modelo durante el entrenamiento.
  • Menores costes operativos: al encargarse de la configuración del entorno, la gestión de dependencias y la infraestructura en segundo plano, la plataforma te permite centrarte más en el desarrollo de modelos y menos en la configuración.
  • Organización centralizada de los experimentos: los proyectos sirven como un único punto de gestión de modelos, conjuntos de datos y sesiones de entrenamiento, lo que ayuda a mantener la estructura de los experimentos a medida que los flujos de trabajo se vuelven más complejos.

Conclusiones clave

El entrenamiento es una de las etapas más importantes del ciclo de vida de un modelo de aprendizaje automático. Determina la precisión con la que un modelo puede reconocer e interpretar los datos visuales. 

Al combinar la configuración de los datos de entrenamiento, la supervisión, la comparación de experimentos y la estimación de costes en un único entorno, la Ultralytics agiliza el proceso de creación de modelos de visión artificial de alto rendimiento y su preparación para su implementación.

Echa un vistazo a nuestra comunidad, que no deja de crecer, y a nuestro repositorio de GitHub para obtener más información sobre la visión artificial. Si estás pensando en desarrollar soluciones de visión artificial, consulta nuestras opciones de licencia. Explora nuestras páginas de soluciones para conocer mejor las ventajas de la visión artificial en la industria manufacturera y de la inteligencia artificial en la agricultura.

¡Construyamos juntos el futuro de la IA!

Comience su viaje con el futuro del aprendizaje automático