Al hacer clic en “Aceptar todas las cookies”, aceptas el almacenamiento de cookies en tu dispositivo para mejorar la navegación del sitio, analizar el uso del sitio y ayudar en nuestros esfuerzos de marketing. Más información
Configuración de cookies
Al hacer clic en “Aceptar todas las cookies”, aceptas el almacenamiento de cookies en tu dispositivo para mejorar la navegación del sitio, analizar el uso del sitio y ayudar en nuestros esfuerzos de marketing. Más información
Descubre cómo la integración de Roboflow puede simplificar el entrenamiento personalizado de Ultralytics YOLO11 al hacer que los conjuntos de datos de visión artificial de código abierto sean fácilmente accesibles.
El entrenamiento de un modelo de visión artificial como Ultralytics YOLO11 normalmente implica la recopilación de imágenes para tu conjunto de datos, su anotación, la preparación de los datos y el ajuste del modelo para satisfacer tus requisitos específicos. Si bien el paquete de Python de Ultralytics hace que estos pasos sean sencillos y fáciles de usar, el desarrollo de Vision AI puede seguir llevando mucho tiempo.
Esto se hace particularmente cierto cuando se trabaja con un plazo de entrega ajustado o se desarrolla un prototipo. En estas situaciones, contar con herramientas o integraciones que simplifiquen partes del proceso - como la optimización de la preparación del conjunto de datos o la automatización de tareas repetitivas - puede marcar una gran diferencia. Al reducir el tiempo y el esfuerzo necesarios, estas soluciones te ayudan a centrarte en la construcción y el perfeccionamiento de tu modelo. Eso es exactamente lo que ofrece la integración de Roboflow.
La integración de Roboflow te permite acceder fácilmente a conjuntos de datos de Roboflow Universe, una gran biblioteca de conjuntos de datos de visión artificial de código abierto. En lugar de pasar horas recopilando y organizando datos, puedes encontrar y utilizar rápidamente conjuntos de datos existentes para impulsar tu proceso de entrenamiento de YOLO11. Esta integración hace que sea mucho más rápido y sencillo experimentar e iterar en el desarrollo de tu modelo de visión artificial.
En este artículo, profundizaremos en cómo puedes aprovechar la integración de Roboflow para un desarrollo de modelos más rápido. ¡Empecemos!
¿Qué es Roboflow Universe?
Roboflow Universe es una plataforma mantenida por Roboflow, una empresa centrada en simplificar el desarrollo de la visión artificial. Consta de más de 350 millones de imágenes, 500.000 conjuntos de datos y 100.000 modelos ajustados para tareas como la detección de objetos, la clasificación de imágenes y la segmentación. Con contribuciones de desarrolladores e investigadores de todo el mundo, Roboflow Universe es un centro de colaboración para cualquiera que busque impulsar o mejorar sus proyectos de visión artificial.
Fig. 1. Ejemplos de conjuntos de datos de detección de objetos en Roboflow Universe.
Roboflow Universe incluye las siguientes características clave:
Herramientas de exploración de conjuntos de datos: Explora, filtra y visualiza conjuntos de datos para encontrar rápidamente los recursos que se ajusten a los requisitos de tu proyecto.
Opciones de exportación: Exporta datos en formatos como COCO, YOLO, TFRecord, CSV y más para que se adapten a tu flujo de trabajo.
Análisis de conjuntos de datos: Obtén información sobre varios conjuntos de datos con herramientas de análisis que proporcionan visualizaciones de las distribuciones de etiquetas, los desequilibrios de clases y la calidad del conjunto de datos.
Seguimiento de versiones: Visualiza y accede a diferentes versiones de conjuntos de datos subidos por los colaboradores, lo que te permite realizar un seguimiento de las actualizaciones, comparar los cambios y elegir la versión que mejor se adapte a las necesidades de tu proyecto.
La integración de Roboflow te ayuda a encontrar los datos correctos
Encontrar el conjunto de datos adecuado es a menudo una de las partes más difíciles de la construcción de un modelo de visión artificial. La creación de un conjunto de datos suele implicar la recopilación de grandes cantidades de imágenes, asegurándose de que sean relevantes para tu tarea y, a continuación, etiquetándolas con precisión.
Este proceso puede consumir mucho tiempo y recursos, especialmente si estás experimentando con diferentes enfoques en un corto período de tiempo. Incluso encontrar conjuntos de datos preexistentes puede ser complicado, ya que a menudo están dispersos en diferentes plataformas, no están documentados correctamente o carecen de las anotaciones específicas que necesitas.
Por ejemplo, si estás construyendo una aplicación de visión artificial para detectar malas hierbas en campos agrícolas, es posible que desees probar diferentes enfoques de Vision AI, como la detección de objetos frente a la segmentación de instancias. Esto te permite experimentar y averiguar qué método funciona mejor antes de dedicar tiempo y esfuerzo a recopilar y etiquetar tu propio conjunto de datos.
Fig. 2. Detección de piezas de automóviles utilizando YOLO11.
Utilizando la integración de Roboflow, puedes navegar a través de una variedad de conjuntos de datos relacionados con la agricultura, incluyendo aquellos enfocados en la detección de malas hierbas, la salud de los cultivos o el monitoreo de campos. Estos conjuntos de datos listos para usar te permiten probar diferentes técnicas y refinar tu modelo sin el esfuerzo inicial de crear tus propios datos.
Cómo funciona la integración de Roboflow
Ahora que hemos discutido cómo puedes utilizar la integración de Roboflow para encontrar los conjuntos de datos adecuados, veamos cómo encaja en tu flujo de trabajo. Una vez que hayas elegido un conjunto de datos de Roboflow Universe, puedes exportarlo o descargarlo en el formato YOLO11. Después de exportar tu conjunto de datos, puedes utilizarlo para entrenar YOLO11 de forma personalizada utilizando el paquete de Python de Ultralytics.
Mientras descargas tu conjunto de datos, es posible que notes que Roboflow Universe también admite otros formatos para entrenar diferentes modelos. Entonces, ¿por qué deberías elegir entrenar Ultralytics YOLO11 de forma personalizada?
YOLO11 es la última versión de los modelos YOLO de Ultralytics y está construido para ofrecer una detección de objetos más rápida y precisa. Utiliza un 22% menos de parámetros (los valores internos que un modelo ajusta durante el entrenamiento para hacer predicciones) que YOLOv8m, pero alcanza una mayor precisión media (mAP) en el conjunto de datos COCO. Este equilibrio entre velocidad y precisión hace de YOLO11 una opción versátil para una amplia gama de aplicaciones de visión artificial, especialmente cuando se entrenan modelos personalizados para adaptarse a tareas específicas.
Alimentación de datos: El modelo YOLO11 procesa tu conjunto de datos, aprendiendo a detectar y clasificar objetos a partir de las imágenes y sus anotaciones.
Predicción y retroalimentación: El modelo hace predicciones sobre los objetos en las imágenes y las compara con las respuestas correctas proporcionadas en el conjunto de datos.
Seguimiento del rendimiento: Se supervisan métricas como la precisión (detecciones correctas), la exhaustividad (detecciones perdidas) y la pérdida (errores de predicción) para evaluar el progreso.
Aprendizaje iterativo: El modelo ajusta sus parámetros a lo largo de múltiples rondas (épocas) para mejorar la precisión de la detección y minimizar los errores.
Resultado final del modelo: Después del entrenamiento, el modelo optimizado se guarda y está listo para su implementación.
Otras integraciones centradas en el desarrollo de visión artificial
Al explorar la integración de Roboflow, notará otras integraciones mencionadas en la documentación de Ultralytics. Admitimos una variedad de integraciones relacionadas con varias etapas del desarrollo de la visión artificial.
Esto es para proporcionar a nuestra comunidad una gama de opciones, para que pueda elegir lo que mejor se adapte a su flujo de trabajo específico.
Fig 3. Una descripción general de las integraciones compatibles con Ultralytics.
Además de los conjuntos de datos, otras integraciones compatibles con Ultralytics se centran en varias partes del proceso de visión artificial, como el entrenamiento, la implementación y la optimización. Aquí hay algunos ejemplos de otras integraciones que admitimos:
Integraciones de entrenamiento: Integraciones como Amazon SageMaker y Paperspace Gradient agilizan los flujos de trabajo de entrenamiento al ofrecer plataformas basadas en la nube para el desarrollo y las pruebas eficientes de modelos.
Integraciones de seguimiento de flujos de trabajo y experimentos: ClearML, MLFlow y Weights & Biases (W&B) ayudan a automatizar los flujos de trabajo, rastrear experimentos y mejorar la colaboración, lo que facilita la gestión de proyectos de aprendizaje automático.
Integraciones de optimización e implementación: CoreML, ONNX y OpenVINO permiten una implementación optimizada en varios dispositivos y marcos, lo que garantiza un rendimiento eficiente en plataformas como el hardware de Apple y las CPU de Intel.
Integraciones de monitorización y visualización: TensorBoard y Weights & Biases proporcionan herramientas para visualizar el progreso del entrenamiento y monitorizar el rendimiento, lo que proporciona información detallada para refinar los modelos.
Aplicaciones de YOLO11 y el papel de las integraciones
Las integraciones que admiten el desarrollo de la visión artificial, combinadas con las capacidades confiables de YOLO11, facilitan la resolución de desafíos del mundo real. Considere innovaciones como la visión artificial en la fabricación, donde la visión artificial se utiliza para detectar defectos en una línea de producción, como arañazos en piezas metálicas o componentes faltantes. La recopilación de los datos correctos para tales tareas a menudo puede ser lenta y desafiante, lo que requiere acceso a entornos especializados.
Por lo general, implica la instalación de cámaras o sensores a lo largo de las líneas de producción para capturar imágenes de los productos. Estas imágenes deben tomarse en grandes volúmenes, a menudo bajo una iluminación y ángulos consistentes, para garantizar la claridad y la uniformidad.
Una vez capturadas, las imágenes deben anotarse meticulosamente con etiquetas precisas para cada tipo de defecto, como arañazos, abolladuras o componentes faltantes. Este proceso requiere mucho tiempo y recursos, así como experiencia, para asegurarse de que el conjunto de datos refleje con precisión la variabilidad del mundo real. Se deben tener en cuenta factores como los diferentes tamaños, formas y materiales de los defectos para crear un conjunto de datos robusto y confiable.
Las integraciones que proporcionan conjuntos de datos listos para usar facilitan tareas como el control de calidad industrial, y con las capacidades de detección en tiempo real de YOLO11, los fabricantes pueden monitorizar las líneas de producción, detectar defectos al instante y mejorar la eficiencia.
Fig. 4. Un ejemplo del uso de Ultralytics YOLO11 para detectar y contar latas en una línea de producción.
Más allá de la fabricación, las integraciones relacionadas con los conjuntos de datos se pueden utilizar en muchas otras industrias. Al combinar la velocidad y la precisión de YOLO11 con conjuntos de datos de fácil acceso, las empresas pueden desarrollar e implementar rápidamente soluciones adaptadas a sus necesidades específicas. Tomemos, por ejemplo, la atención médica: las integraciones de conjuntos de datos pueden ayudar a desarrollar soluciones para analizar imágenes médicas para detectar anomalías como tumores. Del mismo modo, en la conducción autónoma, tales integraciones pueden ayudar a identificar vehículos, peatones y señales de tráfico para mejorar la seguridad.
Conclusiones clave
Encontrar el conjunto de datos correcto es a menudo una de las partes más lentas de la creación de un modelo de visión artificial. Sin embargo, la integración de Roboflow facilita la búsqueda del mejor conjunto de datos para el entrenamiento personalizado de sus modelos Ultralytics YOLO, incluso si es nuevo en la visión artificial.
Con acceso a una vasta colección de conjuntos de datos para tareas de visión artificial como la detección de objetos, la clasificación de imágenes o la segmentación de instancias, Roboflow Universe elimina la molestia del proceso de descubrimiento de datos. Le ayuda a comenzar rápidamente y a concentrarse en la construcción de su modelo en lugar de dedicar tiempo a recopilar y organizar datos. Este enfoque optimizado permite a los desarrolladores prototipar, iterar y desarrollar soluciones de visión artificial de manera más eficiente.