Al hacer clic en “Aceptar todas las cookies”, aceptas el almacenamiento de cookies en tu dispositivo para mejorar la navegación del sitio, analizar el uso del sitio y ayudar en nuestros esfuerzos de marketing. Más información
Configuración de cookies
Al hacer clic en “Aceptar todas las cookies”, aceptas el almacenamiento de cookies en tu dispositivo para mejorar la navegación del sitio, analizar el uso del sitio y ayudar en nuestros esfuerzos de marketing. Más información
Descubra cómo la integración de Roboflow puede simplificar la formación personalizada Ultralytics YOLO11 facilitando el acceso a conjuntos de datos de visión por ordenador de código abierto.
Entrenamiento de un modelo de visión por ordenador como Ultralytics YOLO11 normalmente implica recopilar imágenes para su conjunto de datos, anotarlas, preparar los datos y ajustar el modelo para satisfacer sus requisitos específicos. Aunque el paquetePython de Ultralytics hace que estos pasos sean sencillos y fáciles de seguir, el desarrollo de la IA de visión puede llevar mucho tiempo.
Esto es especialmente cierto cuando se trabaja con plazos ajustados o se desarrolla un prototipo. En estas situaciones, contar con herramientas o integraciones que simplifiquen partes del proceso, como la agilización de la preparación de conjuntos de datos o la automatización de tareas repetitivas, puede suponer una gran diferencia. Al reducir el tiempo y el esfuerzo necesarios, estas soluciones le ayudan a centrarse en construir y perfeccionar su modelo. Eso es exactamente lo que ofrece la integración de Roboflow .
La integración de Roboflow le permite acceder fácilmente a los conjuntos de datos de Roboflow Universe, una gran biblioteca de conjuntos de datos de visión por ordenador de código abierto. En lugar de pasar horas recopilando y organizando datos, puede encontrar y utilizar rápidamente los conjuntos de datos existentes para poner en marcha el proceso de formación YOLO11 . Esta integración agiliza y simplifica la experimentación y la iteración en el desarrollo de modelos de visión por ordenador.
En este artículo, nos sumergiremos en cómo puede aprovechar la integración de Roboflow para un desarrollo más rápido del modelo. Pongámonos manos a la obra.
¿Qué es Roboflow Universe?
Roboflow Universe es una plataforma mantenida por Roboflow, una empresa centrada en simplificar el desarrollo de la visión por ordenador. Consta de más de 350 millones de imágenes, 500.000 conjuntos de datos y 100.000 modelos perfeccionados para tareas como la detección de objetos, la clasificación de imágenes y la segmentación. Con contribuciones de desarrolladores e investigadores de todo el mundo, Roboflow Universe es un centro de colaboración para cualquiera que desee poner en marcha o mejorar sus proyectos de visión por ordenador.
Fig. 1. Ejemplos de conjuntos de datos de detección de objetos en Roboflow Universe.
Roboflow Universe incluye las siguientes características clave:
Herramientas de exploración de conjuntos de datos: Explora, filtra y visualiza conjuntos de datos para encontrar rápidamente los recursos que se ajusten a los requisitos de tu proyecto.
Opciones de exportación: Exporta datos en formatos como COCO, YOLO, TFRecord, CSV, etc. para adaptarlos a tu flujo de trabajo.
Análisis de conjuntos de datos: Obtén información sobre varios conjuntos de datos con herramientas de análisis que proporcionan visualizaciones de las distribuciones de etiquetas, los desequilibrios de clases y la calidad del conjunto de datos.
Seguimiento de versiones: Vea y acceda a las distintas versiones de los conjuntos de datos cargados por los colaboradores, lo que le permitirá track las actualizaciones, comparar los cambios y elegir la versión que mejor se adapte a las necesidades de su proyecto.
La integración de Roboflow le ayuda a encontrar los datos correctos
Encontrar el conjunto de datos adecuado es a menudo una de las partes más difíciles de la construcción de un modelo de visión artificial. La creación de un conjunto de datos suele implicar la recopilación de grandes cantidades de imágenes, asegurándose de que sean relevantes para tu tarea y, a continuación, etiquetándolas con precisión.
Este proceso puede consumir mucho tiempo y recursos, especialmente si estás experimentando con diferentes enfoques en un corto período de tiempo. Incluso encontrar conjuntos de datos preexistentes puede ser complicado, ya que a menudo están dispersos en diferentes plataformas, no están documentados correctamente o carecen de las anotaciones específicas que necesitas.
Por ejemplo, si está creando una aplicación de visión por ordenador para detect malas hierbas en campos agrícolas, puede que desee probar diferentes enfoques de Vision AI, como la detección de objetos frente a la segmentación de instancias. Esto le permitirá experimentar y averiguar qué método funciona mejor antes de dedicar tiempo y esfuerzo a recopilar y etiquetar su propio conjunto de datos.
Fig. 2. Detección de piezas de automóviles con YOLO11.
Gracias a la integración de Roboflow , puede explorar diversos conjuntos de datos relacionados con la agricultura, incluidos los centrados en la detección de malas hierbas, la salud de los cultivos o la supervisión de los campos. Estos conjuntos de datos listos para usar le permiten probar diferentes técnicas y perfeccionar su modelo sin el esfuerzo inicial de crear sus propios datos.
Cómo funciona la integración de Roboflow
Ahora que ya hemos hablado de cómo puede utilizar la integración Roboflow para encontrar los conjuntos de datos adecuados, veamos cómo encaja en su flujo de trabajo. Una vez que haya elegido un conjunto de datos de Roboflow Universe, puede exportarlo o descargarlo en el formato YOLO11 . Una vez exportado el conjunto de datos, puede utilizarlo para entrenar YOLO11 de forma personalizada utilizando el paquete Ultralytics Python .
Al descargar el conjunto de datos, es posible que observe que Roboflow Universe también admite otros formatos para el entrenamiento de diferentes modelos. Entonces, ¿por qué elegir el entrenamiento personalizado de Ultralytics YOLO11?
YOLO11 es la última versión de los modelosYOLO Ultralytics y está diseñada para ofrecer una detección de objetos más rápida y precisa. Utiliza un 22% menos de parámetros (los valores internos que un modelo ajusta durante el entrenamiento para realizar predicciones) que YOLOv8m, pero consigue una precisión mediamAP) superior en el conjunto de datos COCO . Este equilibrio entre velocidad y precisión hace de YOLO11 una opción versátil para una amplia gama de aplicaciones de visión por ordenador, especialmente cuando se trata de modelos de entrenamiento personalizados para tareas específicas.
Alimentación de datos: El modelo YOLO11 procesa tu conjunto de datos, aprendiendo a detect y classify objetos a partir de las imágenes y sus anotaciones.
Predicción y retroalimentación: El modelo hace predicciones sobre los objetos en las imágenes y las compara con las respuestas correctas proporcionadas en el conjunto de datos.
Seguimiento del rendimiento: Se supervisan métricas como la precisión (detecciones correctas), la exhaustividad (detecciones perdidas) y la pérdida (errores de predicción) para evaluar el progreso.
Aprendizaje iterativo: El modelo ajusta sus parámetros a lo largo de múltiples rondas (épocas) para mejorar la precisión de la detección y minimizar los errores.
Resultado final del modelo: Después del entrenamiento, el modelo optimizado se guarda y está listo para su implementación.
Otras integraciones centradas en el desarrollo de visión artificial
A medida que explore la integración Roboflow , observará otras integraciones mencionadas en la documentaciónUltralytics . Apoyamos una variedad de integraciones relacionadas con diversas etapas del desarrollo de la visión por ordenador.
Esto es para proporcionar a nuestra comunidad una gama de opciones, para que pueda elegir lo que mejor se adapte a su flujo de trabajo específico.
Fig. 3. Visión general de las integraciones soportadas por Ultralytics.
Además de los conjuntos de datos, otras integracionesUltralytics se centran en diversas partes del proceso de visión por ordenador, como la formación, el despliegue y la optimización. Estos son algunos ejemplos de otras integraciones que apoyamos:
Integraciones de formación: Las integraciones como Amazon SageMaker y Paperspace Gradient agilizan los flujos de trabajo de formación al ofrecer plataformas basadas en la nube para el desarrollo y la comprobación eficientes de modelos.
Integraciones de flujo de trabajo y seguimiento de experimentos: ClearML, MLFlow y Weights & Biases (W&B) ayudan a automatizar los flujos de trabajo, track los experimentos y mejorar la colaboración, lo que facilita la gestión de los proyectos de aprendizaje automático.
Optimización e integraciones de despliegue: CoreML, ONNX y OpenVINO permiten un despliegue optimizado en varios dispositivos y marcos de trabajo, garantizando un rendimiento eficiente en plataformas como el hardware de Apple y las CPU de Intel .
Integraciones de supervisión y visualización: TensorBoard y Weights & Biases proporcionan herramientas para visualizar el progreso del entrenamiento y supervisar el rendimiento, ofreciendo información detallada para perfeccionar los modelos.
Aplicaciones de YOLO11 y papel de las integraciones
Las integraciones que apoyan el desarrollo de la visión por ordenador, combinadas con las fiables capacidades de YOLO11, facilitan la resolución de retos del mundo real. Consideremos innovaciones como la visión por ordenador en la fabricación, donde la IA de visión se utiliza para detect defectos en una línea de producción, como arañazos en piezas metálicas o componentes que faltan. Recopilar los datos adecuados para este tipo de tareas suele ser lento y complicado, y requiere acceder a entornos especializados.
Por lo general, implica la instalación de cámaras o sensores a lo largo de las líneas de producción para capturar imágenes de los productos. Estas imágenes deben tomarse en grandes volúmenes, a menudo bajo una iluminación y ángulos consistentes, para garantizar la claridad y la uniformidad.
Una vez capturadas, las imágenes deben anotarse meticulosamente con etiquetas precisas para cada tipo de defecto, como arañazos, abolladuras o componentes faltantes. Este proceso requiere mucho tiempo y recursos, así como experiencia, para asegurarse de que el conjunto de datos refleje con precisión la variabilidad del mundo real. Se deben tener en cuenta factores como los diferentes tamaños, formas y materiales de los defectos para crear un conjunto de datos robusto y confiable.
Las integraciones que proporcionan conjuntos de datos listos para usar facilitan tareas como el control de calidad industrial, y con las capacidades de detección en tiempo real de YOLO11, los fabricantes pueden supervisar las líneas de producción, detectar defectos al instante y mejorar la eficiencia.
Fig. 4. Ejemplo de utilización de Ultralytics YOLO11 para detect y contar latas en fabricación.
Más allá de la fabricación, las integraciones relacionadas con conjuntos de datos pueden utilizarse en muchas otras industrias. Al combinar la velocidad y precisión de YOLO11con conjuntos de datos de fácil acceso, las empresas pueden desarrollar e implantar rápidamente soluciones adaptadas a sus necesidades específicas. Por ejemplo, en el sector sanitario, la integración de conjuntos de datos puede ayudar a desarrollar soluciones para analizar imágenes médicas y detect anomalías como tumores. Del mismo modo, en la conducción autónoma, estas integraciones pueden ayudar a identificar vehículos, peatones y señales de tráfico para mejorar la seguridad.
Conclusiones clave
Encontrar el conjunto de datos adecuado es a menudo una de las partes que más tiempo consume en la construcción de un modelo de visión por ordenador. Sin embargo, la integración de Roboflow hace que sea más fácil encontrar el mejor conjunto de datos para el entrenamiento personalizado de sus modelos Ultralytics YOLO , incluso si usted es nuevo en la visión por ordenador.
Con acceso a una amplia colección de conjuntos de datos para tareas de visión por ordenador como la detección de objetos, la clasificación de imágenes o la segmentación de instancias, Roboflow Universe facilita el proceso de descubrimiento de datos. Le ayuda a empezar rápidamente y a centrarse en la creación de su modelo en lugar de perder tiempo recopilando y organizando datos. Este enfoque simplificado permite a los desarrolladores crear prototipos, iterar y desarrollar soluciones de visión por ordenador de forma más eficiente.