Identificación y segmentación de envases con Ultralytics YOLO11

Abirami Vina

6 min leer

7 de febrero de 2025

Aprenda a utilizar un conjunto de datos de segmentación de paquetes para entrenar a Ultralytics YOLO11 para identificar y segmentar paquetes con el fin de mejorar las operaciones logísticas.

Cuando pides algo por Internet y te lo envían a casa, el proceso parece sencillo. Pulsas unos botones y el paquete aparece en la puerta de tu casa. Sin embargo, detrás de esa entrega sin contratiempos hay una intrincada red de almacenes, camiones y sistemas de clasificación que trabajan sin descanso para que los paquetes lleguen a su destino. Se prevé que el sector de la logística, columna vertebral de este sistema, crezca hasta alcanzar la increíble cifra de 13 700 millones de euros en 2027.

Sin embargo, este crecimiento viene acompañado de una serie de retos, como errores de clasificación, retrasos en las entregas e ineficiencias. A medida que crece la demanda de entregas más rápidas y precisas, los métodos tradicionales se quedan cortos y las empresas recurren a la inteligencia artificial (IA) y la visión por ordenador para encontrar soluciones más inteligentes.

La IA por visión en logística está transformando el sector mediante la automatización de procesos y la mejora de la precisión en la manipulación de paquetes. Mediante el análisis de imágenes y vídeos en tiempo real, la visión por ordenador puede ayudar a identificar, rastrear y clasificar paquetes con gran precisión, reduciendo errores y agilizando las operaciones. En concreto, los modelos avanzados de visión por ordenador como Ultralytics YOLO11 permiten una identificación de paquetes más rápida y precisa. 

El entrenamiento personalizado de YOLO11 con conjuntos de datos de visión por ordenador de alta calidad, como el conjunto de datos de segmentación de paquetes Roboflow, garantiza un rendimiento óptimo en escenarios reales. En este artículo, exploraremos cómo puede utilizarse este conjunto de datos para entrenar a YOLO11 con el fin de redefinir las operaciones logísticas. También hablaremos de sus aplicaciones en el mundo real. Empecemos.

La visión por ordenador redefine la eficiencia de los almacenes inteligentes

Los almacenes procesan miles de paquetes cada hora. Los errores en la clasificación o el seguimiento pueden provocar retrasos, aumentar los costes y frustrar a los clientes. La visión por ordenador puede aprovecharse para hacer posible que las máquinas interpreten imágenes y realicen tareas de forma inteligente. Las soluciones de IA por visión pueden ayudar a agilizar las operaciones, para que se desarrollen sin problemas y con menos errores.

Por ejemplo, la visión por ordenador puede mejorar tareas como la identificación de paquetes y la detección de daños, haciéndolas más rápidas y fiables que los métodos manuales. Estos sistemas suelen estar diseñados para funcionar bien en entornos difíciles, como espacios reducidos o con poca luz. 

En concreto, YOLO11 puede utilizarse para acelerar la manipulación de paquetes. Puede detectar rápidamente paquetes en tiempo real con precisión. Al aumentar la eficiencia y reducir los errores, YOLO11 favorece unas operaciones fluidas, ayudando a las empresas a cumplir los plazos y ofrecer mejores experiencias a los clientes.

__wf_reserved_inherit
Fig. 1. Ejemplo de detección de cajas con YOLO11.

YOLO11 es ideal para aplicaciones logísticas

YOLO11 es compatible con diversas tareas de visión por ordenador, como la detección de objetos, la segmentación de instancias y la clasificación de imágenes, lo que lo convierte en una herramienta versátil para diversos sectores. YOLO11 combina velocidad y precisión, lo que la convierte en una gran herramienta para el sector de la logística. 

Con un 22% menos de parámetros que YOLOv8m, consigue una mayor precisión en el conjunto de datos COCO, lo que le permite detectar objetos con mayor exactitud y eficacia. Esto significa que puede identificar paquetes de forma rápida y fiable, incluso en entornos de envíos rápidos y de gran volumen.

Además, estas ventajas no se limitan a los paquetes. Por ejemplo, YOLO11 puede utilizarse en almacenes para detectar a los trabajadores en tiempo real, mejorando la seguridad y la eficacia. Puede seguir los movimientos de los trabajadores, identificar zonas restringidas y alertar a los supervisores de posibles peligros, lo que ayuda a prevenir accidentes y a garantizar un funcionamiento sin problemas.

__wf_reserved_inherit
Fig. 2. Ejemplo de uso de YOLO11 para detectar trabajadores en un almacén.

Optimización de YOLO11 con el conjunto de datos de segmentación de paquetes

Detrás de cada gran aplicación de IA suele haber un modelo entrenado en conjuntos de datos de alta calidad. Estos conjuntos de datos son cruciales para crear soluciones logísticas de visión por ordenador. 

Un buen ejemplo de este tipo de conjunto de datos es el Roboflow Universe Package Segmentation Dataset, diseñado para reflejar los retos logísticos del mundo real. Este conjunto de datos puede utilizarse para entrenar un modelo de detección y contorno (o segmentación) de paquetes en imágenes.

La segmentación de instancias es una tarea de visión por ordenador que identifica objetos, genera cuadros delimitadores y delinea con precisión su forma. A diferencia de la detección de objetos, que solo coloca cuadros delimitadores alrededor de los objetos, la segmentación de instancias proporciona máscaras detalladas a nivel de píxel como característica adicional. 

El conjunto de datos de segmentación de paquetes Roboflow Universe presenta imágenes de paquetes en diversas condiciones, desde iluminación tenue y espacios desordenados hasta orientaciones impredecibles. Además, la estructura de este conjunto de datos se ha creado para un entrenamiento y una evaluación eficaces del modelo. Consta de 1920 imágenes anotadas para el entrenamiento, 89 para las pruebas y 188 para la validación. Los modelos de visión por ordenador entrenados con este conjunto de datos de segmentación de instancias diversas pueden adaptarse fácilmente a las complejidades de los almacenes y centros de distribución.

__wf_reserved_inherit
Fig. 3. Visión general del conjunto de datos de segmentación de paquetes Roboflow.

Entrenamiento de YOLO11 con un conjunto de datos de segmentación de paquetes

El entrenamiento de modelos Ultralytics YOLO como Ultralytics YOLO11 implica un proceso simple y directo. Los modelos pueden entrenarse utilizando la interfaz de línea de comandos (CLI) o scripts de Python, lo que ofrece opciones de configuración flexibles y fáciles de usar.

Dado que el paquete Python de Ultralytics es compatible con el conjunto de datos de segmentación de paquetes Roboflow, para entrenar YOLO11 con él solo se necesitan unas pocas líneas de código, y el entrenamiento puede iniciarse en tan solo cinco minutos. Para más información, consulta la documentación oficial de Ultralytics.

Cuando se entrena a YOLO11 en este conjunto de datos, el proceso de entrenamiento comienza dividiendo el conjunto de datos de segmentación de paquetes en tres partes: entrenamiento, validación y prueba. El conjunto de entrenamiento enseña al modelo a identificar y segmentar paquetes con precisión, mientras que el conjunto de validación ayuda a afinar su precisión probándolo en imágenes no vistas, lo que garantiza que se adapte bien a los escenarios del mundo real. 

Por último, el conjunto de pruebas evalúa el rendimiento general para confirmar que el modelo está listo para su despliegue. Una vez entrenado, el modelo se integra perfectamente en los flujos de trabajo logísticos, automatizando tareas como la identificación y clasificación de paquetes.

__wf_reserved_inherit
Fig. 4. Flujo de trabajo de entrenamiento personalizado para YOLO11. Imagen del autor.

Aplicaciones de visión artificial para una logística más inteligente

Ahora que ya hemos visto cómo entrenar a YOLO11 de forma personalizada utilizando el conjunto de datos de segmentación de paquetes. Analicemos algunas aplicaciones reales de la visión por ordenador en la logística inteligente.

Supervisión inteligente de almacenes con YOLO11

Los almacenes manejan a menudo miles de paquetes por hora, especialmente durante las temporadas de ventas. Paquetes de todas las formas y tamaños se mueven rápidamente por las cintas transportadoras, a la espera de ser clasificados y enviados. Clasificar manualmente un volumen tan grande de paquetes puede dar lugar a errores, retrasos y pérdida de esfuerzos.

Con YOLO11, los almacenes pueden funcionar de forma mucho más eficaz. El modelo puede analizar una alimentación en tiempo real, utilizando la detección de objetos para identificar cada paquete. Esto ayuda a rastrear los paquetes con precisión, reduciendo errores y evitando envíos extraviados o retrasados.

__wf_reserved_inherit
Fig. 5. Uso de YOLO11 para detectar y contar paquetes.

Además, las funciones de segmentación de instancias de YOLO11 hacen que la manipulación de paquetes sea más eficiente al identificar y separar con precisión los paquetes individuales, incluso cuando están apilados o superpuestos. Al mejorar la precisión de la clasificación y permitir un mejor seguimiento del inventario, YOLO11 ayuda a automatizar los procesos logísticos, reducir los errores y mantener el buen funcionamiento de las operaciones.

Uso de YOLO11 para la detección de daños

Nadie quiere recibir un paquete roto, abollado o dañado. Puede ser frustrante para los clientes y costoso para las empresas, y dar lugar a reclamaciones, devoluciones y pérdida de recursos. La entrega sistemática de paquetes intactos es fundamental para mantener la confianza de los clientes.

YOLO11 puede ayudar a detectar estos problemas a tiempo. En los centros de clasificación, YOLO11 puede utilizarse para escanear paquetes en tiempo real utilizando la segmentación por instancias para detectar abolladuras, roturas o fugas. Cuando se identifica un paquete dañado, puede marcarse automáticamente y retirarse de la línea de producción. Un sistema Vision basado en IA puede ayudar a reducir los residuos y garantizar que los clientes reciban únicamente productos de alta calidad.

Ventajas e inconvenientes de la visión por ordenador en logística

Ahora que hemos explorado las aplicaciones reales del uso de la visión por ordenador en la logística inteligente, veamos más de cerca las ventajas que aportan los modelos de visión por ordenador como YOLO11. Desde el mantenimiento de la calidad de los envases hasta la gestión de tareas durante los picos de demanda, incluso las pequeñas mejoras pueden suponer una gran diferencia.

He aquí algunas de las principales ventajas:

  • Ahorro de costes: Al mejorar la eficiencia, reducir los residuos y minimizar las devoluciones, YOLO11 ayuda a reducir los costes operativos generales.
  • Automatización de almacenes: Optimizado para edge computing, YOLO11 puede integrarse con robots de almacén y drones aéreos, automatizando la manipulación de paquetes en centros de distribución a gran escala.
  • Beneficios para la sostenibilidad: Al reducir los residuos, optimizar las rutas y minimizar los envíos innecesarios, YOLO11 contribuye a unas operaciones logísticas más respetuosas con el medio ambiente.

A pesar de las ventajas, también hay que tener en cuenta ciertas limitaciones a la hora de aplicar las innovaciones de la visión por ordenador en los flujos de trabajo logísticos:

  • Necesidad de actualizaciones continuas: Los modelos de IA deben actualizarse y reentrenarse periódicamente para adaptarse a nuevos retos, tipos de paquetes o cambios en la disposición de los almacenes.
  • Integración con sistemas heredados: Muchas empresas de logística dependen de infraestructuras antiguas, lo que dificulta una integración perfecta con las modernas tecnologías de IA.
  • Preocupación por la privacidad y la seguridad: El uso de sistemas de visión basados en IA puede suscitar inquietudes sobre la privacidad de los empleados y la seguridad de los datos, lo que exige un cuidadoso examen de las políticas.

Principales conclusiones sobre los almacenes inteligentes

Cuando YOLO11 de Ultralytics se entrena de forma personalizada en conjuntos de datos como el Roboflow Package Segmentation Dataset, puede mejorar la automatización logística adaptándose a las distintas condiciones del almacén y escalando de forma eficiente durante los periodos punta. A medida que las operaciones logísticas se vuelven más complejas, YOLO11 puede ayudar a garantizar la precisión, minimizar los errores y mantener las entregas sin problemas.

La IA por visión en logística está transformando el sector al permitir flujos de trabajo más inteligentes, rápidos y fiables. Al integrar la visión por ordenador en sus operaciones, las empresas pueden aumentar la eficiencia, reducir costes y mejorar la satisfacción del cliente.

Únase a nuestra comunidad y consulte nuestro repositorio de GitHub para ver la IA en acción. Explore nuestras opciones de licencia YOLO y descubra más sobre la visión por ordenador en la agricultura y la IA en la sanidad en nuestras páginas de soluciones.

¡Construyamos juntos el futuro
de la IA!

Comience su viaje con el futuro del aprendizaje automático

Empezar gratis
Enlace copiado en el portapapeles