Uso de Ultralytics YOLO11 para ejecutar inferencias por lotes

15 de mayo de 2025
Explore la diferencia entre la inferencia en tiempo real y la inferencia por lotes al utilizar Ultralytics YOLO11 para diversas aplicaciones de visión artificial.

15 de mayo de 2025
Explore la diferencia entre la inferencia en tiempo real y la inferencia por lotes al utilizar Ultralytics YOLO11 para diversas aplicaciones de visión artificial.
Si ha visto un coche autónomo en acción, ha sido testigo de la inferencia de IA en tiempo real. Un coche autónomo suele utilizar cámaras, sensores e IA para procesar su entorno y tomar decisiones casi instantáneas. Sin embargo, cuando no se necesitan respuestas rápidas, la inferencia en tiempo real puede consumir muchos recursos.
Una mejor opción en estos casos es la inferencia por lotes. En lugar de procesar los datos continuamente en tiempo real, una inferencia por lotes puede gestionar grandes conjuntos de datos a intervalos programados. Este enfoque ayuda a ahorrar recursos, reducir el consumo de energía y disminuir los costes de infraestructura.
Por ejemplo, en aplicaciones de visión artificial, los modelos como Ultralytics YOLO11 se pueden utilizar para tareas en tiempo real como la detección de objetos y la segmentación de instancias. Sin embargo, procesar grandes volúmenes de datos visuales en tiempo real puede ser exigente.

Con la inferencia por lotes, YOLO11 se puede ejecutar en datos visuales en lotes, lo que reduce la tensión en el sistema y mejora la eficiencia sin sacrificar el rendimiento. Esto facilita la implementación de soluciones de visión artificial a escala sin sobrecargar el hardware ni aumentar los costes.
En este artículo, exploraremos la inferencia por lotes, sus beneficios y cómo se puede aplicar la inferencia por lotes utilizando YOLO11 en aplicaciones de visión artificial. ¡Empecemos!
Puede considerar la inferencia por lotes como abordar una gran tarea de una sola vez en lugar de manejarla pieza por pieza a medida que llega. En lugar de procesar constantemente los datos en tiempo real, la inferencia por lotes le permite procesar grandes grupos de datos a intervalos establecidos. Este enfoque es mucho más eficiente cuando no se necesitan respuestas inmediatas, lo que ayuda a ahorrar recursos informáticos, reducir el uso de energía y recortar costes.
Cuando se trata de visión artificial, hay ciertas aplicaciones en las que la baja latencia es vital. La baja latencia se refiere al mínimo retardo entre la recepción de la entrada (como una imagen o un fotograma de vídeo) y la respuesta del sistema. Por ejemplo, en la monitorización de seguridad en tiempo real, incluso pequeños retrasos pueden acarrear riesgos para la seguridad.
Sin embargo, en muchos otros escenarios de visión artificial, la baja latencia no es tan crítica. Aquí es donde brilla la inferencia por lotes: cuando el sistema no necesita reaccionar instantáneamente. La inferencia por lotes funciona alimentando datos visuales a un modelo de visión artificial en grupos o lotes, lo que permite al sistema procesar grandes conjuntos de datos a la vez en lugar de continuamente en tiempo real.
Aquí hay una visión más detallada de los pasos involucrados en la inferencia por lotes:
Ahora que hemos cubierto qué es la inferencia por lotes y en qué se diferencia de la inferencia en tiempo real, analicemos más de cerca cuándo usarla.
La inferencia por lotes es ideal para analizar datos históricos. Digamos que tiene imágenes de vigilancia de una estación de metro del último mes, y está tratando de identificar patrones específicos, como el número de personas que entran y salen a diferentes horas del día.
En lugar de procesar cada fotograma en tiempo real, la inferencia por lotes le permite procesar el metraje de todo el mes en lotes, identificando eventos o tendencias clave sin necesidad de resultados inmediatos. De esta manera, puede analizar grandes volúmenes de datos de manera más eficiente y obtener información sobre patrones a largo plazo, sin sobrecargar el sistema ni requerir una supervisión constante.
La inferencia por lotes también es una solución óptima cuando los recursos del sistema son limitados. Al ejecutar la inferencia durante las horas de menor actividad (como por la noche), puede ahorrar en costes informáticos y asegurarse de que el sistema no se sobrecargue durante las horas de mayor uso. Esto la convierte en un enfoque eficiente y rentable para empresas o proyectos que necesitan procesar grandes conjuntos de datos pero no requieren análisis en tiempo real.
El paquete de Python de Ultralytics admite la inferencia por lotes para modelos como YOLO11. Con YOLO11, puede ejecutar fácilmente la inferencia por lotes especificando el argumento 'batch', que determina cuántas imágenes o fotogramas de video se procesan a la vez.
Durante el proceso de inferencia por lotes, se generan predicciones para todas las imágenes del lote simultáneamente. Por defecto, el tamaño del lote se establece en 1, pero puede ajustarlo al número que prefiera.
Por ejemplo, si el tamaño del lote se establece en 5, YOLO11 procesará cinco imágenes o fotogramas de vídeo a la vez y generará predicciones para los cinco a la vez. Los tamaños de lote más grandes suelen conducir a tiempos de inferencia más rápidos, ya que procesar varias imágenes en un lote es más eficiente que manejarlas individualmente.
A continuación, exploremos algunos casos de uso reales de visión artificial para la inferencia por lotes.
En la investigación médica, es muy común trabajar con grandes cantidades de datos visuales. Aquí, la inferencia por lotes puede ayudar a los científicos a analizar los datos más fácilmente en campos como la química, la biología y la genética. En lugar de analizar los datos de uno en uno, se procesan en lotes, lo que ahorra tiempo y esfuerzo.
Por ejemplo, en las instalaciones médicas, la inferencia por lotes puede ser especialmente útil para analizar grandes conjuntos de imágenes médicas como resonancias magnéticas o tomografías computarizadas. Los hospitales pueden recopilar estos escaneos durante todo el día y procesarlos en lotes durante la noche.
Este enfoque permite a los hospitales hacer un mejor uso de su hardware y personal, reducir los costes operativos y garantizar que todas las exploraciones se revisen de manera coherente y uniforme. También es beneficioso para grandes proyectos de investigación y estudios a largo plazo, donde es necesario manejar grandes cantidades de datos.

Los coches autónomos utilizan tecnologías de IA como la visión artificial para procesar el mundo que les rodea. Con la ayuda de modelos avanzados como YOLO11, los sistemas integrados en el coche pueden reconocer otros vehículos, líneas de carril, señales de tráfico y personas en la calle. Si bien la inferencia en tiempo real es fundamental en la carretera, la tecnología de conducción autónoma también se basa en gran medida en la inferencia por lotes entre bastidores.

Después de que un coche complete un viaje, los datos que recopila, como horas de metraje de cámara, lecturas de sensores y escaneos LIDAR, pueden procesarse más tarde en grandes lotes. Esto permite a los ingenieros actualizar los modelos de IA del coche, mejorar la seguridad del sistema y mejorar su capacidad para manejar diversas condiciones de conducción.
La inferencia por lotes también se utiliza en simulaciones de conducción autónoma para probar cómo reaccionarían los coches autónomos en diferentes situaciones, como al circular por intersecciones concurridas o al responder a movimientos impredecibles de peatones. Este enfoque ahorra tiempo, reduce costes y evita los riesgos asociados a la prueba de cada escenario en la vida real.
De manera similar, para las tiendas minoristas, la inferencia por lotes con modelos de visión artificial como YOLO11 puede mejorar significativamente la eficiencia operativa. Por ejemplo, los sistemas de cámaras en las tiendas pueden capturar miles de imágenes a lo largo del día, que luego se pueden procesar por lotes durante la noche.
Esto permite a las tiendas analizar lo que está sucediendo en la tienda, como el comportamiento del cliente, los patrones de tráfico y las interacciones con los productos, sin la necesidad de un procesamiento en tiempo real, lo que puede ser un desafío para las tiendas más pequeñas.
Otro ejemplo interesante es el uso de la inferencia por lotes para generar mapas de calor, que visualizan áreas de alta y baja actividad de clientes dentro de la tienda. Al analizar estos mapas de calor, los minoristas pueden identificar qué áreas atraen la mayor cantidad de tráfico peatonal y qué partes de la tienda podrían necesitar más atención u optimización en la colocación de productos. Estos datos pueden ayudar a los minoristas a tomar mejores decisiones sobre el diseño de la tienda, el posicionamiento de los productos e incluso las estrategias promocionales para mejorar la experiencia del cliente y las ventas.

Estos son algunos de los beneficios clave que la inferencia por lotes puede aportar a diversas industrias:
Si bien el uso de la inferencia por lotes ofrece muchas ventajas, también hay algunas limitaciones que se deben tener en cuenta. Estos son algunos factores que debe tener en cuenta:
La inferencia por lotes es una forma eficiente de procesar grandes volúmenes de datos visuales que no requieren resultados inmediatos. En lugar de analizar cada imagen en tiempo real, las procesa en lotes en momentos programados, como por la noche.
Este método es rentable, reduce la carga computacional y sigue proporcionando resultados precisos. Desde ayudar a las tiendas a gestionar el inventario hasta ayudar a los médicos con el análisis de escáneres médicos y mejorar las tecnologías de los coches autónomos, la inferencia por lotes hace que la visión artificial sea más accesible, asequible y práctica para las aplicaciones del mundo real.
¿Listo para sumergirte en la IA? Explora nuestro repositorio de GitHub, conéctate con nuestra comunidad y consulta nuestras opciones de licencia para comenzar tu viaje en la visión artificial. Obtén más información sobre innovaciones como la IA en la fabricación y la visión artificial en la industria de la logística en nuestras páginas de soluciones.