Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
IA de visión

Las inferencias en tiempo real en soluciones de IA de visión están causando impacto

Descubre por qué las inferencias en tiempo real en visión artificial son importantes para una serie de aplicaciones y explora su papel a la hora de permitir la toma de decisiones instantánea.

ABAbirami Vina
4 min read
Inferencias en tiempo real en soluciones de IA de visión

Todos hemos lidiado en algún momento con la frustración que puede causar una conexión a Internet lenta. Sin embargo, imagina ese retraso en una situación de alta responsabilidad, como un coche autónomo reaccionando ante un obstáculo o un médico analizando una exploración crítica. Unos pocos segundos adicionales pueden tener consecuencias graves.

Aquí es donde la inferencia de IA en tiempo real puede marcar la diferencia. El procesamiento rápido y las predicciones en tiempo real permiten que las soluciones de computer vision procesen y reaccionen a los datos visuales al instante. Estas decisiones tomadas en fracciones de segundo pueden aumentar la seguridad, la eficiencia y la comodidad en el día a día.

Por ejemplo, considera a un cirujano realizando una intervención delicada con la ayuda de un asistente robótico. Cada movimiento se controla mediante una conexión de alta velocidad y el sistema de visión del robot procesa el campo quirúrgico en tiempo real, proporcionando al cirujano una respuesta visual instantánea. Incluso el retraso más mínimo en este bucle de retroalimentación podría provocar errores graves, poniendo en peligro al paciente. Este es un ejemplo perfecto de por qué las inferencias en tiempo real son cruciales; no hay lugar para el lag.

Las inferencias de IA en aplicaciones del mundo real dependen de tres conceptos clave: motores de inferencia (el software o hardware que ejecuta modelos de IA de manera eficiente), latencia de inferencia (el retraso entre la entrada y la salida) y la inferencia en tiempo real (la capacidad del sistema de IA para procesar y reaccionar con un retraso mínimo).

En este artículo, exploraremos estos conceptos fundamentales y cómo los modelos de visión artificial como Ultralytics YOLO11 permiten aplicaciones que dependen de predicciones instantáneas.

Link to this section¿Qué es una inferencia de IA?#

Ejecutar una inferencia es el proceso de analizar nuevos datos mediante un modelo de IA entrenado para realizar una predicción o resolver una tarea. A diferencia del entrenamiento, que implica enseñar a un modelo procesando grandes cantidades de datos etiquetados, la inferencia se centra en producir resultados de forma rápida y precisa utilizando un modelo ya entrenado.

Comprender qué son las inferencias

Fig 1. Comprender qué son las inferencias.

Por ejemplo, en la conservación de la vida silvestre, las AI camera traps utilizan modelos de visión artificial para identificar y clasificar animales en tiempo real. Cuando una cámara detecta movimiento, el modelo de IA reconoce al instante si se trata de un ciervo, un depredador o incluso un cazador furtivo, ayudando a los investigadores a rastrear poblaciones animales y proteger especies en peligro sin intervención humana. Esta rápida identificación hace posible el monitoreo en tiempo real y respuestas más rápidas ante posibles amenazas.

Link to this sectionComprender los motores de inferencia#

Un modelo de machine learning entrenado no siempre está listo para su implementación en su forma original. Un inference engine es una herramienta de software o hardware especializada, diseñada para ejecutar eficientemente modelos de machine learning y optimizarlos para su implementación en el mundo real. Utiliza optimization techniques como la compresión de modelos, la cuantización y transformaciones de grafos para mejorar el rendimiento y reducir el consumo de recursos, haciendo que el modelo sea desplegable en diversos entornos.

En esencia, un motor de inferencia se centra en reducir la carga computacional, minimizar la latencia y mejorar la eficiencia para permitir predicciones rápidas y precisas. Una vez optimizado, el motor ejecuta el modelo sobre nuevos datos, permitiéndole generar inferencias en tiempo real de manera eficiente. Esta optimización asegura que los modelos de IA puedan ejecutarse sin problemas tanto en servidores en la nube de alto rendimiento como en dispositivos de borde con recursos limitados, como smartphones, dispositivos IoT y sistemas integrados.

Link to this sectionProblemas causados por la latencia de inferencia#

La Inference latency es el retraso temporal entre el momento en que un sistema de IA recibe datos de entrada (como una imagen de una cámara) y cuando produce una salida (como detectar objetos en la imagen). Incluso un pequeño retraso puede afectar significativamente el rendimiento y la utilidad de las aplicaciones de IA en tiempo real.

La latencia de inferencia ocurre en tres etapas clave:

  • Tiempo de preprocesamiento: El tiempo necesario para preparar los datos de entrada antes de introducirlos en el modelo. Esto incluye cambiar el tamaño de las imágenes para que coincidan con las dimensiones de entrada del modelo, normalizar los valores de los píxeles para mejorar la precisión y convertir formatos (por ejemplo, de RGB a escala de grises o de video a secuencias de fotogramas).
  • Tiempo de computación: El tiempo real que tarda el modelo en realizar la inferencia. Esto implica operaciones como cálculos capa por capa en redes profundas, multiplicaciones de matrices, convoluciones y transferencia de datos entre la memoria y las unidades de procesamiento.
  • Tiempo de post-procesamiento: El tiempo requerido para convertir las salidas brutas del modelo en resultados significativos. Esto puede incluir dibujar bounding boxes en la detección de objetos, filtrar falsos positivos en el reconocimiento de imágenes o aplicar umbrales en la detección de anomalías.

La latencia de inferencia es crítica en aplicaciones en tiempo real. Por ejemplo, en la detección automatizada de defectos en una línea de ensamblaje, se puede utilizar la visión artificial para inspeccionar productos a medida que avanzan por la cinta transportadora.

El sistema debe identificar y señalar rápidamente los defectos antes de que los productos pasen a la siguiente etapa. Si el modelo tarda demasiado en procesar las imágenes, los artículos defectuosos podrían no detectarse a tiempo, lo que provocaría un desperdicio de materiales, costosas rectificaciones o la llegada de productos defectuosos a los clientes. Al reducir la latencia, los fabricantes pueden mejorar el control de calidad, aumentar la eficiencia y reducir las pérdidas.

Link to this sectionCómo reducir la latencia de inferencia#

Mantener la latencia de inferencia al mínimo es esencial en muchas aplicaciones de visión artificial. Se pueden utilizar diversas técnicas para lograr esto. Analicemos algunas de las técnicas más comunes utilizadas para reducir la latencia de inferencia.

Link to this sectionPoda de modelos (Model pruning)#

El Model pruning simplifica una red neuronal eliminando conexiones (pesos) innecesarias, haciéndola más pequeña y rápida. Este proceso reduce la carga computacional del modelo, mejorando la velocidad sin afectar demasiado la precisión.

Al mantener solo las conexiones más importantes, la poda asegura una inferencia eficiente y un mejor rendimiento, especialmente en dispositivos con potencia de procesamiento limitada. Se utiliza ampliamente en aplicaciones en tiempo real como IA móvil, robótica y edge computing para mejorar la eficiencia manteniendo la fiabilidad.

Eliminar conexiones menos eficaces mediante la poda de modelos

Fig 2. Eliminar conexiones menos efectivas usando poda de modelos.

Link to this sectionCuantización de modelos (Model quantization)#

El Model quantization es una técnica que hace que los modelos de IA se ejecuten más rápido y utilicen menos memoria al simplificar los números que utilizan para los cálculos. Normalmente, estos modelos trabajan con números de punto flotante de 32 bits, que son muy precisos pero requieren mucha potencia de procesamiento. La cuantización reduce estos números a enteros de 8 bits, que son más fáciles de procesar y ocupan menos espacio.

Usar la cuantización de modelos para convertir valores de coma flotante a enteros

Fig 3. Uso de la cuantización de modelos para convertir valores de punto flotante a representaciones enteras.

Link to this sectionUso de modelos eficientes#

El diseño de un modelo de IA tiene un gran impacto en la rapidez con la que puede realizar predicciones. Los modelos como YOLO11, que están diseñados para una inferencia eficiente, son ideales para aplicaciones donde la velocidad de procesamiento es crítica.

Cuando estás creando una solución de IA, es importante elegir el modelo adecuado según los recursos disponibles y las necesidades de rendimiento. Si comienzas con un modelo demasiado pesado, es más probable que te encuentres con problemas como tiempos de procesamiento lentos, mayor consumo de energía y dificultad para implementar en dispositivos con recursos limitados. Un modelo ligero asegura un rendimiento fluido, especialmente para aplicaciones en tiempo real y en el borde (edge).

Link to this sectionVelocidad vs. precisión: optimización de inferencias en tiempo real#

Aunque existen varias técnicas para reducir la latencia, una parte clave de las real-time inferences es equilibrar la velocidad y la precisión. Hacer que los modelos sean más rápidos no es suficiente: la velocidad de inferencia debe optimizarse sin comprometer la precisión. Un sistema que produce predicciones rápidas pero incorrectas es ineficaz. Por eso, las pruebas exhaustivas son vitales para asegurarse de que los modelos funcionen bien en situaciones del mundo real. Un sistema que parece rápido durante las pruebas pero falla en condiciones reales no está realmente optimizado.

Link to this sectionAplicaciones de visión artificial que aprovechan las inferencias en tiempo real#

A continuación, veamos algunas aplicaciones del mundo real donde la inferencia en tiempo real está transformando industrias al permitir respuestas instantáneas a entradas visuales.

Link to this sectionSistemas de autopago en tiendas minoristas#

Los modelos de visión artificial como YOLO11 pueden ayudar a mejorar los sistemas de autopago haciendo que el reconocimiento de artículos sea más rápido y preciso. El soporte de YOLO11 para varias computer vision tasks como la detección de objetos y la segmentación de instancias hace posible identificar productos incluso si los códigos de barras faltan o están dañados. La visión artificial puede reducir la necesidad de entrada manual y acelerar el proceso de pago.

Más allá de la identificación de productos, la visión artificial también puede integrarse en los sistemas de autopago para verificar precios, prevenir fraudes y mejorar la comodidad del cliente. Las cámaras con IA pueden distinguir automáticamente entre productos similares y detectar comportamientos sospechosos al pagar. Esto incluye identificar "no escaneos", donde un cliente o cajero omite accidentalmente un artículo, y intentos de fraude más deliberados, como el "cambio de producto", donde se coloca un código de barras más barato sobre un artículo más caro.

La IA mejora los mostradores de autopago

Fig 4. La IA puede mejorar los mostradores de autopago.

Un gran ejemplo de esto es Kroger, un importante minorista de EE. UU., que ha integrado la visión artificial y la IA en sus sistemas de autopago. Utilizando análisis de video en tiempo real, Kroger ha podido corregir automáticamente más del 75% de los errores de pago, mejorando tanto la experiencia del cliente como las operaciones de la tienda.

Link to this sectionInspección de calidad mediante visión artificial#

La inspecting products manual para el control de calidad puede ser lenta y no siempre precisa. Por eso, más fabricantes están cambiando a flujos de trabajo de inspección visual que utilizan visión artificial para detectar defectos antes en el proceso de producción.

Las cámaras de alta resolución y la visión artificial pueden detectar fallos minúsculos que los humanos podrían pasar por alto, y modelos como YOLO11 pueden ayudar con los controles de calidad, la clasificación y el conteo en tiempo real para garantizar que solo los productos perfectos lleguen a los clientes. Automatizar este proceso ahorra tiempo, reduce costos y minimiza el desperdicio, haciendo que la producción sea más fluida y eficiente.

Usar YOLO11 para contar productos en una línea de montaje

Fig 5. Un ejemplo de cómo utilizar YOLO11 para contar productos en una línea de ensamblaje.

Link to this sectionConclusiones clave#

La inferencia en tiempo real ayuda a los modelos de IA a tomar decisiones instantáneas, lo cual es crucial en muchas industrias. Ya sea un coche autónomo evitando un accidente, un médico analizando rápidamente exploraciones médicas o una fábrica detectando defectos en los productos, las respuestas rápidas y precisas de la IA marcan una gran diferencia.

Al mejorar la velocidad y la eficiencia de los modelos de IA, podemos crear sistemas más inteligentes y fiables que funcionen a la perfección en situaciones del mundo real. A medida que la tecnología avanza, las soluciones de IA en tiempo real seguirán moldeando el futuro, haciendo que los procesos diarios sean más rápidos, seguros y eficientes.

Para obtener más información, visita nuestro GitHub repository e interactúa con nuestra comunidad. Explora innovaciones en sectores como AI in self-driving cars y computer vision in agriculture en nuestras páginas de soluciones. Consulta nuestras opciones de licencia y haz realidad tus proyectos de visión artificial.

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático