¡Sintonice YOLO Vision 2025!
25 de septiembre de 2025
10:00 — 18:00 BST
Evento híbrido
Yolo Vision 2024
Glosario

Inferencia en tiempo real

Descubra cómo la inferencia en tiempo real con Ultralytics YOLO permite predicciones instantáneas para aplicaciones de IA como la conducción autónoma y los sistemas de seguridad.

La inferencia en tiempo real es el proceso de utilizar un modelo de aprendizaje automático (ML) entrenado para hacer predicciones sobre datos nuevos y en vivo con un retraso mínimo. En el contexto de la IA y la visión artificial (CV), esto significa que el sistema puede procesar información, como una transmisión de video, y generar una salida casi instantáneamente. El objetivo es que la latencia de inferencia sea lo suficientemente baja como para que los resultados sean inmediatamente útiles para la toma de decisiones. Esta capacidad es crucial para las aplicaciones en las que el tiempo es crítico, transformando la forma en que las industrias, desde la automotriz hasta la atención médica, aprovechan la IA.

Inferencia en tiempo real vs. Inferencia por lotes

Es importante distinguir la inferencia en tiempo real de la inferencia por lotes. La diferencia clave radica en cómo se procesan los datos.

  • Inferencia en Tiempo Real: Procesa los datos a medida que se generan o reciben, normalmente una entrada o un pequeño flujo a la vez. La prioridad es minimizar el retardo (latencia) entre la entrada y la salida. Esto es esencial para los sistemas interactivos y sensibles al tiempo.
  • Inferencia por Lotes: Implica recopilar datos durante un período y procesarlos todos a la vez en un lote grande. Este enfoque prioriza maximizar el rendimiento (throughput) (la cantidad de datos procesados a lo largo del tiempo) en lugar de minimizar la latencia. El procesamiento por lotes es adecuado para tareas no urgentes como la generación de informes diarios o el análisis periódico de grandes conjuntos de datos.

Si bien ambos utilizan un modelo entrenado para hacer predicciones, sus casos de uso son fundamentalmente diferentes según la urgencia de los resultados.

Aplicaciones en el mundo real

La capacidad de tomar decisiones instantáneas permite una amplia gama de aplicaciones potentes en varios sectores.

  1. Sistemas autónomos: En los coches autónomos, la inferencia en tiempo real es una cuestión de seguridad. Los modelos deben realizar la detección de objetos para identificar peatones, otros vehículos y señales de tráfico en milisegundos para navegar de forma segura y evitar colisiones. Del mismo modo, los drones y los robots dependen de ella para la navegación y la interacción con su entorno.
  2. Fabricación inteligente: En una línea de producción, las cámaras equipadas con IA pueden realizar el control de calidad en tiempo real. Un modelo como Ultralytics YOLO11 puede detectar defectos en los productos que se mueven en una cinta transportadora, lo que permite su eliminación inmediata. Este es un componente central de la moderna IA en la fabricación.
  3. Atención Médica Interactiva: Durante un procedimiento quirúrgico, un modelo podría analizar video en vivo de una cámara para proporcionar orientación en tiempo real al cirujano. En entornos de diagnóstico, el análisis de imágenes médicas en tiempo real puede ayudar a los médicos a identificar anomalías más rápido durante los escaneos en vivo.
  4. Vigilancia inteligente: Los sistemas de seguridad modernos utilizan la inferencia en tiempo real para analizar las transmisiones de vídeo e identificar posibles amenazas, como la entrada no autorizada o los paquetes abandonados, lo que desencadena alertas inmediatas. Esto va más allá de la simple grabación para pasar a una monitorización activa e inteligente.

Logrando un rendimiento en tiempo real

Conseguir que los modelos se ejecuten lo suficientemente rápido para aplicaciones de computación en tiempo real a menudo requiere una optimización significativa:

Modelos como Ultralytics YOLO están diseñados teniendo en cuenta la eficiencia y la precisión, lo que los hace muy adecuados para las tareas de detección de objetos en tiempo real. Plataformas como Ultralytics HUB proporcionan herramientas para entrenar, optimizar (por ejemplo, exportar a formatos ONNX o TensorRT) e implementar modelos, lo que facilita la implementación de soluciones de inferencia en tiempo real en varias opciones de implementación.

Únete a la comunidad de Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora
Enlace copiado al portapapeles