Ultralytics YOLO

Creando productos inteligentes con Ultralytics YOLO26 y IA visual

Aprende cómo la creación de productos inteligentes con YOLO26 y la IA visual permite la detección en tiempo real, la automatización inteligente y experiencias de producto escalables y receptivas.

ABAbirami Vina

6 min readMarch 4, 2026

Creando productos inteligentes con Ultralytics YOLO26 y IA visual

Miles de horas de vídeo son capturadas cada día por cámaras integradas en dispositivos, máquinas e infraestructuras públicas. La mayor parte de esas imágenes se almacenan, se ven por encima o se revisan solo cuando algo sale mal.

A menudo, los datos visuales están disponibles, pero falta la capacidad de interpretarlos en tiempo real. A medida que los productos se vuelven más conectados y basados en datos, esta limitación se vuelve más notable.

Los usuarios esperan que los sistemas hagan algo más que solo registrar eventos o seguir instrucciones fijas. Por ejemplo, esperan que los productos inteligentes reconozcan lo que está sucediendo y respondan de inmediato, sin esperar revisiones manuales o depender de conjuntos de reglas rígidas.

Los recientes avances en inteligencia artificial están ayudando a cerrar esa brecha. En particular, la visión artificial permite a las máquinas interpretar imágenes y vídeos, lo que permite a los sistemas analizar escenas y responder en tiempo real.

Sin embargo, incorporar esta capacidad en un producto requiere modelos que sean rápidos y fiables. Los modelos de visión artificial de última generación como Ultralytics YOLO26 están creados para este propósito, ofreciendo la velocidad y precisión necesarias para el despliegue en tiempo real.

YOLO26 es compatible con tareas de visión principales como la detección de objetos, la segmentación de instancias y el seguimiento de objetos, lo que hace posible que los productos interpreten datos visuales y respondan de forma inteligente.

Detectando objetos en una imagen usando YOLO26

Fig 1. Detectando objetos en una imagen usando YOLO26 (Fuente)

En este artículo, exploraremos cómo se pueden usar la visión artificial y Ultralytics YOLO26 para construir productos más inteligentes y fomentar la automatización inteligente en aplicaciones del mundo real. ¡Empecemos!

Link to this sectionLas lagunas en el desarrollo tradicional de productos#

Antes de sumergirnos en cómo la visión artificial está ayudando a construir productos más inteligentes, analicemos detenidamente los desafíos a los que se enfrentan los equipos cuando confían en sistemas tradicionales basados en reglas y algoritmos antiguos.

Estos son algunos de los desafíos clave del desarrollo de productos tradicional:

Sistemas rígidos basados en reglas: La lógica programada puede funcionar en entornos controlados, pero los escenarios del mundo real rara vez son predecibles. Pequeños cambios en la iluminación, el ángulo de la cámara o la apariencia de los objetos pueden romper rápidamente las reglas predefinidas y reducir la precisión.
Adaptabilidad deficiente a la variabilidad del mundo real: Los sistemas tradicionales no se ajustan bien a escenarios nuevos o inesperados. Las actualizaciones suelen requerir ajustes manuales y una optimización repetida, lo que ralentiza las mejoras del producto y aumenta el esfuerzo de mantenimiento.
Limitaciones de escalabilidad: A medida que crece el volumen de datos de imagen y vídeo, los antiguos procesos de procesamiento de imágenes tienen dificultades para seguir el ritmo. El procesamiento se vuelve más lento, lo que dificulta mantener el rendimiento en tiempo real en las transmisiones de vídeo.
Alta latencia en escenarios en tiempo real: Muchos enfoques tradicionales no pueden procesar transmisiones visuales continuas con la suficiente rapidez. Los resultados retrasados debilitan la automatización y reducen la capacidad de respuesta general.
Costosos requisitos de cómputo: Lograr una precisión aceptable a menudo exige importantes recursos de hardware, incluidas unidades de procesamiento gráfico (GPU) dedicadas, lo que aumenta los costes de infraestructura.

Link to this sectionEl papel de la visión artificial en la construcción de productos más inteligentes#

A continuación, veamos cómo la visión artificial puede favorecer un comportamiento más inteligente en los productos.

La mayoría de los productos conectados hoy en día ya recopilan datos visuales como parte de sus procesos operativos normales. Las cámaras están integradas en varios dispositivos, instaladas en espacios físicos y vinculadas a través de sistemas de Internet de las Cosas (IoT).

Como resultado, se capturan imágenes y vídeos constantemente en segundo plano. El desafío no es recopilar estos datos.

La parte complicada es darle sentido a los datos recopilados en tiempo real. Sin inteligencia visual, el material simplemente se almacena y se revisa más tarde, a menudo después de que ya se haya producido un problema.

La visión artificial cambia eso. Al usar redes neuronales entrenadas para reconocer patrones, los sistemas pueden analizar imágenes y vídeos en tiempo real. En lugar de depender de reglas fijas o revisiones manuales, los productos pueden interpretar lo que sucede en una escena y responder a medida que ocurren los eventos.

Para incorporar esta capacidad visual a los productos, los equipos pueden confiar en modelos de visión artificial eficientes como Ultralytics YOLO26. YOLO26 admite tareas de visión clave y puede ayudar a los productos a interpretar información visual con la suficiente rapidez como para permitir decisiones en tiempo real.

Link to this sectionLos bloques de construcción de productos impulsados por visión#

Aquí tienes un resumen rápido de cómo las tareas de visión artificial pueden contribuir a crear productos más inteligentes:

Detección de objetos: Esta tarea puede identificar y localizar objetos relevantes dentro de cada fotograma usando un cuadro delimitador y asignar una puntuación de confianza, lo que proporciona una comprensión clara de lo que está presente en una imagen.
Seguimiento de objetos: Se puede usar para seguir objetos específicos a través de múltiples fotogramas, lo que permite que un sistema de visión entienda el movimiento y los cambios a lo largo del tiempo.
Clasificación de imágenes: Esta tarea asigna una etiqueta a toda una imagen basándose en su contenido principal. Categoriza escenas o identifica condiciones específicas dentro del fotograma.
Segmentación de instancias: Puede delinear objetos con precisión a nivel de píxel, permitiendo que los productos interpreten mejor las formas, los límites y las relaciones espaciales.
Estimación de pose: Esta tarea detecta puntos clave en el cuerpo humano u otros objetos articulados. Captura la postura, el movimiento y las interacciones físicas en tiempo real.
Detección de cuadro delimitador orientado (OBB): Puede detectar objetos usando cuadros delimitadores girados en lugar de los horizontales estándar. Mejora la precisión de la localización cuando los objetos aparecen en ángulos o en entornos muy compactos.

Cuando estas capacidades se aplican a datos visuales continuos, los productos pueden responder más rápido, automatizar de forma más fiable y ofrecer experiencias que parecen conscientes en lugar de reactivas. En lugar de esperar a que los eventos se revisen más tarde, los sistemas pueden comprender y actuar en el momento.

Link to this sectionCómo los modelos de visión en tiempo real permiten un comportamiento inteligente del producto#

A medida que aprendes más sobre los productos impulsados por visión, puede que te preguntes cómo un sistema pasa de simplemente grabar vídeo a responder realmente en tiempo real.

Empieza por reconocer lo que hay delante de la cámara. A medida que entra la transmisión de vídeo, un modelo de visión analiza cada fotograma e identifica los elementos importantes, como objetos o personas específicas. En lugar de reaccionar a cada movimiento, el sistema se centra solo en las señales relevantes.

Otro aspecto clave es la velocidad. Los sistemas en tiempo real deben procesar cada fotograma de forma rápida y coherente, asegurando que la detección y la toma de decisiones ocurran sin un retraso notable.

Por ejemplo, la familia de modelos Ultralytics YOLO (You Only Look Once) fue creada para procesar datos visuales en tiempo real. Modelos como Ultralytics YOLO26 se basan en versiones anteriores como Ultralytics YOLOv5, Ultralytics YOLOv8 y Ultralytics YOLO11, incorporando mejoras arquitectónicas, optimizaciones de rendimiento y mejoras de eficiencia. El resultado es una mayor velocidad y precisión, incluso en condiciones exigentes del mundo real.

Cuando se integran en un producto, estos modelos se ejecutan continuamente en segundo plano, analizando cada fotograma a medida que llega. El sistema comprueba las condiciones predefinidas y, una vez cumplidas, puede activar instantáneamente una alerta, actualizar un flujo de trabajo o iniciar una acción.

Esto hace que los sistemas impulsados por visión sean más receptivos, escalables y prácticos para su integración en entornos que van desde la robótica y los vehículos autónomos hasta los sistemas de hogar inteligente y seguridad. Para los líderes empresariales, esto se traduce en respuestas más rápidas, menos revisiones manuales y una automatización que resulta fiable en lugar de reactiva.

Link to this sectionUso de YOLO26 para potenciar la inteligencia visual en tiempo real en los productos#

Los modelos Ultralytics YOLO, incluido YOLO26, están disponibles listos para usar como modelos preentrenados. Esto significa que ya están entrenados en conjuntos de datos grandes y ampliamente utilizados, como el conjunto de datos COCO.

Gracias a este preentrenamiento, YOLO26 puede reconocer inmediatamente objetos comunes del mundo real. Esto ofrece a los equipos de producto un punto de partida práctico, lo que significa que pueden crear funciones visuales sin tener que entrenar un modelo desde cero.

Para necesidades de producto más específicas, estos modelos preentrenados pueden ajustarse aún más utilizando datos específicos del dominio con anotaciones de alta calidad.

Por ejemplo, considera un restaurante equipado con cámaras de techo. Un modelo de IA de visión entrenado a medida, como YOLO26, puede detectar cuántas personas hay dentro del espacio. Puede identificar qué mesas están ocupadas y qué sillas están vacías.

YOLO26 detectando personas, espacios abiertos y cajas atendidas en una tienda minorista

Fig 2. YOLO26 permite la detección en tiempo real de personas, espacios abiertos y cajas atendidas en tiendas minoristas. (Fuente)

En este tipo de escenario, YOLO26 actúa como un motor visual que funciona continuamente en segundo plano. Los equipos también pueden implementar tales modelos en dispositivos edge, dependiendo de las necesidades de rendimiento y los objetivos de eficiencia energética.

Link to this sectionAplicaciones en el mundo real de los modelos YOLO en productos inteligentes#

Ahora que entendemos mejor cómo funcionan los modelos de visión en tiempo real, veamos cómo se pueden aplicar los modelos Ultralytics YOLO dentro de productos inteligentes para diferentes casos de uso, con el fin de hacerlos más conscientes, receptivos y capaces de actuar sobre lo que ven.

Link to this sectionInteligencia de productos sanitarios con YOLO#

Cuando se trata de formación quirúrgica en el sector sanitario, a menudo se revisan manualmente horas de metraje de los procedimientos para evaluar el manejo de las herramientas y el flujo de trabajo. Este proceso puede llevar mucho tiempo y depender en gran medida de la observación humana.

Con un modelo de visión basado en YOLO integrado en el sistema, las transmisiones de vídeo se pueden analizar automáticamente a medida que se realizan los procedimientos. El modelo puede detectar instrumentos quirúrgicos en tiempo real e identificar dónde y cuándo se utilizan.

Esto permite un registro estructurado, análisis mejorados e información de rendimiento de alta calidad sin necesidad de revisión manual constante. De hecho, la investigación utilizando el modelo YOLO11, que es un predecesor del último modelo YOLO26, mostró que la detección de instrumentos laparoscópicos en tiempo real podría ejecutarse eficazmente incluso en sistemas integrados.

Detección de instrumentos laparoscópicos en tiempo real usando YOLO

Fig 3. Detección de instrumentos laparoscópicos en tiempo real usando YOLO (Fuente)

El modelo mantuvo una alta precisión mientras funcionaba con la suficiente rapidez para entornos quirúrgicos en directo. Esto demuestra cómo el aprendizaje profundo puede respaldar una retroalimentación visual fiable en tiempo real durante los procedimientos.

Link to this sectionCreación de experiencias minoristas inteligentes impulsadas por YOLO#

Todos hemos estado frente a un estante de supermercado lleno de gente tratando de encontrar el producto adecuado. Muchos artículos se parecen, las etiquetas son pequeñas y los productos a menudo se colocan en el lugar equivocado.

Para los minoristas, esto hace que la visibilidad de los estantes en tiempo real sea difícil. La IA de visión y los modelos de detección de objetos YOLO pueden ayudar a los sistemas de la tienda a entender qué hay realmente en el estante a través de cámaras y transmisiones de vídeo en directo. Esto reduce la dependencia de los escaneos de códigos de barras y las revisiones manuales, haciendo que el seguimiento de los estantes sea más preciso y receptivo.

Detectando y segmentando productos en estantes de supermercado con YOLO26

Fig 4. Detectando y segmentando productos en estantes de supermercado con YOLO26

Con este tipo de precisión, los minoristas ya no tienen que depender solo de comprobaciones manuales periódicas. Los estantes se pueden supervisar continuamente a través de vídeo en directo.

El bajo stock se puede marcar de inmediato, los productos mal colocados se pueden detectar más rápido y los procesos de pago pueden ejecutarse con mayor fluidez. Esto ofrece a los minoristas un mejor control operativo al tiempo que crea una experiencia de compra más fluida para los clientes.

Link to this sectionIA de visión y navegación autónoma#

Los sistemas autónomos pueden ser muy eficientes, pero a menudo dependen de rutas fijas o coordenadas preestablecidas. Si bien esto funciona en entornos estables, las condiciones del mundo real rara vez siguen siendo las mismas.

Las soluciones de IA de visión, impulsadas por modelos de aprendizaje profundo, permiten a las máquinas entender su entorno y ajustarse en tiempo real. Con la visión artificial combinada con algoritmos adaptativos, los sistemas pueden responder a los cambios a medida que ocurren en lugar de depender de instrucciones rígidas preprogramadas.

Entonces, ¿cómo funciona esto en entornos del mundo real? Tomemos el ejemplo de un robot que opera en un almacén. Las cámaras capturan su entorno continuamente y un modelo de visión realiza una detección de objetos en tiempo real para identificar obstáculos, estantes y caminos.

Estas detecciones respaldan la localización, ayudando al robot a determinar su posición precisa dentro de las instalaciones. Basándose en esta entrada visual, los algoritmos de optimización ajustan su ruta al instante, permitiéndole navegar de forma eficiente y mantener una automatización fluida incluso cuando las condiciones cambian.

Link to this sectionSupervisión de infraestructuras y detección más inteligente de defectos#

Las líneas eléctricas y los equipos de la red necesitan inspecciones periódicas para seguir siendo seguros y fiables. La mayor parte del tiempo, estas inspecciones de servicios públicos siguen implicando comprobaciones manuales, que requieren tiempo y son difíciles de gestionar en áreas grandes o remotas.

La IA de visión ofrece una forma más sencilla de vigilar la infraestructura sin depender solo de visitas programadas al sitio. Modelos como YOLO26 pueden detectar defectos en aisladores de líneas eléctricas, incluidas grietas, corrosión o daños visibles, directamente a partir de imágenes capturadas en condiciones reales al aire libre.

Al analizar datos visuales en tiempo real, dichos sistemas pueden señalar problemas potenciales que de otro modo pasarían desapercibidos. Identificar estos problemas a tiempo reduce el riesgo de fallo del equipo, minimiza las interrupciones inesperadas y respalda operaciones de mantenimiento más proactivas.

Link to this sectionMedir el ROI de los productos inteligentes basados en visión#

Para los líderes empresariales, la IA de visión no se trata solo de rendimiento técnico. Se trata de un impacto empresarial medible.

Cuando se implementan con detenimiento, los sistemas impulsados por visión pueden mejorar la eficiencia, reducir costes y aumentar la precisión. Estas ganancias también contribuyen a mejores experiencias de usuario y a un mayor rendimiento general.

Aquí hay algunas áreas donde ese impacto se vuelve claro:

Menor esfuerzo manual: Los sistemas de visión automatizan tareas repetitivas de inspección, supervisión y verificación, reduciendo la dependencia de procesos manuales y liberando a los equipos para que se centren en trabajos más estratégicos.
Ciclos de decisión más rápidos: El análisis visual en tiempo real permite a los sistemas detectar problemas o activar acciones al instante, acortando los tiempos de respuesta y manteniendo las operaciones funcionando sin problemas.
Menos errores operativos: La detección automatizada aporta consistencia. Al reducir la supervisión humana en tareas rutinarias, las organizaciones suelen observar menos errores y resultados más fiables.
Mayor participación del usuario: Los productos que pueden ver y responder de forma inteligente se sienten más interactivos y relevantes. Esto conduce a una mayor confianza del usuario, mejores experiencias y una mayor adopción a largo plazo.

Link to this sectionConclusiones clave#

La IA de visión permite a los productos interpretar información visual en tiempo real, respaldando una automatización más inteligente y experiencias más receptivas. Con capacidades como la detección, el seguimiento y la segmentación, los sistemas van más allá de las reglas básicas hacia decisiones conscientes del contexto. Modelos eficientes como Ultralytics YOLO26 hacen que sea práctico construir productos competitivos y escalables impulsados por visión.

Únete a nuestra comunidad activa y descubre innovaciones como la IA en la fabricación y la IA de visión en el comercio minorista. Visita nuestro repositorio de GitHub y comienza con la visión artificial hoy mismo consultando nuestras opciones de licencia.

Explore solutions

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información

Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información

IA en la fabricación

Más información

IA en automoción

Más información

IA en agricultura

Más información

IA en robótica

Más información

IA en logística

Más información

IA en el sector minorista

Más información

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información

IA en la fabricación

Más información

IA en automoción

Más información

IA en agricultura

Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático

Solicitar licencia Empezar