Al hacer clic en "Aceptar todas las cookies", usted acepta el almacenamiento de cookies en su dispositivo para mejorar la navegación por el sitio, analizar el uso del sitio y ayudar en nuestros esfuerzos de marketing. Más información en
Configuración de cookies
Al hacer clic en "Aceptar todas las cookies", usted acepta el almacenamiento de cookies en su dispositivo para mejorar la navegación por el sitio, analizar el uso del sitio y ayudar en nuestros esfuerzos de marketing. Más información en
Aprenda a convertir las imágenes de visión por ordenador en información empresarial significativa. Descubra cómo conectar los puntos entre imágenes y datos para tomar mejores decisiones.
La visión por ordenador es un subcampo de la inteligencia artificial (IA) que permite a las máquinas interpretar datos visuales y tomar decisiones basadas en ellos. Cuando se presenta una aplicación de visión por ordenador, suele incluir varios resultados visuales, como imágenes o vídeos, anotados con cuadros delimitadores o máscaras de segmentación para resaltar los objetos de interés. Aunque estas imágenes son impresionantes, no siempre ofrecen una imagen clara de lo que pueden aportar.
Por ejemplo, en una tienda. Un modelo de visión por ordenador como Ultralytics YOLOv8 puede utilizarse para crear un mapa de calor que muestre dónde pasan los clientes la mayor parte de su tiempo. La visualización puede parecerse a un mapa de colores que indica por dónde tienden a pasear o detenerse la mayoría de los clientes. Sin embargo, la verdadera información que se obtiene es la posibilidad de identificar las secciones de la tienda que rinden menos. Los minoristas pueden utilizar esta información práctica para reorganizar la colocación de los productos, optimizar el espacio en las estanterías o ajustar los expositores promocionales para atraer más clientes y aumentar las ventas.
Fig. 1. Ejemplo de mapa de calor creado para una tienda minorista con YOLOv8.
El valor real de la visión por ordenador reside en traducir estos resultados visuales en información empresarial significativa que pueda mejorar y optimizar directamente las operaciones para impulsar el crecimiento y la eficiencia. En este artículo, analizaremos lo que la visión por ordenador puede ofrecer a las empresas y cómo puede tener un impacto real en sus operaciones. También hablaremos de las estrategias para ir más allá de los resultados visuales y obtener información práctica que impulse resultados reales. Pongámonos manos a la obra.
Visualización frente a conocimiento en IA: el error más común
Empecemos por entender la diferencia entre visualizaciones y percepciones. En la visión por ordenador, las visualizaciones como los cuadros delimitadores y los mapas de calor son importantes para comprender los resultados del modelo. Estos resultados visuales sirven para ilustrar lo que la visión por ordenador puede y no puede hacer. Sin embargo, las percepciones van más allá de estas imágenes y ofrecen información valiosa que puede utilizarse para tomar decisiones informadas, mejorar procesos o comprender patrones con mayor profundidad. Convierten los datos visuales brutos en conclusiones significativas que ayudan a descubrir tendencias, predecir resultados u optimizar estrategias.
Por ejemplo, un sistema de seguimiento del entrenamiento por visión computerizada podría utilizar la estimación de la postura y modelos como YOLOv8 para seguir los movimientos del cuerpo identificando puntos clave como las articulaciones y las extremidades. El resultado visual, como esqueletos animados que muestran cómo se mueve una persona, puede ser interesante de ver. Sin embargo, el valor real procede de la información cuantificable que proporcionan estos datos, como el número de flexiones o sentadillas realizadas, la duración de cada ejercicio, la consistencia de las repeticiones y la calidad de la forma mantenida a lo largo de la sesión.
Los entrenadores pueden utilizar esta información para analizar las formas de hacer ejercicio de sus clientes, detectar movimientos incorrectos que podrían causar lesiones, realizar un seguimiento del rendimiento a lo largo del tiempo y comprender los hábitos de entrenamiento. Esta información ayuda a los entrenadores a ofrecer mejores comentarios, diseñar planes de entrenamiento más eficaces y ayudar a los clientes a alcanzar sus objetivos de forma más segura y eficiente.
Fig. 2. Uso de YOLOv8 para seguir los movimientos del cuerpo.
Aportar valor empresarial con la visión por ordenador
A medida que avanza la tecnología, las empresas siempre buscan formas de adelantarse a la competencia, y la visión por ordenador es una forma excelente de hacerlo. Al incorporar los conocimientos de la visión por computador a sus flujos de trabajo existentes, pueden ver resultados reales y cuantificables.
Estos conocimientos pueden ofrecer información valiosa en diversos ámbitos de la empresa, como:
Métricas de rendimiento: Datos cuantitativos que ponen de relieve indicadores y patrones clave de rendimiento.
Análisis de tendencias: Comprender las tendencias emergentes y los cambios en el comportamiento de los clientes o las condiciones del mercado a lo largo del tiempo.
Información predictiva: Previsión de resultados futuros o identificación de posibles problemas a partir de datos pasados y en tiempo real.
Alertas en tiempo real: Notificaciones instantáneas de eventos importantes, anomalías o cambios que requieren atención.
Por ejemplo, en la industria del petróleo y el gas, la detección de incendios o fugas de gas en hornos se realizaba tradicionalmente mediante supervisión manual o sistemas de sensores básicos. Estos métodos carecen a menudo de la velocidad y precisión necesarias para detectar a tiempo posibles peligros. La visión por ordenador puede mejorar este proceso utilizando cámaras y modelos de detección de objetos como YOLOv8 para supervisar continuamente los hornos y detectar rápidamente problemas como llamas inusuales, exceso de humo o fugas de gas.
El resultado visual de esta aplicación podría ser la aparición de recuadros en las imágenes que resalten las zonas en las que se detecta un incendio. Sin embargo, la verdadera ventaja consiste en convertir estas señales visuales en información práctica. Esta información puede ayudar a determinar la causa de un incendio, predecir problemas en los equipos y planificar el mantenimiento para evitar problemas futuros. Gracias a esta información, las empresas industriales pueden responder rápidamente a posibles incendios, evitar daños costosos, reducir el tiempo de inactividad y mejorar la seguridad y la eficiencia.
Fig. 3. Uso de YOLOv8 para detectar incendios.
Toma de decisiones basada en datos con IA
Los resultados visuales de un modelo entrenado pueden convertirse en perspectivas que se organizan en cuadros de mando y bases de datos para un análisis más profundo. Los cuadros de mando, en particular, pueden ofrecer a los empresarios una visión clara de las métricas de rendimiento, ayudar a detectar anomalías y respaldar decisiones basadas en datos y en información en tiempo real.
Por ejemplo, en la vigilancia del tráfico, se puede utilizar un modelo de visión por ordenador como YOLOv8 para analizar imágenes de tráfico en directo y detectar y rastrear diferentes vehículos, como coches, furgonetas y autobuses, en la carretera. La visualización de salida puede mostrar vehículos etiquetados y rastrear el número de vehículos que entran y salen de zonas específicas. Esta información también puede mostrarse en un cuadro de mandos que ofrece un desglose del recuento de vehículos por zonas y calcula métricas clave como el recuento total de vehículos y la velocidad media.
Fig. 4. Uso de YOLOv8 para detectar y rastrear el tráfico.
Estos datos ayudan a los equipos de gestión del tráfico a comprender la fluidez del tráfico, identificar los puntos de congestión, predecir los atascos y ajustar los semáforos o las rutas para mantener la fluidez. Al convertir los datos visuales en información práctica, este sistema ayuda a los planificadores urbanos a tomar decisiones inteligentes para mejorar la fluidez del tráfico y reducir los problemas en la carretera.
Reducir la brecha entre la IA y las necesidades empresariales
Ahora que hemos hablado del impacto empresarial de la visión por ordenador, veamos las estrategias para salvar la distancia entre la visualización de datos y la visión empresarial. Al desarrollar soluciones de IA, estas consideraciones son vitales porque ayudan a ir más allá de las simples tareas de visión por ordenador para comprender el contexto y las relaciones dentro de los datos. Un análisis en profundidad permite crear perspectivas más significativas y relevantes para las necesidades empresariales.
Para empezar, es esencial mejorar la comunicación entre los desarrolladores de IA y los líderes empresariales. Los desarrolladores de IA pueden mantener conversaciones abiertas con las partes interesadas de la empresa para entender sus objetivos, retos y lo que esperan conseguir. Pensando desde la perspectiva del empresario, es más fácil determinar cómo la visión computerizada puede abordar directamente problemas específicos. En lugar de desarrollar soluciones genéricas, los desarrolladores pueden centrarse en crear aplicaciones de visión computerizada que resuelvan necesidades empresariales reales.
Por ejemplo, en el caso del petróleo y el gas que hemos comentado antes, hablar directamente con una parte interesada de la empresa puede ayudar a un desarrollador a comprender necesidades específicas, como el envío de alertas en función del tamaño y la gravedad de un incendio detectado. Conocer estos detalles ayuda a los desarrolladores a personalizar la solución para dar prioridad a las alertas críticas, garantizando tiempos de respuesta más rápidos y reduciendo los riesgos, lo que aumenta la seguridad y la eficiencia.
Fig. 5. La comunicación es esencial. Fuente de la imagen: Envato Elements.
Una vez establecida una comunicación clara, el siguiente paso es centrarse en la calidad y el tratamiento de los datos. Los desarrolladores pueden asegurarse de que los datos utilizados para la formación y el análisis estén limpios, sean coherentes y se ajusten a las necesidades del cliente. Racionalizar el procesamiento de datos puede ayudar a reducir los retrasos y proporcionar información precisa y oportuna. Además, la integración de los sistemas de visión computerizada con las herramientas empresariales existentes puede mejorar la toma de decisiones y permitir a las empresas responder con rapidez a los datos importantes.
He aquí algunos factores más a tener en cuenta:
Visualización fácil de usar: Asegúrese de que los resultados visuales sean sencillos y fáciles de interpretar para los interesados sin conocimientos técnicos.
Escalabilidad: Diseñe soluciones de IA que puedan adaptarse a las crecientes necesidades de datos de la empresa y a los cambios operativos.
Análisis en tiempo real: Incorpore el procesamiento de datos en tiempo real para proporcionar información oportuna que pueda impulsar acciones inmediatas.
Seguridad y privacidad: Proteja la integridad y confidencialidad de los datos, especialmente cuando se trate de información sensible.
Aprendizaje y adaptación continuos: Implantar mecanismos de aprendizaje continuo y actualización de modelos para adaptarse a entornos empresariales y patrones de datos cambiantes.
El futuro de la visión por ordenador para las empresas
Aunque los resultados visuales, como los cuadros delimitadores y las máscaras, demuestran las capacidades de la visión por ordenador, las empresas necesitan algo más que representaciones visuales: necesitan información práctica que pueda impulsar la toma de decisiones y las mejoras operativas. Al comprender los objetivos empresariales y aplicar la visión por ordenador a problemas del mundo real, los desarrolladores pueden proporcionar información que mejore las operaciones, la experiencia del cliente y los costes.
Para salvar la distancia entre la visualización y la información práctica, los desarrolladores pueden comunicarse claramente con las partes interesadas, utilizar datos de alta calidad y mejorar el procesamiento de datos. Estos pasos ayudan a las empresas a sacar el máximo partido de la tecnología de visión por ordenador, convirtiendo la información en beneficios reales.
¡Aprendamos y exploremos juntos! Eche un vistazo a nuestro repositorio de GitHub para ver nuestras contribuciones a la IA y no olvide colaborar con nuestra comunidad. Descubra cómo estamos redefiniendo sectores como el manufacturero y el sanitario con tecnología de IA de vanguardia.