Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Eventos

Potenciando la Edge AI con Sony IMX500 y AITRIOS

Acompáñanos a repasar los avances de Sony en el procesamiento de IA en el borde (on-edge) con el sensor IMX500 y la plataforma AITRIOS, para ayudar a optimizar los modelos YOLO de Ultralytics.

ABAbirami Vina
4 min read
Potenciando la Edge AI con Sony IMX500 y AITRIOS

La IA de borde (Edge AI) permite que los modelos de inteligencia artificial (IA) funcionen directamente en dispositivos como smartphones, cámaras y drones. Su ventaja clave es que admite una toma de decisiones más rápida y en tiempo real sin depender de la nube. De hecho, los estudios muestran que usar IA en plataformas de borde puede aumentar la eficiencia operativa hasta en un 40%.

Los avances recientes en IA de borde, particularmente en visión artificial, la convirtieron en un tema central en YOLO Vision 2024 (YV24), el evento híbrido anual de Ultralytics que reúne a entusiastas y expertos en IA para explorar lo último en Vision AI. Uno de los puntos destacados del evento fue la presentación principal de Sony, donde exhibieron su nuevo hardware de IA de vanguardia y soluciones de software. El sensor IMX500 y la plataforma AITRIOS fueron los protagonistas, y Sony demostró cómo estas innovaciones facilitan y hacen más eficiente el despliegue de modelos Ultralytics YOLO como Ultralytics YOLO11 y Ultralytics YOLOv8 en el borde.

La sesión fue dirigida por Wei Tang, una gerente de desarrollo de negocios que se enfoca en las soluciones de imagen de Sony, y Amir Servi, un gerente de producto de aprendizaje profundo de borde con experiencia en el despliegue de modelos de aprendizaje profundo en dispositivos de borde.

En este artículo, repasaremos la charla de Sony en YV24 y exploraremos cómo el sensor IMX500 y la plataforma AITRIOS optimizan el uso de modelos YOLO para un procesamiento de IA en el borde más rápido y en tiempo real. ¡Empecemos!

Link to this sectionLa visión de Sony: Democratizar la IA en dispositivos de borde#

Wei Tang abrió la sesión hablando sobre el objetivo de Sony de hacer que la IA de borde sea tan accesible como lo hicieron con la fotografía hace años. Destacó cómo Sony se centra ahora en llevar Vision AI avanzada a más personas a través de la computación de borde. Uno de los factores impulsores detrás de esto es el impacto positivo que la IA de borde puede tener en el medio ambiente. Al procesar los datos directamente en los dispositivos en lugar de depender de centros de datos masivos, la computación de borde ayuda a reducir el uso de energía y las emisiones de carbono. Es un enfoque más inteligente y ecológico que encaja perfectamente con el compromiso de Sony de construir tecnología que no solo funcione mejor, sino que también ayude a crear un futuro más sostenible.

Wei explicó cómo Sony Semiconductor Solutions, la división de Sony que se especializa en tecnologías de imagen y detección, crea sensores de imagen avanzados. Estos sensores se utilizan en una variedad de dispositivos, convirtiendo la luz en señales electrónicas para capturar imágenes. Con más de 1.2 mil millones de sensores enviados cada año, se encuentran en casi la mitad de los teléfonos móviles del mundo, lo que convierte a Sony en un actor importante en la industria de la imagen.

Ejemplos de sensores de imagen de Sony

Fig 1. Ejemplos de los sensores de imagen de Sony.

Basándose en esta experiencia, Sony ahora va más allá al transformar estos sensores de dispositivos de captura de imágenes en herramientas inteligentes capaces de procesar datos en tiempo real, lo que permite obtener conocimientos basados en IA directamente en los dispositivos. Antes de discutir las soluciones de hardware y software que Sony está utilizando para apoyar este cambio, comprendamos los desafíos de la IA de borde que estas innovaciones pretenden resolver.

Link to this sectionDesafíos relacionados con el procesamiento de imágenes de IA en dispositivos de borde#

Desarrollar soluciones de IA de borde conlleva algunos desafíos clave, especialmente al trabajar con dispositivos como cámaras y sensores. Muchos de estos dispositivos tienen una potencia y capacidad de procesamiento limitadas, lo que dificulta ejecutar modelos de IA avanzados de manera eficiente.

Aquí tienes algunas de las otras limitaciones principales:

  • Complejidad del software: Adaptar modelos de IA para que funcionen en varios dispositivos de borde con diferentes configuraciones de hardware puede ser complejo y requerir ajustes y optimizaciones.
  • Cuellos de botella en el posprocesamiento: A menudo hay un retraso al transferir grandes cantidades de datos desde el dispositivo al host para el posprocesamiento. Frecuentemente consume más tiempo que la inferencia del modelo de IA real.
  • Explosión de datos: Con muchos dispositivos IoT generando datos constantemente, el volumen de datos que debe manejarse localmente puede ser abrumador, ejerciendo aún más presión sobre los dispositivos de borde.

Link to this sectionConociendo el sensor de visión inteligente Sony IMX500#

El sensor de visión inteligente Sony IMX500 es una pieza de hardware revolucionaria en el procesamiento de IA de borde. Es el primer sensor de visión inteligente del mundo con capacidades de IA en el chip. Este sensor ayuda a superar muchos desafíos en la IA de borde, incluidos los cuellos de botella en el procesamiento de datos, las preocupaciones por la privacidad y las limitaciones de rendimiento.

Mientras que otros sensores simplemente transmiten imágenes y fotogramas, el IMX500 cuenta toda la historia. Procesa los datos directamente en el sensor, lo que permite a los dispositivos generar información en tiempo real. Durante la sesión, Wei Tang dijo: "Al aprovechar nuestra avanzada tecnología de sensor de imagen, nuestro objetivo es potenciar una nueva generación de aplicaciones que puedan mejorar la vida cotidiana". El IMX500 está diseñado para cumplir este objetivo, transformando la forma en que los dispositivos manejan los datos directamente en el sensor, sin necesidad de enviarlos a la nube para su procesamiento.

Aquí tienes algunas de sus características clave:

  • Salida de metadatos: En lugar de enviar imágenes completas, genera metadatos, lo que reduce significativamente el tamaño de los datos, disminuyendo el uso de ancho de banda y los costes.
  • Privacidad mejorada: Al procesar los datos en el dispositivo, el IMX500 mejora la privacidad, especialmente en situaciones donde está involucrada información sensible, como en tareas de visión artificial relacionadas con humanos, por ejemplo, el conteo de personas.
  • Procesamiento en tiempo real: La capacidad del sensor para manejar datos rápidamente significa que admite una toma de decisiones rápida y en tiempo real que permite aplicaciones de IA de borde como sistemas autónomos.

El IMX500 no es solo un sensor de cámara; es una potente herramienta de detección que transforma la forma en que los dispositivos perciben e interactúan con el mundo que les rodea. Al integrar la IA directamente en el sensor, Sony está haciendo que la IA de borde sea más accesible para industrias como la automotriz, la salud y las ciudades inteligentes. En las secciones siguientes, profundizaremos en cómo el IMX500 funciona con los modelos Ultralytics YOLO para mejorar la detección de objetos y el procesamiento de datos en dispositivos de borde.

Wei Tang en el escenario de YOLO Vision 2024 presentando el Sony IMX500

Fig 2. Wei Tang en el escenario de YOLO Vision 2024 presentando el sensor de visión inteligente Sony IMX500.

Link to this sectionLa plataforma AITRIOS de Sony: Simplificando la IA de borde#

Después de presentar el sensor IMX500, Wei Tang expresó que, si bien el hardware es crucial, no es suficiente por sí solo para abordar el alcance total de los desafíos involucrados en el despliegue de IA en el borde. Habló sobre cómo integrar IA en dispositivos como cámaras y sensores requiere algo más que hardware avanzado: necesita un software inteligente para gestionarlo. Aquí es donde entra la plataforma AITRIOS de Sony, que ofrece una solución de software confiable diseñada para hacer que el despliegue de IA en dispositivos de borde sea más simple y eficiente.

AITRIOS actúa como un puente entre los modelos de IA complejos y las limitaciones de los dispositivos de borde. Proporciona a los desarrolladores una gama de herramientas para desplegar rápidamente modelos de IA preentrenados. Pero, lo que es más importante, admite el reentrenamiento continuo para que los modelos de IA puedan mantenerse adaptables a los cambios del mundo real.

Wei también destacó cómo AITRIOS simplifica el proceso para aquellos que no tienen una profunda experiencia en IA, ofreciendo flexibilidad para personalizar modelos de IA para casos de uso específicos de IA de borde. También aborda desafíos comunes como las limitaciones de memoria y las caídas de rendimiento, lo que facilita integrar la IA en dispositivos más pequeños sin sacrificar la precisión o la velocidad.

Ejemplos de casos de uso de IA en el borde

Fig 3. Ejemplos de casos de uso de IA de borde. Fuente de la imagen: SONY Semicon | AITRIOS.

Link to this sectionOptimización de modelos YOLO en el IMX500#

En la segunda parte de la charla, el micrófono pasó a Amir, quien se sumergió en el lado técnico de cómo Sony optimizó los modelos YOLO en el sensor IMX500.

Amir comenzó diciendo: "Los modelos YOLO están habilitados para el borde y son bastante fáciles de optimizar, gracias a Glenn y al equipo. Les convenceré de eso, no se preocupen". Amir explicó luego que, si bien gran parte del enfoque suele centrarse en optimizar el modelo de IA en sí, este enfoque a menudo pasa por alto una preocupación crucial: los cuellos de botella en el post-procesamiento.

Amir señaló que, en muchos casos, una vez que el modelo de IA completa su tarea, el proceso de transferir datos y gestionar el posprocesamiento en un dispositivo host puede causar retrasos significativos. Esta transferencia de datos de ida y vuelta entre el dispositivo y el host introduce latencia, lo cual puede ser un obstáculo importante para alcanzar el mejor rendimiento.

Amir Servi en el escenario de YOLO Vision 2024 explicando los cuellos de botella del postprocesamiento

Fig 4. Amir Servi en el escenario de YOLO Vision 2024 explicando los cuellos de botella en el post-procesamiento.

Para abordar esto, Amir enfatizó la importancia de observar todo el sistema de extremo a extremo, en lugar de solo centrarse en el modelo de IA. Con el sensor IMX500, descubrieron que el post-procesamiento era el principal cuello de botella que ralentizaba todo. Compartió que el verdadero avance fue desbloquear la supresión no máxima (NMS) en el chip.

Permitió que el post-procesamiento ocurriera directamente en el sensor, eliminando la necesidad de transferir grandes cantidades de datos a un dispositivo host. Al ejecutar NMS directamente en el IMX500, Sony rompió lo que Amir llamó el “techo de cristal del post-procesamiento”, logrando un rendimiento y una reducción de latencia mucho mejores.

Diagrama de cómo superar el cuello de botella del postprocesamiento

Fig 5. Superando el cuello de botella del post-procesamiento. Fuente de la imagen: SONY Semicon | AITRIOS

A continuación, veremos cómo esta innovación ayudó a los modelos YOLO, especialmente YOLOv8 Nano, a ejecutarse de manera más eficiente en dispositivos de borde, creando nuevas oportunidades para el procesamiento de IA en tiempo real en hardware más pequeño y con recursos limitados.

Link to this sectionLos modelos YOLOv8 logran un aumento de velocidad de 4x con el IMX500 de Sony#

Terminando la charla con una nota alta, Amir demostró cómo pudieron cuadruplicar el rendimiento del modelo YOLOv8 Nano ejecutando NMS en el borde. Lo mostró en una Raspberry Pi 5, que estaba integrada con el sensor de IA IMX500. Amir comparó el rendimiento cuando el post-procesamiento se manejaba en un dispositivo host frente a cuando se hacía en el chip IMX500.

Los resultados mostraron claramente una mejora importante en los fotogramas por segundo (FPS) y en la eficiencia general cuando el procesamiento se realizó en el chip. La optimización hizo que la detección de objetos fuera más rápida y fluida, y también demostró la viabilidad del procesamiento de IA en tiempo real en dispositivos más pequeños y con recursos limitados como la Raspberry Pi.

Link to this sectionConclusiones clave#

El sensor IMX500 de Sony, la plataforma AITRIOS y los modelos Ultralytics YOLO están remodelando el desarrollo de la IA de borde. El procesamiento de IA en el chip reduce la transferencia de datos y la latencia al tiempo que aumenta la privacidad, la seguridad y la eficiencia. Al centrarse en todo el sistema, no solo en el modelo de IA, estas innovaciones hacen que la IA de borde sea más accesible para los desarrolladores y para aquellos sin una experiencia profunda en IA. A medida que la tecnología de IA de borde continúa avanzando, es probable que permita dispositivos más inteligentes, una toma de decisiones más rápida y protecciones de privacidad más sólidas en una amplia gama de industrias y aplicaciones.

¡Mantente conectado con nuestra comunidad para seguir aprendiendo sobre IA! Echa un vistazo a nuestro repositorio de GitHub para descubrir cómo podemos usar la IA para crear soluciones innovadoras en diversas industrias como la agricultura y la fabricación. 🚀

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático