Únete a nosotros mientras resumimos los avances de Sony en el procesamiento de IA en el borde con el sensor IMX500 y la plataforma AITRIOS, para ayudar a optimizar los modelos YOLO de Ultralytics.
Únete a nosotros mientras resumimos los avances de Sony en el procesamiento de IA en el borde con el sensor IMX500 y la plataforma AITRIOS, para ayudar a optimizar los modelos YOLO de Ultralytics.
La IA en el borde permite que los modelos de inteligencia artificial (IA) operen directamente en dispositivos como teléfonos inteligentes, cámaras y drones. Su principal ventaja es que admite una toma de decisiones más rápida y en tiempo real sin depender de la nube. De hecho, los estudios demuestran que el uso de la IA en plataformas de borde puede aumentar la eficiencia operativa hasta en un 40%.
Los recientes avances en la IA en el borde, particularmente en la visión artificial, la convirtieron en un tema central en YOLO Vision 2024 (YV24), el evento híbrido anual de Ultralytics que reúne a entusiastas y expertos de la IA para explorar lo último en Vision AI. Uno de los puntos destacados del evento fue la presentación magistral de Sony, donde mostraron sus nuevas y vanguardistas soluciones de hardware de IA y software. Se presentaron el sensor IMX500 y la plataforma AITRIOS, y Sony demostró cómo estas innovaciones están facilitando y haciendo más eficiente la implementación de modelos YOLO de Ultralytics como Ultralytics YOLO11 y Ultralytics YOLOv8 en el borde.
La sesión fue dirigida por Wei Tang, Gerente de Desarrollo de Negocios que se enfoca en las soluciones de imagen de Sony, y Amir Servi, Gerente de Producto de Deep Learning en el Edge con experiencia en el despliegue de modelos de aprendizaje profundo en dispositivos edge.
En este artículo, revisaremos la charla de Sony en YV24 y exploraremos cómo el sensor IMX500 y la plataforma AITRIOS optimizan el uso de los modelos YOLO para un procesamiento de IA en el borde más rápido y en tiempo real. ¡Empecemos!
Wei Tang abrió la sesión hablando del objetivo de Sony de hacer que la IA en el borde sea tan accesible como lo hicieron con la fotografía hace años. Destacó cómo Sony se centra ahora en llevar la IA de visión avanzada a más personas a través de la computación en el borde. Uno de los factores impulsores de esto es el impacto positivo que la IA en el borde puede tener en el medio ambiente. Al procesar los datos directamente en los dispositivos en lugar de depender de enormes centros de datos, la computación en el borde ayuda a reducir el consumo de energía y las emisiones de carbono. Es un enfoque más inteligente y ecológico que encaja perfectamente con el compromiso de Sony de construir una tecnología que no solo funcione mejor, sino que también ayude a crear un futuro más sostenible.
Wei continuó explicando cómo Sony Semiconductor Solutions, la división de Sony que se especializa en tecnologías de imagen y detección, crea sensores de imagen avanzados. Estos sensores se utilizan en una variedad de dispositivos, convirtiendo la luz en señales electrónicas para capturar imágenes. Con más de 1.200 millones de sensores enviados cada año, se encuentran en casi la mitad de los teléfonos móviles del mundo, lo que convierte a Sony en un actor importante en la industria de la imagen.

Basándose en esta experiencia, Sony ahora está llevando las cosas más allá transformando estos sensores de dispositivos de captura de imágenes en herramientas inteligentes que pueden procesar datos en tiempo real, permitiendo conocimientos impulsados por la IA directamente en los dispositivos. Antes de hablar de las soluciones de hardware y software que Sony está utilizando para apoyar este cambio, vamos a entender los retos de la IA en el edge que estas innovaciones pretenden resolver.
El desarrollo de soluciones de IA en el borde presenta algunos desafíos clave, especialmente cuando se trabaja con dispositivos como cámaras y sensores. Muchos de estos dispositivos tienen una capacidad de procesamiento y energía limitada, lo que dificulta la ejecución eficiente de modelos avanzados de IA.
Estas son algunas de las otras limitaciones principales:
El sensor de visión inteligente Sony IMX500 es una pieza de hardware revolucionaria en el procesamiento de IA en el borde. Es el primer sensor de visión inteligente del mundo con capacidades de IA en el chip. Este sensor ayuda a superar muchos retos en la IA en el borde, incluyendo los cuellos de botella en el procesamiento de datos, los problemas de privacidad y las limitaciones de rendimiento.
Mientras que otros sensores simplemente transmiten imágenes y fotogramas, el IMX500 cuenta toda una historia. Procesa los datos directamente en el sensor, lo que permite a los dispositivos generar información en tiempo real. Durante la sesión, Wei Tang dijo: "Al aprovechar nuestra avanzada tecnología de sensores de imagen, pretendemos potenciar una nueva generación de aplicaciones que puedan mejorar la vida cotidiana". El IMX500 está diseñado para cumplir este objetivo, transformando la forma en que los dispositivos gestionan los datos directamente en el sensor, sin necesidad de enviarlos a la nube para su procesamiento.
Estas son algunas de sus características principales:
El IMX500 no es solo un sensor de cámara, es una poderosa herramienta de detección que transforma la forma en que los dispositivos perciben e interactúan con el mundo que los rodea. Al integrar la IA directamente en el sensor, Sony está haciendo que la IA en el borde sea más accesible para industrias como la automotriz, la sanitaria y las ciudades inteligentes. En las siguientes secciones, profundizaremos en cómo el IMX500 funciona con los modelos YOLO de Ultralytics para mejorar la detección de objetos y el procesamiento de datos en dispositivos en el borde.

Después de presentar el sensor IMX500, Wei Tang expresó que, si bien el hardware es crucial, no es suficiente por sí solo para abordar el alcance total de los desafíos que implica la implementación de la IA en el Edge. Habló de cómo la integración de la IA en dispositivos como cámaras y sensores requiere algo más que hardware avanzado: necesita un software inteligente para gestionarlo. Aquí es donde entra en juego la plataforma AITRIOS de Sony, que ofrece una solución de software fiable diseñada para que la implementación de la IA en dispositivos Edge sea más sencilla y eficiente.
AITRIOS actúa como un puente entre los modelos complejos de IA y las limitaciones de los dispositivos periféricos. Proporciona a los desarrolladores una gama de herramientas para implementar rápidamente modelos de IA preentrenados. Pero lo que es más importante, admite el reentrenamiento continuo para que los modelos de IA puedan seguir adaptándose a los cambios del mundo real.
Wei también destacó cómo AITRIOS simplifica el proceso para aquellos que no tienen una gran experiencia en IA, ofreciendo flexibilidad para personalizar los modelos de IA para casos de uso específicos de IA en el borde. También aborda retos comunes como las limitaciones de memoria y las caídas de rendimiento, lo que facilita la integración de la IA en dispositivos más pequeños sin sacrificar la precisión ni la velocidad.

En la segunda parte de la charla, el micrófono pasó a Amir, quien profundizó en el aspecto técnico de cómo Sony optimizó los modelos YOLO en el sensor IMX500.
Amir comenzó diciendo: "Los modelos YOLO habilitan el edge computing y son bastante fáciles de optimizar, gracias a Glenn y al equipo. Les convenceré de ello, no se preocupen". Amir explicó entonces que, aunque normalmente se presta mucha atención a la optimización del propio modelo de IA, este enfoque a menudo pasa por alto una preocupación crucial: los cuellos de botella del post-procesamiento.
Amir señaló que, en muchos casos, una vez que el modelo de IA completa su tarea, el proceso de transferencia de datos y el manejo del post-procesamiento en un dispositivo host puede causar retrasos significativos. Esta transferencia de datos de ida y vuelta entre el dispositivo y el host introduce latencia, lo que puede ser un obstáculo importante para lograr el mejor rendimiento.

Para abordar esto, Amir enfatizó la importancia de observar todo el sistema de extremo a extremo, en lugar de centrarse solo en el modelo de IA. Con el sensor IMX500, descubrieron que el post-procesamiento era el principal cuello de botella que ralentizaba todo. Compartió que el verdadero avance fue desbloquear la supresión no máxima (NMS) en el chip.
Permitió que el post-procesamiento se realizara directamente en el sensor, eliminando la necesidad de transferir grandes cantidades de datos a un dispositivo host. Al ejecutar NMS directamente en el IMX500, Sony rompió lo que Amir llamó el "techo de cristal del post-procesamiento", logrando un rendimiento mucho mejor y una reducción de la latencia.

A continuación, veremos cómo esta innovación ayudó a los modelos YOLO, especialmente YOLOv8 Nano, a ejecutarse de manera más eficiente en dispositivos edge, creando nuevas oportunidades para el procesamiento de IA en tiempo real en hardware más pequeño y con recursos limitados.
Para concluir la charla con una nota alta, Amir demostró cómo pudieron cuadruplicar el rendimiento del modelo YOLOv8 Nano ejecutando NMS en el borde. Lo mostró en una Raspberry Pi 5, que estaba integrada con el sensor de IA IMX500. Amir comparó el rendimiento cuando el post-procesamiento se manejaba en un dispositivo host frente al chip IMX500.
Los resultados mostraron claramente una mejora importante en los fotogramas por segundo (FPS) y la eficiencia general cuando el procesamiento se realizó en el chip. La optimización hizo que la detección de objetos fuera más rápida y fluida, y también demostró la viabilidad del procesamiento de IA en tiempo real en dispositivos más pequeños y con recursos limitados, como la Raspberry Pi.
El sensor IMX500 de Sony, la plataforma AITRIOS y los modelos YOLO de Ultralytics están transformando el desarrollo de la IA en el edge. El procesamiento de IA en el chip reduce la transferencia de datos y la latencia, al tiempo que aumenta la privacidad, la seguridad y la eficiencia. Al centrarse en todo el sistema, no solo en el modelo de IA, estas innovaciones hacen que la IA en el edge sea más accesible para los desarrolladores y aquellos sin una profunda experiencia en IA. A medida que la tecnología de IA en el edge continúa avanzando, es probable que permita dispositivos más inteligentes, una toma de decisiones más rápida y una mayor protección de la privacidad en una amplia gama de industrias y aplicaciones.
¡Manténgase conectado con nuestra comunidad para seguir aprendiendo sobre la IA! Consulte nuestro repositorio de GitHub para descubrir cómo podemos usar la IA para crear soluciones innovadoras en diversas industrias como la agricultura y la fabricación. 🚀