Acompáñanos en la recapitulación de los avances de Sony en el procesamiento de IA de vanguardia con el sensor IMX500 y la plataforma AITRIOS, para ayudar a optimizar los modelos Ultralytics YOLO.

Acompáñanos en la recapitulación de los avances de Sony en el procesamiento de IA de vanguardia con el sensor IMX500 y la plataforma AITRIOS, para ayudar a optimizar los modelos Ultralytics YOLO.
Edge AI permite que los modelos de inteligencia artificial (IA) funcionen directamente en dispositivos como teléfonos inteligentes, cámaras y drones. Su principal ventaja es que permite tomar decisiones más rápidas y en tiempo real sin depender de la nube. De hecho, los estudios demuestran que el uso de IA en plataformas periféricas puede aumentar la eficiencia operativa hasta en un 40 %.
Los recientes avances en IA de vanguardia, especialmente en visión por ordenador, la convirtieron en un tema central en YOLO Vision 2024 (YV24), el evento híbrido anual de Ultralytics que reúne a entusiastas y expertos en IA para explorar lo último en IA de visión. Uno de los aspectos más destacados del evento fue la presentación principal de Sony, en la que mostró sus nuevas soluciones de hardware y software de IA de vanguardia. Se presentaron el sensor IMX500 y la plataforma AITRIOS, y Sony demostró cómo estas innovaciones están facilitando y haciendo más eficiente el despliegue de modelos Ultralytics YOLO como Ultralytics YOLO11 y Ultralytics YOLOv8 en el borde.
La sesión corrió a cargo de Wei Tang, director de desarrollo de negocio centrado en las soluciones de imagen de Sony, y Amir Servi, director de producto de aprendizaje profundo Edge con experiencia en el despliegue de modelos de aprendizaje profundo en dispositivos Edge.
En este artículo, revisaremos la charla de Sony en YV24 y exploraremos cómo el sensor IMX500 y la plataforma AITRIOS optimizan el uso de modelos YOLO para un procesamiento de IA de vanguardia más rápido y en tiempo real. Empecemos.
Wei Tang abrió la sesión hablando del objetivo de Sony de hacer la IA de vanguardia tan accesible como lo hicieron con la fotografía hace años. Hizo hincapié en cómo Sony se centra ahora en llevar la IA avanzada Vision a más personas a través de la computación en los bordes. Uno de los factores que impulsan esta iniciativa es el impacto positivo que la IA de vanguardia puede tener en el medio ambiente. Al procesar los datos directamente en los dispositivos en lugar de depender de centros de datos masivos, la computación de borde ayuda a reducir el consumo de energía y las emisiones de carbono. Es un enfoque más inteligente y ecológico que encaja perfectamente con el compromiso de Sony de crear tecnología que no solo funcione mejor, sino que también ayude a crear un futuro más sostenible.
Wei pasó a explicar cómo Sony Semiconductor Solutions, la división de Sony especializada en tecnologías de imagen y detección, crea sensores de imagen avanzados. Estos sensores se utilizan en diversos dispositivos y convierten la luz en señales electrónicas para captar imágenes. Con más de 1.200 millones de sensores distribuidos cada año, se encuentran en casi la mitad de los teléfonos móviles del mundo, lo que convierte a Sony en un actor importante en la industria de la imagen.
Sobre la base de esta experiencia, Sony está llevando ahora las cosas más lejos transformando estos sensores de dispositivos de captura de imágenes en herramientas inteligentes que pueden procesar datos en tiempo real, lo que permite obtener información basada en IA directamente en los dispositivos. Antes de hablar de las soluciones de hardware y software que Sony está utilizando para apoyar este cambio, vamos a entender los retos de la IA en los bordes que estas innovaciones pretenden resolver.
El desarrollo de soluciones de Inteligencia Artificial de vanguardia plantea algunos retos clave, especialmente cuando se trabaja con dispositivos como cámaras y sensores. Muchos de estos dispositivos tienen una potencia y una capacidad de procesamiento limitadas, lo que dificulta la ejecución eficiente de modelos de IA avanzados.
Éstas son otras de las principales limitaciones:
El sensor de visión inteligente IMX500 de Sony es una pieza de hardware revolucionaria en el procesamiento de inteligencia artificial. Es el primer sensor de visión inteligente del mundo con funciones de IA integradas en el chip. Este sensor ayuda a superar muchos retos de la IA periférica, como los cuellos de botella en el procesamiento de datos, los problemas de privacidad y las limitaciones de rendimiento.
Mientras que otros sensores se limitan a transmitir imágenes y fotogramas, el IMX500 cuenta una historia completa. Procesa los datos directamente en el sensor, lo que permite a los dispositivos generar información en tiempo real. Durante la sesión, Wei Tang declaró: "Aprovechando nuestra avanzada tecnología de sensores de imagen, pretendemos potenciar una nueva generación de aplicaciones que puedan mejorar la vida cotidiana". La IMX500 está diseñada para cumplir este objetivo, transformando la forma en que los dispositivos manejan los datos directamente en el sensor, sin necesidad de enviarlos a la nube para su procesamiento.
Estas son algunas de sus principales características:
El IMX500 no es solo un sensor de cámara: es una potente herramienta de detección que transforma la forma en que los dispositivos perciben el mundo que les rodea e interactúan con él. Al integrar la IA directamente en el sensor, Sony hace que la IA de vanguardia sea más accesible para sectores como la automoción, la sanidad y las ciudades inteligentes. En secciones posteriores, profundizaremos en el modo en que el IMX500 funciona con los modelos YOLO de Ultralytics para mejorar la detección de objetos y el procesamiento de datos en dispositivos periféricos.
Tras presentar el sensor IMX500, Wei Tang afirmó que, aunque el hardware es crucial, no basta por sí solo para abordar todos los retos que plantea la implantación de la IA en los bordes. Habló de cómo la integración de la IA en dispositivos como cámaras y sensores requiere algo más que hardware avanzado: necesita software inteligente para gestionarlo. Aquí es donde entra en juego la plataforma AITRIOS de Sony, que ofrece una solución de software fiable diseñada para que la implementación de la IA en dispositivos periféricos sea más sencilla y eficiente.
AITRIOS actúa como puente entre los complejos modelos de IA y las limitaciones de los dispositivos de borde. Proporciona a los desarrolladores una serie de herramientas para desplegar rápidamente modelos de IA preentrenados. Pero lo más importante es que admite el reentrenamiento continuo para que los modelos de IA puedan seguir adaptándose a los cambios del mundo real.
Wei también destacó cómo AITRIOS simplifica el proceso para quienes no tienen conocimientos profundos de IA, ofreciendo flexibilidad para personalizar los modelos de IA para casos de uso específicos de IA en el borde. También aborda problemas comunes como las limitaciones de memoria y las caídas de rendimiento, lo que facilita la integración de la IA en dispositivos más pequeños sin sacrificar la precisión o la velocidad.
En la segunda parte de la charla, el micrófono pasó a Amir, que se adentró en el aspecto técnico de cómo Sony optimizó los modelos YOLO en el sensor IMX500.
Amir empezó diciendo: "Los modelos YOLO son edge-enabling y son bastante fáciles de optimizar, gracias a Glenn y al equipo. Os convenceré de ello, no os preocupéis". A continuación, Amir explicó que, aunque se suele prestar mucha atención a la optimización del propio modelo de IA, este enfoque suele pasar por alto un problema crucial: los cuellos de botella del postprocesamiento.
Amir señaló que, en muchos casos, una vez que el modelo de IA completa su tarea, el proceso de transferencia de datos y gestión del posprocesamiento en un dispositivo anfitrión puede causar retrasos significativos. Esta transferencia de datos de ida y vuelta entre el dispositivo y el host introduce latencia, lo que puede ser un obstáculo importante para lograr el mejor rendimiento.
Para solucionarlo, Amir hizo hincapié en la importancia de analizar todo el sistema de principio a fin, en lugar de centrarse únicamente en el modelo de IA. Con el sensor IMX500, descubrieron que el postprocesamiento era el principal cuello de botella que ralentizaba todo. El verdadero avance fue desbloquear la supresión no máxima (NMS) en el chip.
Permitía realizar el postprocesamiento directamente en el sensor, eliminando la necesidad de transferir grandes cantidades de datos a un dispositivo host. Al ejecutar NMS directamente en el IMX500, Sony rompió lo que Amir denominó el "techo de cristal del posprocesamiento", consiguiendo un rendimiento y una reducción de la latencia mucho mejores.
A continuación, echaremos un vistazo a cómo esta innovación ayudó a los modelos YOLO, especialmente YOLOv8 Nano, a funcionar de forma más eficiente en dispositivos periféricos, creando nuevas oportunidades para el procesamiento de IA en tiempo real en hardware más pequeño y con recursos limitados.
Para concluir la charla con broche de oro, Amir demostró cómo habían sido capaces de cuadruplicar el rendimiento del modelo YOLOv8 Nano ejecutando NMS on edge. Lo demostró en una Raspberry Pi 5 integrada con el sensor IMX500 AI. Amir comparó el rendimiento cuando el posprocesamiento se gestionaba en un dispositivo host frente al chip IMX500.
Los resultados mostraron claramente una importante mejora de los fotogramas por segundo (FPS) y de la eficiencia general cuando el procesamiento se realizaba en el chip. La optimización hizo que la detección de objetos fuera más rápida y fluida y también demostró la viabilidad del procesamiento de IA en tiempo real en dispositivos más pequeños y con recursos limitados como la Raspberry Pi.
El sensor IMX500 de Sony, la plataforma AITRIOS y los modelos Ultralytics YOLO están dando una nueva forma al desarrollo de la IA en los bordes. El procesamiento de IA en chip reduce la transferencia de datos y la latencia, al tiempo que mejora la privacidad, la seguridad y la eficiencia. Al centrarse en todo el sistema, y no sólo en el modelo de IA, estas innovaciones hacen que la IA periférica sea más accesible a los desarrolladores y a quienes no tienen una gran experiencia en IA. A medida que la tecnología de IA avanzada siga avanzando, es probable que permita dispositivos más inteligentes, una toma de decisiones más rápida y una mayor protección de la privacidad en una amplia gama de sectores y aplicaciones.
Manténgase conectado con nuestra comunidad para seguir aprendiendo sobre IA. Echa un vistazo a nuestro repositorio de GitHub para descubrir cómo podemos utilizar la IA para crear soluciones innovadoras en diversos sectores como la agricultura y la fabricación. 🚀