Al hacer clic en “Aceptar todas las cookies”, aceptas el almacenamiento de cookies en tu dispositivo para mejorar la navegación del sitio, analizar el uso del sitio y ayudar en nuestros esfuerzos de marketing. Más información
Configuración de cookies
Al hacer clic en “Aceptar todas las cookies”, aceptas el almacenamiento de cookies en tu dispositivo para mejorar la navegación del sitio, analizar el uso del sitio y ayudar en nuestros esfuerzos de marketing. Más información
Descubre cómo implementar tus modelos de visión artificial en cualquier región mediante Ultralytics , que te permite una implementación de IA escalable, rápida y flexible.
Amplíe sus proyectos de visión artificial con Ultralytics.
A principios de esta semana, Ultralytics Ultralytics , un nuevo entorno integral diseñado para acelerar la comercialización de sistemas de visión artificial (CV) mediante la optimización de todas las etapas del flujo de trabajo de la IA de visión, desde la preparación de datos y el desarrollo de modelos hasta su implementación.
Una de las principales razones que motivaron el desarrollo Ultralytics es que llevar a cabo una solución de visión artificial —que permita a las máquinas analizar imágenes y vídeos, desde la idea inicial hasta que tenga un impacto real— implica mucho más que crear un modelo sólido. Una vez que el modelo se ha entrenado y ha superado la validación, debe implementarse para que las aplicaciones puedan enviar imágenes, recibir predicciones y realizar inferencias de forma fiable en entornos reales.
En esta fase del ciclo de vida del aprendizaje automático, los modelos de visión artificial pasan de la fase experimental a impulsar sistemas prácticos. Aunque las etapas previas —como la preparación de los conjuntos de datos, la anotación, el entrenamiento de los modelos y las pruebas— se desarrollen sin contratiempos, sin una forma fiable de implementar los modelos, esos resultados no servirán de nada.
La realidad en muchos proyectos de visión artificial es que la implementación puede ser uno de los pasos más complejos del flujo de trabajo.
Los equipos suelen tener que configurar las API de inferencia, gestionar los recursos informáticos, implementar modelos cerca de los usuarios para reducir la latencia y supervisar el rendimiento una vez que los sistemas están en producción.
Ultralytics agiliza y automatiza este proceso al ofrecer múltiples opciones de implementación, entre las que se incluyen formatos de exportación de modelos, servicios de inferencia compartidos y puntos de acceso dedicados en distintas regiones del mundo. Gracias a la infraestructura gestionada y a la supervisión integrada, los equipos pueden pasar fácilmente de los modelos entrenados a sistemas de visión artificial listos para su puesta en producción.
Fig. 1. Una visión general de la implementación de modelos mediante Ultralytics (Fuente)
En este artículo, veremos cómo implementar modelos de visión artificial en cualquier región utilizando puntos de conexión dedicados en Ultralytics . ¡Empecemos!
¿Qué es la implementación de modelos de redes neuronales convolucionales?
Antes de profundizar en cómo implementar modelos de aprendizaje profundo utilizando Ultralytics , veamos primero qué significa realmente la implementación de modelos de visión artificial.
La implementación de un modelo de visión artificial es el proceso que consiste en tomar un modelo entrenado y ponerlo a disposición para su uso en el mundo real. En lugar de ejecutarse únicamente en un entorno de entrenamiento, el modelo se configura de manera que las aplicaciones puedan enviarle imágenes o vídeos y recibir predicciones a cambio.
Por ejemplo, un modelo puede detect en una imagen, realizar la segmentación de imágenes, identificar artículos en un almacén o reconocer patrones en secuencias de vídeo. En la mayoría de los sistemas del mundo real, esto se lleva a cabo a través de una API o un punto final de inferencia.
Una aplicación envía una imagen al modelo, este la procesa y devuelve una predicción en cuestión de milisegundos. Esto es lo que permite que los modelos de visión artificial como Ultralytics YOLO , hagan posibles las aplicaciones en tiempo real.
Los modelos pueden implementarse en distintos entornos según el caso de uso. Algunos se ejecutan en la nube (a través de plataformas en la nube) y muchas aplicaciones pueden acceder a ellos, mientras que otros se ejecutan en dispositivos periféricos, como cámaras locales, robots o sistemas integrados que requieren predicciones locales rápidas.
Opciones de implementación de modelos de IA en Ultralytics
Aunque Ultralytics aborda muchos de los retos a los que se enfrenta la comunidad de visión artificial, especialmente en lo que respecta a la implementación de modelos, ofrece formas flexibles de ejecutar la inferencia en función de las necesidades de tu aplicación.
A continuación, te ofrecemos un breve resumen de las opciones de implementación de modelos disponibles en la plataforma:
Exportación de modelos: Puedes exportar modelos a 17 formatos diferentes, entre los que se incluyen ONNX, TensorRT, CoreML y TFLite, lo que permite ejecutar modelos en una amplia variedad de entornos, como dispositivos periféricos como Raspberry Pi y NVIDIA , aplicaciones móviles, contenedores Docker e infraestructura personalizada.
Inferencia compartida: la plataforma te permite ejecutar predicciones a través de un servicio de inferencia compartida gestionado, lo cual resulta ideal para probar modelos rápidamente
Puntos de acceso dedicados: Implemente fácilmente modelos como servicios independientes con URL de API únicas que pueden ejecutarse en 43 regiones de todo el mundo, con escalado automático, supervisión y comprobaciones de estado integrados para implementaciones en producción.
Implementación mediante puntos de conexión dedicados
Una de las formas más escalables de ejecutar modelos preentrenados o modelos de visión artificial entrenados a medida en entorno de producción en Ultralytics es mediante puntos de conexión dedicados. Un punto de conexión dedicado te permite implementar un modelo entrenado como un servicio independiente, de modo que las aplicaciones puedan enviarle imágenes y recibir predicciones a través de una API.
En lugar de ejecutar un modelo únicamente en un entorno de entrenamiento o en un cuaderno de trabajo local, su implementación como punto final permite que sea accesible para aplicaciones reales. Por ejemplo, un sistema de almacén podría enviar imágenes de paquetes para la detección de objetos, una cámara inteligente podría analizar fotogramas de vídeo o un sistema robótico podría utilizar predicciones para guiar sus acciones.
Cada punto final dedicado funciona como un servicio de uso exclusivo, lo que significa que la infraestructura en la que se ejecuta el modelo no se comparte con otros usuarios. Esto garantiza un rendimiento más predecible y facilita la supervisión del comportamiento del modelo en producción.
Comprender el funcionamiento de los puntos finales de inferencia dedicados
Puedes considerar un punto final dedicado como un servicio alojado para tu modelo. Ultralytics proporciona una URL de punto final única que actúa como punto de entrada para las aplicaciones.
Cuando una aplicación envía una solicitud a esa URL, incluye una imagen y parámetros opcionales, como los umbrales de confianza o el tamaño de la imagen, junto con una clave de API para la autenticación.
El servicio realiza una inferencia sobre la imagen utilizando tu modelo y devuelve las predicciones en una respuesta estructurada. Esta configuración permite a los desarrolladores integrar modelos de visión artificial en sistemas reales utilizando herramientas web estándar.
Las aplicaciones pueden enviar solicitudes mediante Python, JavaScript, cURL u otros clientes HTTP, lo que facilita la conexión de los modelos con paneles de control, sistemas robóticos o aplicaciones en la nube. Dado que el punto final funciona de forma independiente, también admite el escalado, la supervisión y la implementación global, lo que ayuda a los equipos a crear sistemas de visión artificial fiables para entornos de producción.
La implementación multirregional mejora la inferencia en tiempo real
Una ventaja clave de los puntos finales dedicados de Ultralytics es la posibilidad de implementar modelos en 43 regiones de todo el mundo. Estas regiones abarcan diversas partes del mundo, entre ellas América del Norte, América del Sur, Europa, Asia-Pacífico, Oriente Medio y África.
Fig. 2. Ultralytics es compatible con 43 regiones de todo el mundo (Fuente)
La implementación de modelos en regiones más cercanas al lugar donde se ejecutan las aplicaciones ayuda a reducir la latencia, es decir, el tiempo que tarda una aplicación en enviar una imagen y recibir una predicción. Además, puede ayudar a las organizaciones a cumplir los requisitos de privacidad y residencia de datos, al mantener el procesamiento de datos más cerca de su lugar de origen.
La baja latencia es importante para muchas aplicaciones de visión artificial que dependen de la inferencia en tiempo real, como los sistemas robóticos, los dispositivos del Internet de las cosas (IoT), los procesos de inspección industrial y la infraestructura de las ciudades inteligentes.
Por ejemplo, si una aplicación se utiliza principalmente en Europa, implementar el modelo en una región europea puede mejorar considerablemente los tiempos de respuesta en comparación con ejecutarlo en una región lejana.
Cómo implementar en cualquier región con Ultralytics
Implementar un modelo en una región concreta es sencillo y, por lo general, solo lleva un par de minutos. La plataforma se encarga de la configuración de la infraestructura, de modo que los desarrolladores pueden centrarse en integrar el modelo en sus aplicaciones. Veamos los pasos que hay que seguir.
Paso 1: Entrena o sube un modelo
Antes de realizar el despliegue, necesitas disponer de un modelo entrenado en tu proyecto. Puede tratarse de un modelo entrenado directamente en Ultralytics , de un modelo subido tras haber sido entrenado en otro lugar, o de un modelo clonado de un proyecto de la comunidad que se encuentre en la pestaña «Explorar», donde los proyectos públicos compartidos por otros usuarios pueden copiarse a tu propia cuenta con un solo clic.
Una vez que el modelo esté listo, abre su página de modelo dentro de tu proyecto para continuar.
Paso 2: Abre la pestaña «Implementación»
Ve a la pestaña «Implementar» del modelo. Esta sección de la plataforma te permite configurar y poner en marcha implementaciones.
En esa página, verás una tabla de regiones y un mapa interactivo que muestra las ubicaciones de implementación disponibles en todo el mundo. La plataforma mide la latencia desde tu ubicación y clasifica las regiones en función de ello para ayudarte a elegir la más adecuada.
Fig. 3. Regiones clasificadas por latencia en Ultralytics (Fuente)
Paso 3: Elige una región de implementación
Selecciona una región en función de la ubicación de tus usuarios o aplicaciones. Implementar el modelo más cerca del origen de las solicitudes puede reducir considerablemente los tiempos de respuesta.
Paso 4: Implementar el punto final
Una vez seleccionada la región y confirmada la configuración, puede hacer clic en «Implementar».
A continuación, la plataforma prepara el entorno de implementación, descarga la imagen del modelo, inicia el servicio y realiza una comprobación de estado para asegurarse de que el punto final está listo. Este proceso suele durar entre uno y dos minutos.
Una vez completada la implementación, la plataforma genera una URL de punto final única que las aplicaciones pueden utilizar para enviar solicitudes de inferencia.
Fig. 4. Ejemplo de un terminal implementado (Fuente)
Paso 6: Empieza a enviar solicitudes de inferencia
Una vez en funcionamiento el punto final, las aplicaciones pueden empezar a enviar imágenes al modelo utilizando el REST API proporcionado y una clave de API incluida en el encabezado «Authorization». El punto final procesa cada solicitud y devuelve predicciones, como los objetos detectados, los rectángulos delimitadores u otros resultados específicos de la tarea.
Para obtener más información sobre la implementación de modelos, consulta la documentación oficial de Ultralytics .
Supervisión del rendimiento y las métricas de los modelos en los dispositivos finales implementados
Una vez implementado un modelo de visión artificial, la supervisión de su rendimiento se convierte en un aspecto fundamental para garantizar la fiabilidad y la solidez del sistema. Incluso un modelo bien entrenado debe ser supervisado en entorno de producción para asegurarse de que sigue respondiendo con rapidez, gestiona adecuadamente las solicitudes entrantes y ofrece predicciones precisas.
Ultralytics ofrece herramientas de supervisión integradas que permiten a los equipos conocer el rendimiento de los terminales desplegados. La página «Deploy» de la plataforma funciona como un panel de control de supervisión y ofrece una vista centralizada de todos los terminales en funcionamiento, junto con métricas clave que ayudan track del estado y el uso track .
Estas son algunas de las métricas que puedes supervisar mediante la plataforma:
Latencia P95: esta métrica mide el tiempo de respuesta del servidor en el percentil 95 para las solicitudes de inferencia. Ofrece información sobre la duración de la mayoría de las solicitudes de inferencia e identifica las ralentizaciones en el rendimiento.
Índice de errores: representa el porcentaje de solicitudes que fallaron o devolvieron errores dentro del intervalo de supervisión seleccionado. La supervisión de los índices de errores permite a los equipos detect rápidamente detect en las implementaciones o en las solicitudes entrantes.
Total de solicitudes: esta métrica muestra el número total de solicitudes de inferencia procesadas en los puntos finales implementados durante el periodo de tiempo seleccionado (por ejemplo, las últimas 24 horas). Ayuda a los equipos a comprender los niveles de tráfico y la frecuencia con la que se utilizan sus modelos.
Además de estos indicadores, la plataforma también ofrece comprobaciones del estado de los terminales y registros de implementación. Las comprobaciones del estado indican si un terminal responde correctamente, mientras que los registros proporcionan información detallada sobre las solicitudes recientes y la actividad del sistema.
Conclusiones clave
La implementación de modelos de visión artificial es un paso fundamental para convertir los modelos entrenados en sistemas que dan lugar a aplicaciones en el mundo real. Con Ultralytics , los equipos pueden implementar fácilmente modelos a través de puntos de acceso dedicados en 43 regiones de todo el mundo, ejecutar inferencias en tiempo real mediante API y supervisar el rendimiento desde un único entorno. Al combinar opciones de implementación flexibles, supervisión integrada e infraestructura escalable, la plataforma ayuda a los desarrolladores a pasar más rápidamente de los modelos de aprendizaje automático entrenados a aplicaciones fiables de visión artificial.