Ultralytics Platform: Desplegando modelos de visión artificial en cualquier región
Aprende a desplegar tus modelos de visión artificial en cualquier región usando Ultralytics Platform para un despliegue de IA escalable, rápido y flexible.
A principios de esta semana, Ultralytics lanzó Ultralytics Platform, un nuevo entorno integral diseñado para agilizar el lanzamiento de sistemas de visión artificial (CV), optimizando cada etapa del flujo de trabajo de IA visual, desde la preparación de datos y el desarrollo de modelos hasta el despliegue.
Una de las motivaciones clave para desarrollar Ultralytics Platform es que llevar una solución de visión artificial, que permita a las máquinas analizar imágenes y vídeos, desde la idea hasta lograr un impacto, implica mucho más que construir un modelo sólido. Una vez que un modelo ha sido entrenado y ha pasado la validación, debe desplegarse para que las aplicaciones puedan enviar imágenes, recibir predicciones y ejecutar inferencias de manera fiable en entornos reales.
Esta etapa del ciclo de vida del aprendizaje automático es donde los modelos de visión artificial van más allá de la experimentación y comienzan a impulsar sistemas prácticos. Incluso si los pasos anteriores, como la preparación del conjunto de datos, la anotación, el entrenamiento del modelo y las pruebas, se realizan sin problemas, sin una forma fiable de desplegar los modelos, esos resultados no pueden marcar la diferencia.
La realidad en muchos proyectos de visión artificial es que el despliegue puede ser uno de los pasos más complejos del flujo de trabajo.
Los equipos a menudo necesitan configurar API de inferencia, gestionar recursos informáticos, desplegar modelos cerca de los usuarios para reducir la latencia y supervisar el rendimiento una vez que los sistemas están en funcionamiento en producción.
Ultralytics Platform agiliza y automatiza este proceso al proporcionar múltiples opciones de despliegue, incluidos formatos de exportación de modelos, servicios de inferencia compartidos y puntos de conexión (endpoints) dedicados en regiones globales. Con una infraestructura gestionada y monitorización integrada, los equipos pueden pasar fácilmente de modelos entrenados a sistemas de visión artificial listos para producción.

Fig 1. Un vistazo al despliegue de modelos usando Ultralytics Platform (Fuente)
En este artículo, exploraremos cómo desplegar modelos de visión artificial en cualquier región utilizando puntos de conexión dedicados en Ultralytics Platform. ¡Empecemos!
Link to this section¿Qué es el despliegue de modelos de CV?#
Antes de profundizar en cómo desplegar modelos de aprendizaje profundo utilizando Ultralytics Platform, entendamos mejor qué significa realmente el despliegue de modelos de visión artificial.
El despliegue de modelos de visión artificial es el proceso de tomar un modelo entrenado y ponerlo a disposición para su uso en el mundo real. En lugar de ejecutarse solo en un entorno de entrenamiento, el modelo se configura para que las aplicaciones puedan enviarle imágenes o vídeos y recibir predicciones a cambio.
Por ejemplo, un modelo podría detectar objetos en una imagen, realizar segmentación de imágenes, identificar artículos en un almacén o reconocer patrones en secuencias de vídeo. En la mayoría de los sistemas del mundo real, esto ocurre a través de una API o un punto de conexión de inferencia.
Una aplicación envía una imagen al modelo, este la procesa y devuelve una predicción en milisegundos. Esto es lo que permite que modelos de visión artificial como Ultralytics YOLO posibiliten aplicaciones en tiempo real.
Los modelos pueden desplegarse en diferentes entornos según el caso de uso. Algunos se ejecutan en la nube (a través de plataformas en la nube) y muchas aplicaciones pueden acceder a ellos, mientras que otros se ejecutan en dispositivos de borde (edge), como cámaras locales, robots o sistemas integrados que necesitan predicciones locales rápidas.
Link to this sectionOpciones de despliegue de modelos de IA en Ultralytics Platform#
Si bien Ultralytics Platform aborda muchos desafíos que enfrenta la comunidad de visión artificial, particularmente cuando se trata de desplegar modelos, ofrece formas flexibles de ejecutar la inferencia según las necesidades de tu aplicación.
Aquí tienes un vistazo rápido a las opciones de despliegue de modelos disponibles en la plataforma:
- Exportación de modelos: Puedes exportar modelos a 17 formatos diferentes, incluidos ONNX, TensorRT, CoreML y TFLite, lo que permite ejecutar modelos en una amplia gama de entornos, como dispositivos de borde (edge) como Raspberry Pi y NVIDIA Jetson, aplicaciones móviles, contenedores Docker e infraestructuras personalizadas.
- Inferencia compartida: La plataforma te permite ejecutar predicciones a través de un servicio de inferencia compartido y gestionado, lo cual es ideal para probar modelos rápidamente.
- Puntos de conexión dedicados: Despliega fácilmente modelos como servicios independientes con URL de API únicas que pueden ejecutarse en 43 regiones globales, con escalado automático, monitorización y comprobaciones de estado integradas para despliegues en producción.
Link to this sectionDespliegue utilizando puntos de conexión dedicados#
Una de las formas más escalables de ejecutar modelos preentrenados o modelos de visión artificial personalizados en producción en Ultralytics Platform es mediante puntos de conexión dedicados. Un punto de conexión dedicado te permite desplegar un modelo entrenado como su propio servicio, para que las aplicaciones puedan enviarle imágenes y recibir predicciones a través de una API.
En lugar de ejecutar un modelo solo en un entorno de entrenamiento o en un bloc de notas local, desplegarlo como un punto de conexión lo hace accesible a aplicaciones reales. Por ejemplo, un sistema de almacén podría enviar imágenes de paquetes para la detección de objetos, una cámara inteligente podría analizar fotogramas de vídeo o un sistema de robótica podría usar las predicciones para guiar acciones.
Cada punto de conexión dedicado se ejecuta como un servicio de inquilino único, lo que significa que la infraestructura que ejecuta tu modelo no se comparte con otros usuarios. Esto proporciona un rendimiento más predecible y facilita la monitorización de cómo se comporta el modelo en producción.
Link to this sectionComprender la funcionalidad de los puntos de conexión de inferencia dedicados#
Puedes considerar un punto de conexión dedicado como un servicio alojado para tu modelo. Ultralytics Platform proporciona una URL de punto de conexión única que actúa como punto de entrada para las aplicaciones.
Cuando una aplicación envía una solicitud a esa URL, incluye una imagen y parámetros opcionales, como umbrales de confianza o tamaño de imagen, junto con una clave de API para la autenticación.
El servicio ejecuta la inferencia sobre la imagen utilizando tu modelo y devuelve las predicciones en una respuesta estructurada. Esta configuración permite a los desarrolladores integrar modelos de visión artificial en sistemas reales utilizando herramientas web estándar.
Las aplicaciones pueden enviar solicitudes usando Python, JavaScript, cURL u otros clientes HTTP, lo que facilita la conexión de modelos a paneles, sistemas de robótica o aplicaciones en la nube. Dado que el punto de conexión se ejecuta de forma independiente, también puede admitir escalado, monitorización y despliegue global, ayudando a los equipos a crear sistemas de visión artificial de producción fiables.
Link to this sectionEl despliegue en múltiples regiones mejora la inferencia en tiempo real#
Una ventaja clave de los puntos de conexión dedicados en Ultralytics Platform es la capacidad de desplegar modelos en 43 regiones globales. Estas regiones abarcan múltiples partes del mundo, incluyendo Norteamérica, Sudamérica, Europa, Asia-Pacífico, Oriente Medio y África.

Fig 2. Ultralytics Platform admite 43 regiones globales (Fuente)
Desplegar modelos en regiones más cercanas a donde se ejecutan las aplicaciones ayuda a reducir la latencia, que es el tiempo que tarda una aplicación en enviar una imagen y recibir una predicción. También puede ayudar a las organizaciones a cumplir con los requisitos de privacidad y residencia de datos manteniendo el procesamiento de datos más cerca de donde se origina.
La baja latencia es importante para muchas aplicaciones de visión artificial que dependen de la inferencia en tiempo real, como sistemas de robótica, dispositivos del Internet de las Cosas (IoT), tuberías de inspección industrial e infraestructura de ciudades inteligentes.
Por ejemplo, si una aplicación se utiliza principalmente en Europa, desplegar el modelo en una región europea puede mejorar significativamente los tiempos de respuesta en comparación con la ejecución del modelo en una región lejana.
Link to this sectionCómo desplegar en cualquier región con Ultralytics Platform#
Desplegar un modelo en una región específica es sencillo y, por lo general, solo lleva un par de minutos. La plataforma gestiona la configuración de la infraestructura para que los desarrolladores puedan centrarse en integrar el modelo en sus aplicaciones. Repasemos los pasos necesarios.
Link to this sectionPaso 1: Entrena o sube un modelo#
Antes de realizar el despliegue, necesitas un modelo entrenado disponible en tu proyecto. Puede ser un modelo entrenado directamente en Ultralytics Platform, un modelo subido tras haber sido entrenado en otro lugar, o un modelo clonado de un proyecto comunitario encontrado en la "pestaña Explorar", donde los proyectos públicos compartidos por otros usuarios pueden copiarse a tu propia cuenta con un solo clic.
Una vez que el modelo esté listo, abre su página de modelo dentro de tu proyecto para continuar.
Link to this sectionPaso 2: Abre la pestaña Desplegar (Deploy)#
Navega a la pestaña Desplegar para el modelo. Esta sección de la plataforma te permite configurar y lanzar despliegues.
En esa página, verás una tabla de regiones y un mapa interactivo que muestra las ubicaciones de despliegue disponibles en todo el mundo. La plataforma mide la latencia desde tu ubicación y ordena las regiones en consecuencia para ayudarte a elegir la región más adecuada.

Fig 3. Regiones ordenadas por latencia en Ultralytics Platform (Fuente)
Link to this sectionPaso 3: Elige una región de despliegue#
Selecciona una región según dónde se encuentren tus usuarios o aplicaciones. Desplegar el modelo más cerca del origen de las solicitudes puede reducir significativamente los tiempos de respuesta.
Link to this sectionPaso 4: Despliega el punto de conexión (endpoint)#
Después de seleccionar la región y confirmar la configuración, puedes hacer clic en Desplegar.
La plataforma prepara entonces el entorno de despliegue, extrae la imagen del modelo, inicia el servicio y realiza una comprobación de estado para garantizar que el punto de conexión esté listo. Este proceso suele llevar entre uno y dos minutos.
Una vez completado el despliegue, la plataforma genera una URL de punto de conexión única que las aplicaciones pueden usar para enviar solicitudes de inferencia.

Fig 4. Un ejemplo de un punto de conexión desplegado (Fuente)
Link to this sectionPaso 5: Empieza a enviar solicitudes de inferencia#
Con el punto de conexión en funcionamiento, las aplicaciones pueden comenzar a enviar imágenes al modelo utilizando el punto de conexión REST API proporcionado y una clave de API enviada en el encabezado de autorización. El punto de conexión procesa cada solicitud y devuelve predicciones como objetos detectados, cajas delimitadoras u otros resultados específicos de la tarea.
Para obtener más detalles relacionados con el despliegue de modelos, consulta la documentación oficial de Ultralytics Platform.
Link to this sectionMonitorización del rendimiento del modelo y métricas para puntos de conexión desplegados#
Una vez desplegado un modelo de visión artificial, monitorizar su rendimiento se convierte en una parte importante del mantenimiento de la fiabilidad y robustez del sistema. Incluso un modelo bien entrenado debe ser observado en producción para asegurar que continúe respondiendo rápidamente, gestione correctamente las solicitudes entrantes y entregue predicciones precisas.
Ultralytics Platform proporciona herramientas de monitorización integrada que brindan a los equipos visibilidad sobre cómo están funcionando los puntos de conexión desplegados. La página de Despliegue de la plataforma actúa como un panel de monitorización, ofreciendo una vista centralizada de todos los puntos de conexión en ejecución junto con métricas clave que ayudan a realizar un seguimiento de la salud y el uso del sistema.
Aquí tienes algunas de las métricas que puedes monitorizar usando la plataforma:
- Latencia P95: Esta métrica mide el percentil 95 del tiempo de respuesta del servidor para las solicitudes de inferencia. Proporciona información sobre cuánto tiempo tardan la mayoría de las solicitudes de inferencia e identifica ralentizaciones en el rendimiento.
- Tasa de error: Representa el porcentaje de solicitudes que fallaron o devolvieron errores dentro del intervalo de monitorización seleccionado. Monitorizar las tasas de error permite a los equipos detectar rápidamente problemas con los despliegues o las solicitudes entrantes.
- Solicitudes totales: Esta métrica muestra el número total de solicitudes de inferencia procesadas a través de los puntos de conexión desplegados durante el período de tiempo seleccionado (por ejemplo, las últimas 24 horas). Ayuda a los equipos a comprender los niveles de tráfico y la frecuencia con la que se utilizan sus modelos.
Además de estas métricas, la plataforma también proporciona comprobaciones de estado del punto de conexión y registros de despliegue. Las comprobaciones de estado indican si un punto de conexión responde correctamente, mientras que los registros proporcionan información detallada sobre las solicitudes recientes y la actividad del sistema.
Link to this sectionConclusiones clave#
Desplegar modelos de visión artificial es un paso crucial para convertir modelos entrenados en sistemas que impulsen aplicaciones del mundo real. Con Ultralytics Platform, los equipos pueden desplegar fácilmente modelos a través de puntos de conexión dedicados en 43 regiones globales, ejecutar inferencia en tiempo real a través de API y monitorizar el rendimiento desde un único entorno. Al combinar opciones de despliegue flexibles, monitorización integrada e infraestructura escalable, la plataforma ayuda a los desarrolladores a pasar de modelos de aprendizaje automático entrenados a aplicaciones de visión artificial fiables más rápidamente.
¡Forma parte de nuestra creciente comunidad! Sumérgete en nuestro repositorio de GitHub para aprender más sobre IA. Si buscas crear soluciones de visión artificial, consulta nuestras opciones de licencia. ¡Explora los beneficios de la visión artificial en la atención sanitaria y mira cómo la IA en logística está marcando la diferencia!






