Plataforma Ultralytics

Ultralytics Platform: Desplegando modelos de visión artificial en cualquier región

Aprende a desplegar tus modelos de visión artificial en cualquier región usando Ultralytics Platform para un despliegue de IA escalable, rápido y flexible.

ABAbirami Vina6 min readMarch 20, 2026

Desplegando modelos de visión artificial en cualquier región con Ultralytics Platform

A principios de esta semana, Ultralytics lanzó Ultralytics Platform, un nuevo entorno integral diseñado para agilizar el lanzamiento de sistemas de visión artificial (CV) simplificando cada etapa del flujo de trabajo de IA visual, desde la preparación de datos y el desarrollo de modelos hasta el despliegue.

Una de las motivaciones clave para desarrollar Ultralytics Platform es que llevar una solución de visión artificial, que permita a las máquinas analizar imágenes y vídeos, desde la idea hasta lograr un impacto, implica mucho más que construir un modelo sólido. Una vez que un modelo ha sido entrenado y ha pasado la validación, debe desplegarse para que las aplicaciones puedan enviar imágenes, recibir predicciones y ejecutar inferencias de manera fiable en entornos reales.

Esta etapa del ciclo de vida del aprendizaje automático es donde los modelos de visión artificial van más allá de la experimentación y comienzan a impulsar sistemas prácticos. Incluso si los pasos anteriores, como la preparación del conjunto de datos, la anotación, el entrenamiento del modelo y las pruebas, se realizan sin problemas, sin una forma fiable de desplegar los modelos, esos resultados no pueden marcar la diferencia.

La realidad en muchos proyectos de visión artificial es que el despliegue puede ser uno de los pasos más complejos del flujo de trabajo.

Los equipos a menudo necesitan configurar API de inferencia, gestionar recursos informáticos, desplegar modelos cerca de los usuarios para reducir la latencia y supervisar el rendimiento una vez que los sistemas están en funcionamiento en producción.

Ultralytics Platform agiliza y automatiza este proceso al proporcionar múltiples opciones de despliegue, incluidos formatos de exportación de modelos, servicios de inferencia compartidos y puntos de conexión (endpoints) dedicados en regiones globales. Con una infraestructura gestionada y monitorización integrada, los equipos pueden pasar fácilmente de modelos entrenados a sistemas de visión artificial listos para producción.

Una vista del despliegue de modelos usando Ultralytics Platform

Fig 1. Una vista del despliegue de modelos usando Ultralytics Platform (Fuente)

En este artículo, exploraremos cómo desplegar modelos de visión artificial en cualquier región utilizando puntos de conexión dedicados en Ultralytics Platform. ¡Empecemos!

¿Qué es el despliegue de modelos de CV?#

Antes de profundizar en cómo desplegar modelos de aprendizaje profundo utilizando Ultralytics Platform, entendamos mejor qué significa realmente el despliegue de modelos de visión artificial.

El despliegue de modelos de visión artificial es el proceso de tomar un modelo entrenado y ponerlo a disposición para su uso en el mundo real. En lugar de ejecutarse únicamente en un entorno de entrenamiento, el modelo se configura para que las aplicaciones puedan enviarle imágenes o vídeos y recibir predicciones a cambio.

Por ejemplo, un modelo podría detectar objetos en una imagen, realizar segmentación de imágenes, identificar artículos en un almacén o reconocer patrones en secuencias de vídeo. En la mayoría de los sistemas del mundo real, esto ocurre a través de una API o un punto de conexión de inferencia.

Una aplicación envía una imagen al modelo, el modelo la procesa y devuelve una predicción en milisegundos. Esto es lo que permite que los modelos de visión artificial como Ultralytics YOLO impulsen aplicaciones en tiempo real.

Los modelos pueden desplegarse en diferentes entornos según el caso de uso. Algunos se ejecutan en la nube (a través de plataformas en la nube) y muchas aplicaciones pueden acceder a ellos, mientras que otros se ejecutan en dispositivos de borde (edge), como cámaras locales, robots o sistemas integrados que necesitan predicciones locales rápidas.

Opciones de despliegue de modelos de IA en Ultralytics Platform#

Si bien Ultralytics Platform aborda muchos desafíos que enfrenta la comunidad de visión artificial, particularmente cuando se trata de desplegar modelos, ofrece formas flexibles de ejecutar la inferencia según las necesidades de tu aplicación.

Aquí tienes un vistazo rápido a las opciones de despliegue de modelos disponibles en la plataforma:

Exportación de modelos: puedes exportar modelos a 17 formatos diferentes, incluidos ONNX, TensorRT, CoreML y TFLite, lo que permite ejecutar modelos en una amplia gama de entornos, como dispositivos de borde (edge devices) como Raspberry Pi y NVIDIA Jetson, aplicaciones móviles, contenedores Docker e infraestructura personalizada.
Inferencia compartida: La plataforma te permite ejecutar predicciones a través de un servicio de inferencia compartido y gestionado, lo cual es ideal para probar modelos rápidamente.
Endpoints dedicados: despliega modelos fácilmente como servicios independientes con URLs de API únicas que se pueden ejecutar en 43 regiones globales, con auto-escalado integrado, monitorización y comprobaciones de estado para despliegues en producción.

Despliegue utilizando puntos de conexión dedicados#

Una de las formas más escalables de ejecutar modelos preentrenados o modelos de visión artificial personalizados en producción en Ultralytics Platform es mediante puntos de conexión dedicados. Un punto de conexión dedicado te permite desplegar un modelo entrenado como su propio servicio, para que las aplicaciones puedan enviarle imágenes y recibir predicciones a través de una API.

En lugar de ejecutar un modelo solo en un entorno de entrenamiento o en un bloc de notas local, desplegarlo como un punto de conexión lo hace accesible a aplicaciones reales. Por ejemplo, un sistema de almacén podría enviar imágenes de paquetes para la detección de objetos, una cámara inteligente podría analizar fotogramas de vídeo o un sistema de robótica podría usar las predicciones para guiar acciones.

Cada punto de conexión dedicado se ejecuta como un servicio de inquilino único, lo que significa que la infraestructura que ejecuta tu modelo no se comparte con otros usuarios. Esto proporciona un rendimiento más predecible y facilita la monitorización de cómo se comporta el modelo en producción.

Comprender la funcionalidad de los puntos de conexión de inferencia dedicados#

Puedes considerar un punto de conexión dedicado como un servicio alojado para tu modelo. Ultralytics Platform proporciona una URL de punto de conexión única que actúa como punto de entrada para las aplicaciones.

Cuando una aplicación envía una solicitud a esa URL, incluye una imagen y parámetros opcionales, como umbrales de confianza o tamaño de imagen, junto con una clave de API para la autenticación.

El servicio ejecuta la inferencia sobre la imagen utilizando tu modelo y devuelve las predicciones en una respuesta estructurada. Esta configuración permite a los desarrolladores integrar modelos de visión artificial en sistemas reales utilizando herramientas web estándar.

Las aplicaciones pueden enviar solicitudes usando Python, JavaScript, cURL u otros clientes HTTP, lo que facilita la conexión de modelos a paneles, sistemas de robótica o aplicaciones en la nube. Dado que el punto de conexión se ejecuta de forma independiente, también puede admitir escalado, monitorización y despliegue global, ayudando a los equipos a crear sistemas de visión artificial de producción fiables.

El despliegue en múltiples regiones mejora la inferencia en tiempo real#

Una ventaja clave de los puntos de conexión dedicados en Ultralytics Platform es la capacidad de desplegar modelos en 43 regiones globales. Estas regiones abarcan múltiples partes del mundo, incluyendo Norteamérica, Sudamérica, Europa, Asia-Pacífico, Oriente Medio y África.

Ultralytics Platform dando soporte a 43 regiones globales

Fig 2. Ultralytics Platform es compatible con 43 regiones globales (Fuente)

Desplegar modelos en regiones más cercanas a donde se ejecutan las aplicaciones ayuda a reducir la latencia, que es el tiempo que tarda una aplicación en enviar una imagen y recibir una predicción. También puede ayudar a las organizaciones a cumplir con los requisitos de privacidad y residencia de datos manteniendo el procesamiento de datos más cerca de donde se origina.

La baja latencia es importante para muchas aplicaciones de visión artificial que dependen de la inferencia en tiempo real, como sistemas de robótica, dispositivos del Internet de las Cosas (IoT), tuberías de inspección industrial e infraestructura de ciudades inteligentes.

Por ejemplo, si una aplicación se utiliza principalmente en Europa, desplegar el modelo en una región europea puede mejorar significativamente los tiempos de respuesta en comparación con la ejecución del modelo en una región lejana.

Cómo desplegar en cualquier región con Ultralytics Platform#

Desplegar un modelo en una región específica es sencillo y, por lo general, solo lleva un par de minutos. La plataforma gestiona la configuración de la infraestructura para que los desarrolladores puedan centrarse en integrar el modelo en sus aplicaciones. Repasemos los pasos necesarios.

Paso 1: Entrena o sube un modelo#

Antes de realizar el despliegue, necesitas un modelo entrenado disponible en tu proyecto. Puede ser un modelo entrenado directamente en Ultralytics Platform, un modelo subido tras haber sido entrenado en otro lugar, o un modelo clonado de un proyecto comunitario encontrado en la "pestaña Explorar", donde los proyectos públicos compartidos por otros usuarios pueden copiarse a tu propia cuenta con un solo clic.

Una vez que el modelo esté listo, abre su página de modelo dentro de tu proyecto para continuar.

Paso 2: Abre la pestaña Desplegar (Deploy)#

Navega a la pestaña Desplegar para el modelo. Esta sección de la plataforma te permite configurar y lanzar despliegues.

En esa página, verás una tabla de regiones y un mapa interactivo que muestra las ubicaciones de despliegue disponibles en todo el mundo. La plataforma mide la latencia desde tu ubicación y ordena las regiones en consecuencia para ayudarte a elegir la región más adecuada.

Regiones ordenadas por latencia en Ultralytics Platform

Fig 3. Regiones ordenadas por latencia en Ultralytics Platform (Fuente)

Paso 3: Elige una región de despliegue#

Selecciona una región según dónde se encuentren tus usuarios o aplicaciones. Desplegar el modelo más cerca del origen de las solicitudes puede reducir significativamente los tiempos de respuesta.

Paso 4: Despliega el punto de conexión (endpoint)#

Después de seleccionar la región y confirmar la configuración, puedes hacer clic en Desplegar.

La plataforma prepara entonces el entorno de despliegue, extrae la imagen del modelo, inicia el servicio y realiza una comprobación de estado para garantizar que el punto de conexión esté listo. Este proceso suele llevar entre uno y dos minutos.

Una vez completado el despliegue, la plataforma genera una URL de punto de conexión única que las aplicaciones pueden usar para enviar solicitudes de inferencia.

Un ejemplo de un endpoint desplegado

Fig 4. Un ejemplo de un endpoint desplegado (Fuente)

Paso 5: Empieza a enviar solicitudes de inferencia#

Con el punto de conexión en funcionamiento, las aplicaciones pueden comenzar a enviar imágenes al modelo utilizando el punto de conexión REST API proporcionado y una clave de API enviada en el encabezado de autorización. El punto de conexión procesa cada solicitud y devuelve predicciones como objetos detectados, cajas delimitadoras u otros resultados específicos de la tarea.

Para obtener más detalles relacionados con el despliegue de modelos, consulta la documentación oficial de Ultralytics Platform.

Monitorización del rendimiento del modelo y métricas para puntos de conexión desplegados#

Una vez desplegado un modelo de visión artificial, monitorizar su rendimiento se convierte en una parte importante del mantenimiento de la fiabilidad y robustez del sistema. Incluso un modelo bien entrenado debe ser observado en producción para asegurar que continúe respondiendo rápidamente, gestione correctamente las solicitudes entrantes y entregue predicciones precisas.

Ultralytics Platform proporciona herramientas de monitorización integrada que ofrecen a los equipos visibilidad sobre el rendimiento de los endpoints desplegados. La página Deploy de la plataforma actúa como un panel de control de monitorización, ofreciendo una vista centralizada de todos los endpoints en ejecución junto con métricas clave que ayudan a rastrear la salud y el uso del sistema.

Aquí tienes algunas de las métricas que puedes monitorizar usando la plataforma:

Latencia P95: Esta métrica mide el percentil 95 del tiempo de respuesta del servidor para las solicitudes de inferencia. Proporciona información sobre cuánto tiempo tardan la mayoría de las solicitudes de inferencia e identifica ralentizaciones en el rendimiento.
Tasa de error: Representa el porcentaje de solicitudes que fallaron o devolvieron errores dentro del intervalo de monitorización seleccionado. Monitorizar las tasas de error permite a los equipos detectar rápidamente problemas con los despliegues o las solicitudes entrantes.
Solicitudes totales: Esta métrica muestra el número total de solicitudes de inferencia procesadas a través de los puntos de conexión desplegados durante el período de tiempo seleccionado (por ejemplo, las últimas 24 horas). Ayuda a los equipos a comprender los niveles de tráfico y la frecuencia con la que se utilizan sus modelos.

Además de estas métricas, la plataforma también proporciona comprobaciones de estado del punto de conexión y registros de despliegue. Las comprobaciones de estado indican si un punto de conexión responde correctamente, mientras que los registros proporcionan información detallada sobre las solicitudes recientes y la actividad del sistema.

Conclusiones clave#

Desplegar modelos de visión artificial es un paso crucial para convertir modelos entrenados en sistemas que impulsen aplicaciones del mundo real. Con Ultralytics Platform, los equipos pueden desplegar fácilmente modelos a través de puntos de conexión dedicados en 43 regiones globales, ejecutar inferencia en tiempo real a través de API y monitorizar el rendimiento desde un único entorno. Al combinar opciones de despliegue flexibles, monitorización integrada e infraestructura escalable, la plataforma ayuda a los desarrolladores a pasar de modelos de aprendizaje automático entrenados a aplicaciones de visión artificial fiables más rápidamente.

¡Forma parte de nuestra creciente comunidad! Sumérgete en nuestro repositorio de GitHub para saber más sobre IA. Si buscas crear soluciones de visión artificial, echa un vistazo a nuestras opciones de licencias. ¡Explora los beneficios de la visión artificial en la sanidad y descubre cómo la IA en la logística está marcando la diferencia!

Explore solutions

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Ultralytics Platform: Desplegando modelos de visión artificial en cualquier región

¿Qué es el despliegue de modelos de CV?#

Opciones de despliegue de modelos de IA en Ultralytics Platform#

Despliegue utilizando puntos de conexión dedicados#

Comprender la funcionalidad de los puntos de conexión de inferencia dedicados#

El despliegue en múltiples regiones mejora la inferencia en tiempo real#

Cómo desplegar en cualquier región con Ultralytics Platform#

Paso 1: Entrena o sube un modelo#

Paso 2: Abre la pestaña Desplegar (Deploy)#

Paso 3: Elige una región de despliegue#

Paso 4: Despliega el punto de conexión (endpoint)#

Paso 5: Empieza a enviar solicitudes de inferencia#

Monitorización del rendimiento del modelo y métricas para puntos de conexión desplegados#

Conclusiones clave#

Explore solutions

IA en robótica

IA en logística

IA en el sector minorista

IA en la atención sanitaria

IA en la fabricación

IA en automoción

IA en agricultura

IA en robótica

IA en logística

IA en el sector minorista

IA en la atención sanitaria

IA en la fabricación

IA en automoción

IA en agricultura

IA en robótica

IA en logística

IA en el sector minorista

IA en la atención sanitaria

IA en la fabricación

IA en automoción

IA en agricultura

¡Construyamos juntos el futuro de la IA!