¿Puedo desplegar el mismo modelo en varias regiones?

Sí. Cada modelo puede desplegarse en múltiples regiones simultáneamente. Tu plan determina el número total de endpoints disponibles: 3 para Free, 10 para Pro e ilimitado para Enterprise. Esto te permite servir a usuarios de todo el mundo con endpoints de baja latencia en cada región.

¿Cuánto cuesta el despliegue?

Los endpoints dedicados se facturan en función de la CPU, la memoria y el volumen de solicitudes. Con el escalado a cero habilitado por defecto, solo pagas por el tiempo de inferencia activa. No hay coste cuando tu endpoint no recibe solicitudes. La inferencia compartida está incluida en tu plan de plataforma.

¿Cuál es la diferencia entre la inferencia compartida y la dedicada?

La inferencia compartida se ejecuta en un servicio multi-inquilino en 3 regiones y tiene un límite de 20 solicitudes por minuto. Es ideal para el desarrollo y las pruebas rápidas. Los endpoints dedicados son servicios de un solo inquilino desplegados en cualquiera de las 43 regiones sin límites de velocidad, latencia constante y recursos configurables, creados para cargas de trabajo de producción escalables.

¿Cuánto tarda el despliegue?

El despliegue de un endpoint dedicado suele tardar entre uno y dos minutos. Esto incluye el aprovisionamiento del contenedor, el inicio y una comprobación de salud inicial para validar que el servicio está listo. Una vez que el endpoint está listo, comienza a aceptar solicitudes de inferencia de inmediato.

¿Qué es el despliegue de modelos?

El despliegue de modelos es el proceso de poner a disposición un modelo de visión artificial entrenado para recibir y procesar datos del mundo real. Una vez desplegadas, las aplicaciones de visión artificial pueden enviar imágenes y fotogramas de vídeo al modelo a través de la API y recibir predicciones, lo que permite desde la inspección automática de calidad hasta la detección de objetos en tiempo real en sistemas de producción. En la Ultralytics Platform, el despliegue está integrado directamente en el flujo de trabajo de entrenamiento de extremo a extremo. Una vez que tu modelo está entrenado, puedes probarlo en el navegador, desplegarlo en un endpoint dedicado en cualquiera de las 43 regiones globales y supervisar su rendimiento, todo desde el mismo espacio de trabajo.

Plataforma Ultralytics

Despliega modelos de visión artificial en 42 regiones globales

Tus modelos entrenados, desde las pruebas en el navegador hasta los endpoints de producción en unos pocos clics con autoescalado, monitorización en tiempo real y 20 formatos de exportación.

Solicitar licencia Prueba la inferencia en el navegador

Interfaz de despliegue de Ultralytics que muestra las opciones de despliegue de modelos.

Despliega a escala de producción global

Lleva los modelos entrenados a producción con disponibilidad mundial, compatibilidad amplia de exportación y el volumen de uso probado por el ecosistema Ultralytics.

42+

Regiones de despliegue

19+

Formatos de exportación

—

Usos diarios

Tarjeta de despliegue de Ultralytics para un modelo de visión artificial entrenado.

Despliega en 42 regiones en todo el mundo

Despliega tus modelos en endpoints dedicados en América, Europa, Asia-Pacífico y Oriente Medio. Cada endpoint tiene su propia URL, escalado automático y monitorización.

Vista de despliegue con escalado automático para los endpoints de inferencia de Ultralytics.

Escalado automático que se ajusta a tu tráfico

Los endpoints dedicados aumentan su capacidad ante picos de tráfico y se reducen a cero cuando están inactivos.

Escalar a cero por defecto: Sin coste cuando tu endpoint no recibe solicitudes.
Sin límites de tasa: Los endpoints dedicados no tienen límites de rendimiento.
Recursos configurables: Elige CPU (1-8 núcleos) y memoria (1-32 GB) para adaptarlos a tu carga de trabajo.

Selector de formato de exportación de modelos para ONNX, TensorRT, CoreML, LiteRT y otros formatos.

20 formatos de exportación. Tu modelo. Cualquier entorno.

La plataforma Ultralytics admite despliegue en la nube y en el borde para un alto rendimiento. Todos los modelos YOLO de Ultralytics están optimizados de forma nativa para ejecutarse de manera eficiente en distintos entornos, ofreciendo una alta precisión, un rendimiento fiable y compatibilidad incluso en dispositivos de borde con recursos de computación limitados.

Panel de monitorización de Ultralytics para la inferencia de modelos desplegados.

Monitorízalo todo en producción

Visibilidad completa en tiempo real del rendimiento de tus modelos. Una vez que tus modelos están activos, el panel de despliegues te ofrece una visión centralizada de cada endpoint en ejecución, con las métricas y las herramientas que necesitas para optimizar y mantener tus frameworks funcionando de forma fiable.

Volumen de solicitudes: Total de solicitudes en todos los endpoints durante las últimas 24 horas.
Latencia P95: Tiempo de respuesta en el percentil 95 para realizar un seguimiento del rendimiento en casos de uso reales.
Tasas de error: Alertas claras cuando las tasas de error superan el 5%, con registros filtrados por gravedad para diagnosticar problemas rápidamente.
Comprobaciones de estado: Monitorización de endpoints en vivo con reintento automático. Latencia mostrada por cada comprobación.

Fragmento de código Python para enviar una imagen a un endpoint de despliegue.

Integración en minutos

Cada endpoint desplegado viene con ejemplos de código autogenerados en Python, JavaScript y cURL, precargados con tu URL de endpoint real y tu clave de API. Copia, pega y empieza a enviar solicitudes de inferencia desde cualquier aplicación.

Prueba tu modelo en el navegador

Cada modelo entrenado incluye una funcionalidad integrada en la pestaña Predict. Sube una imagen o abre tu cámara; los BBox aparecerán al instante.

La inferencia ejecuta el mejor rendimiento del modelo automáticamente al subir una imagen o cambiar un parámetro.

Ajusta con precisión los umbrales de confianza, los ajustes de IoU y el tamaño de la imagen para ver cómo afectan a las predicciones en tiempo real.

La detección, la segmentación de instancias, la segmentación semántica, la clasificación, la estimación de poses y OBB se representan claramente para tu tarea.

Pestaña de despliegue de endpoints en la nube en la plataforma Ultralytics.

Prueba la inferencia de YOLO26

Arrastra y suelta una imagen para ver la detección de objetos en tiempo real

Demo en directo

Imagen de entrada

Sube una imagen o selecciona un ejemplo para probar yolo26n. Documentación de predicción

Suelta una imagen aquí

o haz clic para buscar

Admite JPEG, PNG, WebP, AVIF, HEIC, JP2, TIFF, BMP y más (máximo 10 MB)

O prueba un ejemplo

Confianza

0.25

IoU

0.70

Tamaño de imagen

640

Documentación de la API

Despliega tu modelo para obtener un endpoint de inferencia dedicado con autenticación mediante clave API; luego reemplaza la URL y la clave de marcador de posición a continuación con tus valores de despliegue. Documentación de despliegue

Nota: Este es un código de ejemplo. Despliega tu modelo primero para obtener tu URL de endpoint y tu clave API.

import requests

# Replace with your deployment URL and API key
url = "https://your-deployment-url.run.app/predict"
api_key = "YOUR_API_KEY"

# Optional inference parameters (conf, iou, imgsz)
args = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

with open("image.jpg", "rb") as f:
    response = requests.post(
        url,
        headers={"Authorization": f"Bearer {api_key}"},
        data=args,
        files={"file": f},
    )

print(response.json())

¡Aprende a desplegar!

Observa cómo probar un modelo entrenado, desplegarlo en un endpoint global y monitorizar el rendimiento.

Explorar soluciones del sector

Mira cómo los equipos aplican la visión artificial de Ultralytics en entornos de producción.

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Despliega modelos de visión artificial en 42 regiones globales

Despliega a escala de producción global

Despliega en 42 regiones en todo el mundo

Escalado automático que se ajusta a tu tráfico

20 formatos de exportación. Tu modelo. Cualquier entorno.

Monitorízalo todo en producción

Integración en minutos

Prueba tu modelo en el navegador

Prueba la inferencia de YOLO26

¡Aprende a desplegar!

Explorar soluciones del sector

IA en robótica

IA en logística

IA en el sector minorista

IA en la atención sanitaria

IA en la fabricación

IA en automoción

IA en agricultura

IA en robótica

IA en logística

IA en el sector minorista

IA en la atención sanitaria

IA en la fabricación

IA en automoción

IA en agricultura

IA en robótica

IA en logística

IA en el sector minorista

IA en la atención sanitaria

IA en la fabricación

IA en automoción

IA en agricultura

Preguntas frecuentes

¡Empieza a desplegar hoy mismo!