Могу ли я развернуть одну и ту же модель в нескольких регионах?

Да. Каждая модель может быть развернута в нескольких регионах одновременно. Твой план определяет общее количество доступных эндпоинтов: 3 для Free, 10 для Pro и неограниченно для Enterprise. Это позволяет обслуживать пользователей по всему миру с низкой задержкой в каждом регионе.

Сколько стоит развертывание?

Выделенные эндпоинты оплачиваются в зависимости от использования CPU, памяти и объема запросов. Благодаря функции «масштабирования до нуля» (scale-to-zero), включенной по умолчанию, ты платишь только за активное время инференса. Если эндпоинт не получает запросов, плата не взимается. Общий инференс включен в твой план платформы.

В чем разница между общим и выделенным инференсом?

Общий инференс работает на мультиарендном сервисе в 3 регионах и ограничен 20 запросами в минуту. Он лучше всего подходит для разработки и быстрого тестирования. Выделенные эндпоинты — это одноарендные сервисы, развернутые в любом из 43 регионов без ограничений по частоте запросов, с предсказуемой задержкой и настраиваемыми ресурсами, созданные для масштабируемых производственных нагрузок.

Сколько времени занимает развертывание?

Развертывание на выделенном эндпоинте обычно занимает от одной до двух минут. Это включает подготовку контейнера, запуск и начальную проверку работоспособности для подтверждения готовности сервиса. Как только эндпоинт готов, он сразу начинает принимать запросы на инференс.

Что такое развертывание модели?

Развертывание модели — это процесс предоставления обученной модели компьютерного зрения возможности получать и обрабатывать реальные данные. После развертывания приложения компьютерного зрения могут отправлять изображения и видеокадры на модель через API и получать прогнозы, что позволяет реализовать всё: от автоматизированного контроля качества до обнаружения объектов в реальном времени в производственных системах. На Ultralytics Platform развертывание интегрировано непосредственно в полный цикл обучения. После того как модель обучена, ты можешь протестировать её в браузере, развернуть на выделенном эндпоинте в любом из 43 регионов мира и отслеживать её производительность — всё из одного рабочего пространства.

Платформа Ultralytics

Развертывай модели компьютерного зрения в 42 регионах мира

Твои обученные модели от тестирования в браузере до продакшн-эндпоинтов за пару кликов с автомасштабированием, мониторингом в реальном времени и 20 форматами экспорта.

Запросить лицензию Попробовать инференс в браузере

Интерфейс развертывания Ultralytics с доступными опциями.

Развертывание в глобальном производственном масштабе

Переноси обученные модели в продакшн с доступностью по всему миру, широкой поддержкой экспорта и объемами использования, проверенными экосистемой Ultralytics.

42+

Регионов развертывания

19+

Форматов экспорта

—

Ежедневных использований

Карточка развертывания Ultralytics для обученной модели компьютерного зрения.

Развертывай в 42 регионах по всему миру

Развертывай свои модели на выделенных эндпоинтах в Северной и Южной Америке, Европе, Азиатско-Тихоокеанском регионе и на Ближнем Востоке. Каждый эндпоинт имеет собственный URL, автомасштабирование и мониторинг.

Вид развертывания с автомасштабированием для эндпоинтов вывода Ultralytics.

Автомасштабирование, соответствующее твоему трафику

Выделенные эндпоинты масштабируются при скачках трафика и снижают нагрузку до нуля в режиме ожидания.

Масштабирование до нуля по умолчанию: Никаких затрат, пока эндпоинт не получает запросов.
Без ограничений по скорости: Для выделенных эндпоинтов нет ограничений пропускной способности.
Настраиваемые ресурсы: Выбирай CPU (1-8 ядер) и память (1-32 ГБ) в зависимости от твоей рабочей нагрузки.

Селектор формата экспорта модели для ONNX, TensorRT, CoreML, LiteRT и других форматов.

20 форматов экспорта. Твоя модель. Любое окружение.

Платформа Ultralytics поддерживает облачное и периферийное развертывание для обеспечения высокой производительности. Все модели Ultralytics YOLO изначально оптимизированы для эффективной работы в различных средах, обеспечивая высокую точность, надежность и совместимость даже на периферийных устройствах с ограниченными вычислительными ресурсами.

Панель мониторинга Ultralytics для вывода развернутой модели.

Мониторинг всего в продакшене

Полная прозрачность производительности твоих моделей в реальном времени. Как только модели запущены, панель управления развертываниями дает тебе централизованный обзор каждого работающего эндпоинта с метриками и инструментами, необходимыми для оптимизации и поддержания надежной работы твоих фреймворков.

Объем запросов: Общее количество запросов по всем эндпоинтам за последние 24 часа.
Задержка P95: 95-й процентиль времени отклика для отслеживания производительности в реальных сценариях.
Уровень ошибок: Понятные уведомления при превышении уровня ошибок в 5% с журналами, отфильтрованными по степени серьезности для быстрой диагностики проблем.
Проверки работоспособности: Мониторинг эндпоинтов в реальном времени с автоматическим повтором. Задержка отображается для каждой проверки.

Фрагмент кода Python для отправки изображения на эндпоинт развертывания.

Интеграция за считанные минуты

Каждый развернутый эндпоинт поставляется с автосгенерированными примерами кода на Python, JavaScript и cURL, предварительно заполненными твоим URL эндпоинта и API ключом. Копируй, вставляй и начинай отправлять запросы на вывод из любого приложения.

Протестируй свою модель в браузере

Каждая обученная модель включает встроенную функцию вкладки Predict. Загрузи изображение или открой камеру; ограничивающие рамки (bbox) появятся мгновенно.

Вывод автоматически запускает работу модели с максимальной производительностью, когда ты загружаешь изображение или меняешь параметр.

Настраивай пороги достоверности, параметры IoU и размер изображения, чтобы в реальном времени увидеть, как они влияют на предсказания.

Детекция, сегментация экземпляров, семантическая сегментация, классификация, оценка позы и OBB наглядно представлены для твоей задачи.

Вкладка развертывания облачного эндпоинта на платформе Ultralytics.

Попробуй YOLO26 Inference

Перетащи изображение, чтобы увидеть обнаружение объектов в режиме реального времени

Live демо

Входное изображение

Загрузи изображение или выбери пример для тестирования yolo26n. Документация Predict

Перетащи изображение сюда

или нажми, чтобы выбрать

Поддерживаются JPEG, PNG, WebP, AVIF, HEIC, JP2, TIFF, BMP и другие (макс. 10 МБ)

Или попробуй пример

Доверие

0.25

IoU

0.70

Размер изображения

640

Документация API

Разверни свою модель, чтобы получить выделенный эндпоинт для инференса с аутентификацией по API-ключу, а затем замени плейсхолдер URL и ключ ниже на свои значения развертывания. Документация по развертыванию

Примечание: Это пример кода. Сначала разверни свою модель, чтобы получить URL эндпоинта и API-ключ.

import requests

# Replace with your deployment URL and API key
url = "https://your-deployment-url.run.app/predict"
api_key = "YOUR_API_KEY"

# Optional inference parameters (conf, iou, imgsz)
args = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

with open("image.jpg", "rb") as f:
    response = requests.post(
        url,
        headers={"Authorization": f"Bearer {api_key}"},
        data=args,
        files={"file": f},
    )

print(response.json())

Узнай, как выполнить развертывание!

Посмотри, как протестировать обученную модель, развернуть ее на глобальном эндпоинте и отслеживать производительность.

Изучить отраслевые решения

Посмотри, как команды применяют компьютерное зрение Ultralytics в производственных средах.

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Развертывай модели компьютерного зрения в 42 регионах мира

Развертывание в глобальном производственном масштабе

Развертывай в 42 регионах по всему миру

Автомасштабирование, соответствующее твоему трафику

20 форматов экспорта. Твоя модель. Любое окружение.

Мониторинг всего в продакшене

Интеграция за считанные минуты

Протестируй свою модель в браузере

Попробуй YOLO26 Inference

Узнай, как выполнить развертывание!

Изучить отраслевые решения

ИИ в робототехнике

ИИ в логистике

ИИ в розничной торговле

ИИ в здравоохранении

ИИ в производстве

ИИ в автомобильной отрасли

ИИ в сельском хозяйстве

ИИ в робототехнике

ИИ в логистике

ИИ в розничной торговле

ИИ в здравоохранении

ИИ в производстве

ИИ в автомобильной отрасли

ИИ в сельском хозяйстве

ИИ в робототехнике

ИИ в логистике

ИИ в розничной торговле

ИИ в здравоохранении

ИИ в производстве

ИИ в автомобильной отрасли

ИИ в сельском хозяйстве

Часто задаваемые вопросы

Начни развертывание сегодня!