Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас

ultralytics

Разверните модели искусственного интеллекта для обработки изображений в 43 регионах по всему миру

Переносите обученные модели из браузера на производственные конечные точки всего за несколько кликов с помощью автоматического масштабирования, мониторинга в реальном времени и более 17 форматов экспорта. Комплексное решение для развертывания в реальных условиях.

Пользовательский интерфейс, отображающий параметры экспорта PyTorch , включая ONNX, TorchScript, OpenVINO, TensorRT, CoreML, TF , TF SavedModel и TF GraphDef, с картой мира, на которой 3 развёрнутых системы отмечены зелёным цветом, а несколько других — красными метками.

43+

Регионы развертывания

17+

Форматы экспорта

500+

Активные развертывания

Протестируйте свою модель в браузере

Каждая обученная модель имеет встроенную вкладку «Предсказать». Загрузите изображение, выберите образец или включите камеру — результаты появятся мгновенно в виде ограничительных рамок, масок или ключевых точек, наложенных прямо на изображение.

Развернуть в 43 регионах по всему миру

Разверните свои модели на выделенных конечных точках в 43 регионах по всему миру, включая Северную и Южную Америку, Европу, Азиатско-Тихоокеанский регион и Ближний Восток. Каждая конечная точка представляет собой сервис с отдельной инстанцией, собственным URL-адресом, функцией автоматического масштабирования и независимым мониторингом.
Карта мира, на которой цветными флажками отмечены различные населённые пункты в Северной Америке, Европе и Азии.
Панель инструментов, отображающая показатели эффективности модели: mAP50 96,2 %, mAP50 — 90,1 % и точность — 87,2 %, а также панель журналов для модели сегментации YOLO26s, развернутой в Париже.

Автоматическое масштабирование, адаптирующееся к вашему трафику

Выделенные конечные точки автоматически масштабируются для обработки пиковых нагрузок и сводятся к нулю в режиме простоя, поэтому вы никогда не платите за вычислительные ресурсы, которые не используете.

По умолчанию нагрузка равна нулю. Расходы не взимаются , когда ваш конечный узел не получает запросов.

Без ограничений по пропускной способности. Без ограничений по пропускной способности. В отличие от общих инференционных ресурсов, выделенные конечные точки не имеют ограничений по пропускной способности и ограничиваются лишь ресурсами вашей конечной точки.

Настраиваемые ресурсы. Выберите CPU (1–8) и объем памяти (1–32 ГБ) в соответствии с требованиями вашей модели и особенностями трафика.

Более 17 форматов экспорта. Ваша модель. Любая среда.

Ultralytics поддерживает как облачное, так и периферийное развертывание. ВсеYOLO Ultralytics YOLO изначально оптимизированы для эффективной работы в различных средах, обеспечивая стабильную производительность даже на оборудовании с ограниченными вычислительными ресурсами.

Список форматов экспорта для PyTorch , включая ONNX, TorchScript, OpenVINO, TensorRT GPU, CoreML и TF , с соответствующими значками и кодами форматов.
Панель мониторинга показывает: 13 959 запросов, 3 активных развёртки, уровень ошибок 0% и задержку P95 14 мс за последние 24 часа.

Контролировать всё в производственной среде

Полная видимость производительности ваших моделей в режиме реального времени. После запуска моделей панель мониторинга развертываний предоставляет вам централизованный обзор всех работающих конечных точек, включая метрики, необходимые для обеспечения надежной работы ваших фреймворков.

Объем запросов. Общее количество запросов по всем конечным точкам за последние 24 часа.

Задержка P95. Время отклика в 95-м процентиле для track производительности track условиях эксплуатации.

Показатели ошибок. Выделение предупреждений при превышении показателя ошибок 5 % с фильтрацией журналов по уровню серьезности, что помогает быстро диагностировать проблемы.

Проверка работоспособности. Индикаторы текущего состояния с автоматической повторной попыткой в случае неработоспособности конечных точек. Задержка отклика отображается рядом с каждой проверкой.

Подключитесь за считанные минуты

Каждый развёрнутый конечный пункт поставляется с автоматически сгенерированными примерами кода на Python, JavaScript и cURL, в которые уже вставлены ваш реальный URL-адрес конечного пункта и ключ API. Просто скопируйте и вставьте их, чтобы начать отправлять запросы на инференцию из любого приложения.

Фрагмент Python для отправки изображения на конечную точку развертывания с помощью библиотеки requests с параметрами авторизации и вывода.

Сначала нужно обучить модель?

Ultralytics объединяет функции аннотирования, обучения и развертывания в единой платформе.

Часто задаваемые вопросы

Можно ли развернуть одну и ту же модель в нескольких регионах?

Да. Каждую модель можно развернуть одновременно в нескольких регионах . Общее количество доступных конечных точек зависит от вашего тарифного плана: 3 в версии Free, 10 в версии Pro и неограниченное количество в версии Enterprise. Это позволяет обслуживать пользователей по всему миру с помощью конечных точек с низкой задержкой в каждом регионе.

Сколько стоит развертывание?

Оплата выделенных конечных точек рассчитывается на основе CPU, памяти и объема запросов. Поскольку по умолчанию включена функция «Scale-to-zero», вы платите только за время активного выполнения инференции; когда конечная точка не получает запросов, оплата не взимается. Общая инференция включена в ваш тарифный план платформы.

В чём разница между общим и выделенным вычислением?

Общий сервис инференции работает в многопользовательском режиме в 3 регионах и имеет ограничение по скорости в 20 запросов в минуту. Он лучше всего подходит для разработки и быстрого тестирования. Выделенные конечные точки — это однопользовательские сервисы, развернутые в любом из 43 регионов, без ограничений по скорости, с постоянной задержкой и настраиваемыми ресурсами, предназначенные для масштабируемых производственных рабочих нагрузок.

Сколько времени занимает развертывание?

Развертывание выделенного конечного пункта обычно занимает от одной до двух минут. Этот процесс включает в себя подготовку контейнера, его запуск и первоначальную проверку работоспособности, позволяющую убедиться в готовности службы. Как только конечный пункт готов, он сразу же начинает принимать запросы на инференцию .

Что такое развертывание модели?

Развертывание модели — это процесс, при котором обученная модель компьютерного зрения становится доступной для приема и обработки реальных данных. После развертывания приложения компьютерного зрения могут отправлять изображения и видеокадры в модель через API и получать прогнозы, что позволяет реализовывать самые разные задачи — от автоматизированного контроля качества до обнаружения объектов в реальном времени в производственных системах. На Ultralytics развертывание интегрировано непосредственно в сквозной рабочий процесс обучения. После обучения модели вы можете протестировать ее в браузере, развернуть на выделенном конечном устройстве в любом из 43 регионов мира и отслеживать ее производительность — и все это из одного рабочего пространства.

Начните внедрение уже сегодня

Внедрите свои обученные модели в производственную среду в 43 регионах по всему миру с помощью автоматического масштабирования и мониторинга в режиме реального времени.