ultralytics
Переносите обученные модели из браузера на производственные конечные точки всего за несколько кликов с помощью автоматического масштабирования, мониторинга в реальном времени и более 17 форматов экспорта. Комплексное решение для развертывания в реальных условиях.

43+
Регионы развертывания
17+
Форматы экспорта
500+
Активные развертывания





Выделенные конечные точки автоматически масштабируются для обработки пиковых нагрузок и сводятся к нулю в режиме простоя, поэтому вы никогда не платите за вычислительные ресурсы, которые не используете.
По умолчанию нагрузка равна нулю. Расходы не взимаются , когда ваш конечный узел не получает запросов.
Без ограничений по пропускной способности. Без ограничений по пропускной способности. В отличие от общих инференционных ресурсов, выделенные конечные точки не имеют ограничений по пропускной способности и ограничиваются лишь ресурсами вашей конечной точки.
Настраиваемые ресурсы. Выберите CPU (1–8) и объем памяти (1–32 ГБ) в соответствии с требованиями вашей модели и особенностями трафика.
Ultralytics поддерживает как облачное, так и периферийное развертывание. ВсеYOLO Ultralytics YOLO изначально оптимизированы для эффективной работы в различных средах, обеспечивая стабильную производительность даже на оборудовании с ограниченными вычислительными ресурсами.


Полная видимость производительности ваших моделей в режиме реального времени. После запуска моделей панель мониторинга развертываний предоставляет вам централизованный обзор всех работающих конечных точек, включая метрики, необходимые для обеспечения надежной работы ваших фреймворков.
Объем запросов. Общее количество запросов по всем конечным точкам за последние 24 часа.
Задержка P95. Время отклика в 95-м процентиле для track производительности track условиях эксплуатации.
Показатели ошибок. Выделение предупреждений при превышении показателя ошибок 5 % с фильтрацией журналов по уровню серьезности, что помогает быстро диагностировать проблемы.
Проверка работоспособности. Индикаторы текущего состояния с автоматической повторной попыткой в случае неработоспособности конечных точек. Задержка отклика отображается рядом с каждой проверкой.
Каждый развёрнутый конечный пункт поставляется с автоматически сгенерированными примерами кода на Python, JavaScript и cURL, в которые уже вставлены ваш реальный URL-адрес конечного пункта и ключ API. Просто скопируйте и вставьте их, чтобы начать отправлять запросы на инференцию из любого приложения.

Да. Каждую модель можно развернуть одновременно в нескольких регионах . Общее количество доступных конечных точек зависит от вашего тарифного плана: 3 в версии Free, 10 в версии Pro и неограниченное количество в версии Enterprise. Это позволяет обслуживать пользователей по всему миру с помощью конечных точек с низкой задержкой в каждом регионе.
Оплата выделенных конечных точек рассчитывается на основе CPU, памяти и объема запросов. Поскольку по умолчанию включена функция «Scale-to-zero», вы платите только за время активного выполнения инференции; когда конечная точка не получает запросов, оплата не взимается. Общая инференция включена в ваш тарифный план платформы.
Общий сервис инференции работает в многопользовательском режиме в 3 регионах и имеет ограничение по скорости в 20 запросов в минуту. Он лучше всего подходит для разработки и быстрого тестирования. Выделенные конечные точки — это однопользовательские сервисы, развернутые в любом из 43 регионов, без ограничений по скорости, с постоянной задержкой и настраиваемыми ресурсами, предназначенные для масштабируемых производственных рабочих нагрузок.
Развертывание выделенного конечного пункта обычно занимает от одной до двух минут. Этот процесс включает в себя подготовку контейнера, его запуск и первоначальную проверку работоспособности, позволяющую убедиться в готовности службы. Как только конечный пункт готов, он сразу же начинает принимать запросы на инференцию .
Развертывание модели — это процесс, при котором обученная модель компьютерного зрения становится доступной для приема и обработки реальных данных. После развертывания приложения компьютерного зрения могут отправлять изображения и видеокадры в модель через API и получать прогнозы, что позволяет реализовывать самые разные задачи — от автоматизированного контроля качества до обнаружения объектов в реальном времени в производственных системах. На Ultralytics развертывание интегрировано непосредственно в сквозной рабочий процесс обучения. После обучения модели вы можете протестировать ее в браузере, развернуть на выделенном конечном устройстве в любом из 43 регионов мира и отслеживать ее производительность — и все это из одного рабочего пространства.
Внедрите свои обученные модели в производственную среду в 43 регионах по всему миру с помощью автоматического масштабирования и мониторинга в режиме реального времени.