Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас

Ultralytics : развертывание моделей компьютерного зрения в любом регионе

Узнайте, как развернуть свои модели компьютерного зрения в любом регионе с помощью Ultralytics , обеспечивающей масштабируемое, быстрое и гибкое внедрение ИИ.

Масштабируйте свои проекты в области компьютерного зрения с Ultralytics

Начать

В начале этой недели Ultralytics Ultralytics — новую комплексную среду, призванную ускорить внедрение систем компьютерного зрения (CV) за счет оптимизации всех этапов рабочего процесса искусственного интеллекта в области компьютерного зрения — от подготовки данных и разработки моделей до развертывания.

Одной из основных причин разработки Ultralytics является то, что для того, чтобы решение в области компьютерного зрения, позволяющее машинам анализировать изображения и видео, прошло путь от идеи до практического применения, недостаточно просто создать надежную модель. После того как модель обучена и прошла валидацию, её необходимо развернуть, чтобы приложения могли надежно отправлять изображения, получать прогнозы и выполнять вычисления в реальных условиях.

На этом этапе жизненного цикла машинного обучения модели компьютерного зрения выходят за рамки экспериментальной стадии и начинают использоваться в реальных системах. Даже если предыдущие этапы — такие как подготовка наборов данных, аннотирование, обучение моделей и тестирование — проходят гладко, без надёжного способа развёртки моделей эти результаты не принесут никакой пользы.

Реальность такова, что во многих проектах в области компьютерного зрения внедрение может стать одним из самых сложных этапов рабочего процесса. 

Командам часто приходится настраивать API для вывода, управлять вычислительными ресурсами, развертывать модели вблизи пользователей для сокращения задержки, а также отслеживать производительность после запуска систем в производственной среде.

Ultralytics оптимизирует и автоматизирует этот процесс, предлагая различные варианты развертывания, включая форматы экспорта моделей, общие службы инференции и выделенные конечные точки в разных регионах мира. Благодаря управляемой инфраструктуре и встроенному мониторингу команды могут легко переходить от обученных моделей к готовым к производственному использованию системам компьютерного зрения.

Рис. 1. Обзор развертывания моделей с помощью Ultralytics (Источник)

В этой статье мы рассмотрим, как развернуть модели компьютерного зрения в любом регионе с помощью выделенных конечных точек на Ultralytics . Приступим!

Что такое развертывание модели CV?

Прежде чем мы перейдем к тому, как развертывать модели глубокого обучения с помощью Ultralytics , давайте разберемся, что на самом деле означает развертывание моделей компьютерного зрения.

Развертывание модели компьютерного зрения — это процесс, при котором обученная модель становится доступной для использования в реальных условиях. Вместо того чтобы работать исключительно в учебной среде, модель настраивается таким образом, чтобы приложения могли отправлять ей изображения или видео и получать в ответ прогнозы. 

Например, модель может detect на изображении, выполнять сегментацию изображения, идентифицировать предметы на складе или распознавать паттерны в видеозаписях. В большинстве реальных систем это осуществляется через API или конечную точку инференции. 

Приложение отправляет изображение в модель, модель обрабатывает его и возвращает прогноз за считанные миллисекунды. Именно это позволяет моделям компьютерного зрения, таким как Ultralytics YOLO , обеспечивать работу приложений в режиме реального времени.

Модели могут развертываться в различных средах в зависимости от конкретного сценария использования. Некоторые из них работают в облаке (через облачные платформы), и к ним могут обращаться многие приложения, в то время как другие работают на периферийных устройствах, таких как локальные камеры, роботы или встроенные системы, которым требуется быстрое локальное прогнозирование.

Варианты развертывания моделей искусственного интеллекта на Ultralytics

Ultralytics решает многие задачи, стоящие перед сообществом специалистов по компьютерному зрению, особенно в том, что касается развертывания моделей, и при этом предлагает гибкие способы выполнения инференции в зависимости от потребностей вашего приложения. 

Вот краткий обзор вариантов развертывания моделей, доступных на платформе:

  • Экспорт моделей: Модели можно экспортировать в 17 различных форматов, включая ONNX, TensorRT, CoreML и TFLite, что позволяет запускать модели в самых разных средах, таких как периферийные устройства (например, Raspberry Pi и NVIDIA ), мобильные приложения, контейнеры Docker и пользовательская инфраструктура.
  • Общий сервис инференции: платформа позволяет выполнять прогнозирование через управляемый общий сервис инференции, что идеально подходит для быстрого тестирования моделей 
  • Выделенные конечные точки: легко развертывайте модели в качестве независимых сервисов с уникальными URL-адресами API, которые могут работать в 43 регионах по всему миру, с встроенными функциями автоматического масштабирования, мониторинга и проверки работоспособности для производственных развертываний.

Развертывание с использованием выделенных конечных точек

Один из наиболее масштабируемых способов запуска предварительно обученных моделей или моделей компьютерного зрения, обученных по индивидуальным требованиям, в производственной среде на Ultralytics — это использование выделенных конечных точек. Выделенная конечная точка позволяет развернуть обученную модель в качестве отдельного сервиса, благодаря чему приложения могут отправлять ей изображения и получать прогнозы через API.

Вместо того чтобы запускать модель только в учебной среде или локальном ноутбуке, её развёртка в качестве конечной точки делает её доступной для реальных приложений. Например, складская система может отправлять изображения посылок для распознавания объектов, интеллектуальная камера — анализировать кадры видео, а робототехническая система — использовать прогнозы для управления своими действиями.

Каждый выделенный конечный узел работает как сервис с одним пользователем, то есть инфраструктура, на которой работает ваша модель, не используется совместно с другими пользователями. Это обеспечивает более предсказуемую производительность и упрощает мониторинг поведения модели в производственной среде.

Понимание функциональности выделенных конечных точек для вывода

Вы можете представить себе выделенный конечный пункт как хостируемый сервис для вашей модели. Ultralytics предоставляет уникальный URL-адрес конечного пункта, который служит точкой входа для приложений. 

Когда приложение отправляет запрос на этот URL-адрес, оно включает в него изображение и дополнительные параметры, такие как пороги достоверности или размер изображения, а также ключ API для аутентификации.

Сервис выполняет инференцию по изображению с использованием вашей модели и возвращает прогнозы в виде структурированного ответа. Такая конфигурация позволяет разработчикам интегрировать модели компьютерного зрения в реальные системы с помощью стандартных веб-инструментов. 

Приложения могут отправлять запросы с помощью Python, JavaScript, cURL или других HTTP-клиентов, что упрощает подключение моделей к информационным панелям, робототехническим системам или облачным приложениям. Поскольку конечная точка работает автономно, она также поддерживает масштабирование, мониторинг и глобальное развертывание, помогая командам создавать надёжные производственные системы компьютерного зрения.

Развертывание в нескольких регионах повышает эффективность вычислений в режиме реального времени

Одним из ключевых преимуществ выделенных конечных точек на Ultralytics является возможность развертывания моделей в 43 регионах по всему миру. Эти регионы охватывают различные части мира, включая Северную Америку, Южную Америку, Европу, Азиатско-Тихоокеанский регион, а также Ближний Восток и Африку.

Рис. 2. Ultralytics поддерживает 43 региона по всему миру (Источник)

Развертывание моделей в регионах, расположенных ближе к месту работы приложений, помогает сократить задержку — то есть время, необходимое приложению для отправки изображения и получения прогноза. Кроме того, это позволяет организациям соблюдать требования к конфиденциальности и хранению данных, поскольку обработка данных осуществляется ближе к месту их происхождения. 

Низкая задержка имеет важное значение для многих приложений компьютерного зрения, основанных на вычислениях в режиме реального времени, таких как робототехнические системы, устройства «Интернета вещей» (IoT), линии промышленного контроля и инфраструктура «умных городов».

Например, если приложение используется преимущественно в Европе, развертывание модели в европейском регионе может значительно сократить время отклика по сравнению с запуском модели в удаленном регионе. 

Как развернуть Ultralytics в любом регионе

Развертывание модели в конкретном регионе — это простой процесс, который обычно занимает всего пару минут. Платформа сама занимается настройкой инфраструктуры, благодаря чему разработчики могут сосредоточиться на интеграции модели в свои приложения. Давайте рассмотрим все этапы этого процесса.

Шаг 1: Обучить или загрузить модель

Перед развертыванием в вашем проекте должна быть доступна обученная модель. Это может быть модель, обученная непосредственно на Ultralytics , модель, загруженная после обучения в другом месте, или модель, клонированная из проекта сообщества, найденного на вкладке «Explore», где общедоступные проекты, опубликованные другими пользователями, можно скопировать в свою учетную запись одним щелчком мыши.

Когда модель будет готова, откройте её страницу в вашем проекте, чтобы продолжить.

Шаг 2: Откройте вкладку «Развертывание»

Перейдите на вкладку «Развертывание» для данной модели. В этом разделе платформы можно настраивать и запускать развертывания.

На этой странице вы увидите таблицу регионов и интерактивную карту с указанием доступных мест развертывания по всему миру. Платформа измеряет задержку от вашего местоположения и сортирует регионы в соответствии с этим показателем, чтобы помочь вам выбрать наиболее подходящий регион.

Рис. 3. Регионы, отсортированные по задержке на Ultralytics (Источник)

Шаг 3: Выберите регион развертывания

Выберите регион в зависимости от местоположения ваших пользователей или приложений. Размещение модели ближе к источнику запросов может значительно сократить время отклика.

Шаг 4: Развернуть конечную точку

После выбора региона и подтверждения настроек можно нажать кнопку «Развернуть».

Затем платформа подготавливает среду развертывания, загружает образ модели, запускает службу и выполняет проверку работоспособности, чтобы убедиться, что конечная точка готова к работе. Этот процесс обычно занимает около одной-двух минут.

После завершения развертывания платформа генерирует уникальный URL-адрес конечной точки, который приложения могут использовать для отправки запросов на инференцию.

Рис. 4. Пример развернутого конечного устройства (Источник)

Шаг 6: Начните отправлять запросы на вывод

После запуска конечной точки приложения могут начинать отправлять изображения в модель, используя предоставленный REST API и ключ API, переданный в заголовке «Authorization». Конечная точка обрабатывает каждый запрос и возвращает прогнозы, такие как обнаруженные объекты, ограничительные рамки или другие результаты, характерные для конкретной задачи.

Более подробную информацию о развертывании моделей можно найти в официальной документацииUltralytics .

Мониторинг производительности моделей и показателей для развернутых конечных точек

После развертывания модели компьютерного зрения мониторинг её производительности становится важной частью обеспечения надёжности и устойчивости системы. Даже хорошо обученную модель необходимо отслеживать в производственной среде, чтобы убедиться, что она по-прежнему быстро реагирует, правильно обрабатывает поступающие запросы и выдает точные прогнозы.

Ultralytics предоставляет встроенные инструменты мониторинга, которые позволяют командам отслеживать производительность развернутых конечных устройств. Страница «Развертывание» платформы выполняет роль панели мониторинга, предоставляя централизованный обзор всех работающих конечных устройств, а также ключевые показатели, которые помогают track состояние track и уровень её использования.

Вот некоторые показатели, которые можно отслеживать с помощью Платформы:

  • Задержка P95: этот показатель измеряет время отклика на стороне сервера в 95-м процентиле для запросов на инференцию. Он позволяет понять, сколько времени занимает обработка большинства запросов на инференцию, и выявить факторы, снижающие производительность.
  • Коэффициент ошибок: это процент запросов, которые завершились сбоем или вернули ошибки в течение выбранного периода мониторинга. Отслеживание коэффициента ошибок позволяет командам быстро detect с развертыванием или входящими запросами.
  • Общее количество запросов: этот показатель отражает общее количество запросов на инференцию, обработанных развернутыми конечными точками за выбранный период времени (например, за последние 24 часа). Он помогает командам оценить интенсивность трафика и частоту использования их моделей.

Помимо этих показателей, платформа также предоставляет данные о проверке работоспособности конечных точек и журналы развертывания. Проверки работоспособности показывают, правильно ли реагирует конечная точка, а журналы содержат подробную информацию о недавних запросах и системной активности.

Основные выводы

Развертывание моделей компьютерного зрения — это важнейший этап преобразования обученных моделей в системы, лежащие в основе реальных приложений. С помощью Ultralytics команды могут легко развертывать модели через выделенные конечные точки в 43 регионах по всему миру, выполнять инференцию в режиме реального времени через API и отслеживать производительность из единой среды. Благодаря сочетанию гибких вариантов развертывания, встроенного мониторинга и масштабируемой инфраструктуры платформа помогает разработчикам быстрее переходить от обученных моделей машинного обучения к надежным приложениям компьютерного зрения.

Станьте частью нашего растущего сообщества! Погрузитесь в наш репозиторий GitHub, чтобы узнать больше об ИИ. Если вы хотите создавать решения компьютерного зрения, ознакомьтесь с нашими вариантами лицензирования. Узнайте о преимуществах компьютерного зрения в здравоохранении и о том, как ИИ в логистике меняет ситуацию!

Давайте вместе создадим будущее искусственного интеллекта!

Начните свой путь в будущее машинного обучения