5 советов по эффективному развертыванию YOLO26 на периферии и в облаке

В прошлом месяце Ultralytics запустила Ultralytics , установив новый стандарт для Vision AI, отрасли искусственного интеллекта, которая позволяет машинам интерпретировать и понимать визуальную информацию из изображений и видео. Вместо простой съемки видео, модели компьютерного зрения, такие какYOLO Ultralytics YOLO , поддерживают такие задачи, как обнаружение объектов, сегментация экземпляров, оценка позы и классификация изображений.

YOLO26 — это современная модель, разработанная для реальных условий эксплуатации компьютерного зрения на устройствах, камерах, роботах и производственных системах. Она обеспечивает более быстрое выполнение вычислений на центральном процессоре (CPU), упрощенное развертывание и эффективную сквозную производительность в реальных условиях. Модели YOLO26 также были разработаны для упрощения перехода решений компьютерного зрения от экспериментальной стадии к производству.

Рис. 1. Модель YOLO26 nano обеспечивает на 43 % более быстрое CPU по сравнению с YOLO11. (Источник)

Развертывание модели обычно сопровождается различными соображениями, такими как выбор подходящего оборудования, выбор подходящего формата экспорта, оптимизация производительности и проверка результатов в реальных условиях. Выполнение этих шагов при развертывании YOLO26 не представляет сложности благодаря Python Ultralytics Python , который упрощает обучение, инференцию и экспорт моделей на нескольких целевых платформах развертывания.

Однако даже при упрощенных рабочих процессах ключевое значение имеет принятие правильных решений по развертыванию. В этой статье мы рассмотрим пять практических советов, которые помогут вам эффективно развернуть YOLO26 в пограничных и облачных средах, обеспечив надежную и масштабируемую производительность Vision AI в производственной среде. Приступим!

Что такое развертывание модели в компьютерном зрении?

Прежде чем углубиться в стратегии развертывания YOLO26, давайте сделаем шаг назад и разберемся, что означает развертывание модели в компьютерном зрении.

Развертывание модели — это процесс переноса обученной модели глубокого обучения из среды разработки в реальное приложение, где она может обрабатывать новые изображения или видеопотоки и непрерывно генерировать прогнозы. Вместо проведения экспериментов на статических наборах данных модель становится частью действующей системы.

В компьютерном зрении это часто означает интеграцию модели с камерами, периферийными устройствами искусственного интеллекта, API или облачной инфраструктурой. Она должна работать в рамках аппаратных ограничений, соответствовать требованиям к задержке и поддерживать стабильную производительность в меняющихся реальных условиях.

Понимание этого перехода от экспериментирования к производству имеет важное значение, поскольку решения о внедрении напрямую влияют на то, насколько хорошо модель работает за пределами лаборатории или экспериментальной установки.

Понимание рабочих процессов развертывания Ultralytics

Далее рассмотрим, что на самом деле включает в себя рабочий процесс развертывания YOLO26. Проще говоря, это последовательность шагов, в ходе которых изображение сначала захватывается, а затем анализируется и преобразуется в прогноз.

В типичной конфигурации камера снимает изображение или видеокадр. Затем эти данные подвергаются предварительной обработке, например, изменяется их размер или формат, после чего они передаются в Ultralytics для вывода.

Модель анализирует входные данные и генерирует такие результаты, как ограничительные рамки, маски сегментации или ключевые точки. Эти результаты затем могут быть использованы для запуска действий, таких как отправка оповещений, обновление панели управления или управление роботизированной системой.

Место выполнения этого рабочего процесса зависит от вашей стратегии развертывания. Например, при развертывании на периферии вывод происходит непосредственно на устройстве или рядом с камерой, что помогает сократить задержку и повысить конфиденциальность данных.

Между тем, при развертывании в облаке изображения или видеокадры отправляются на удаленные серверы для обработки, что обеспечивает большую масштабируемость и централизованное управление. Некоторые системы используют гибридный подход, выполняя легкую обработку на периферии и более тяжелые рабочие нагрузки в облаке.

Изучение вариантов модели YOLO26

Чтобы принять обоснованное решение о внедрении, также важно понимать, что существуют различные варианты модели YOLO26, из которых можно выбрать.

YOLO Ultralytics YOLO доступны в нескольких размерах, что упрощает выбор версии, соответствующей вашим требованиям к оборудованию и производительности. YOLO26 доступен в пяти вариантах: Nano (n), Small (s), Medium (m), Large (l) и Extra Large (x).

Меньшие модели, такие как YOLO26n, оптимизированы для эффективности и отлично подходят для периферийных устройств, устройств Интернета вещей (IoT), встроенных систем и систем на базе CPU, где важны низкая задержка и низкое энергопотребление. Они обеспечивают высокую производительность при минимальном использовании ресурсов.

Более крупные модели, такие как YOLO26l и YOLO26x, разработаны для обеспечения более высокой точности и обработки более сложных сцен. Эти варианты обычно демонстрируют наилучшую производительность на системах, оснащенных графическими процессорами (GPU), или в облачных средах, где доступно больше вычислительных ресурсов.

Выбор подходящего размера модели зависит от ваших целей развертывания. Если скорость и эффективность на ограниченном аппаратном обеспечении являются вашими главными приоритетами, идеальным вариантом может быть меньшая модель. Если ваше приложение требует максимальной точности и у вас есть доступ к более мощному аппаратному обеспечению, лучшим выбором может быть более крупная модель.

Советы по эффективному развертыванию YOLO26

Теперь, когда мы лучше понимаем варианты модели YOLO26 и рабочие процессы развертывания, давайте рассмотрим несколько практических советов по эффективному развертыванию YOLO26 в пограничных и облачных средах.

Совет 1: Рассмотрите варианты развертывания модели

Одно из первых решений, которое вам нужно принять при развертывании Ultralytics , — это место, где будет работать модель. Ваша среда развертывания напрямую влияет на производительность, задержку, конфиденциальность и масштабируемость.

Начните с оценки своего рабочего процесса. Требует ли ваше приложение низкой задержки, то есть прогнозы должны генерироваться практически мгновенно после захвата изображения?

Например, в робототехнике или системах безопасности даже небольшие задержки могут повлиять на производительность. В таких случаях лучшим вариантом часто является развертывание на периферии. Выполнение инференции непосредственно на устройстве или рядом с камерой сокращает время обработки данных и позволяет избежать отправки изображений через Интернет, что также может повысить уровень конфиденциальности.

С другой стороны, развертывание в облаке обеспечивает большую масштабируемость и вычислительную мощность. Облачные серверы могут обрабатывать большие объемы изображений, обрабатывать несколько видеопотоков и поддерживать более высокую пропускную способность.

Например, в сельском хозяйстве фермер может собрать тысячи изображений листьев и проанализировать их партиями, чтобы определить, есть ли у урожая признаки заболевания. В таком сценарии может не потребоваться мгновенная производительность в режиме реального времени, что делает облачную обработку практичным и масштабируемым выбором.

Рис. 2. Пример использования YOLO26 для анализа изображений листьев

Однако отправка данных на удаленные серверы влечет за собой сетевую задержку, которая является задержкой, вызванной передачей изображений через Интернет и получением прогнозов в ответ. Для приложений, которые не чувствительны ко времени, такой компромисс может быть приемлемым.

Существуют также варианты между чистым краем и чистым облаком. Некоторые компании используют локальную инфраструктуру, расположенную рядом с местом генерации данных. Другие создают гибридные конвейеры, выполняя легкую фильтрацию на краю и отправляя выбранные данные в облако для более глубокого анализа.

Выбор подходящего варианта развертывания зависит от требований вашего приложения. Четко определив свои потребности в скорости, конфиденциальности и масштабируемости, вы можете выбрать стратегию, которая обеспечит надежную работу YOLO26 в реальных условиях.

Совет 2: Выберите формат экспорта, соответствующий вашему оборудованию

После того, как вы определились, где будет работать ваша модель, следующим шагом будет выбор подходящего формата экспорта. Экспорт модели означает преобразование ее из формата, использовавшегося во время обучения, в формат, оптимизированный для развертывания.

Модели YOLO26 изначально созданы и обучены в PyTorch, но производственные среды часто полагаются на специализированные среды выполнения, которые лучше подходят для конкретного оборудования. Эти среды выполнения предназначены для повышения скорости вывода, снижения использования памяти и обеспечения совместимости с целевым устройством.

Преобразование YOLO26 в соответствующий формат позволяет ему эффективно работать вне среды обучения.Python Ultralytics Python упрощает этот процесс. Он поддерживает широкий спектр интеграций для создания и развертывания проектов компьютерного зрения.

Если вы хотите более подробно изучить эти интеграции, вы можете ознакомиться с официальной Ultralytics . Она включает пошаговые руководства, рекомендации по конкретному оборудованию и практические примеры, которые помогут вам с уверенностью перейти от разработки к производству.

Рис. 3. Ultralytics различные интеграции (Источник)

В частности,Python Ultralytics Python поддерживает экспорт Ultralytics в несколько форматов, адаптированных для различных аппаратных платформ. Например, формат ONNX обеспечивает кроссплатформенную совместимость, формат TensorRT оптимизирован для NVIDIA и периферийных устройств NVIDIA , а формат OpenVINO разработан для Intel .

Некоторые устройства поддерживают более одного формата экспорта, но производительность может варьироваться в зависимости от выбранного формата. Вместо того, чтобы выбирать формат по умолчанию, спросите себя: какой вариант наиболее эффективен для вашего устройства?

Один формат может обеспечить более быстрое выведение, а другой — более эффективное использование памяти или более простую интеграцию в существующий конвейер. Поэтому важно подобрать формат экспорта, соответствующий вашему конкретному оборудованию и среде развертывания.

Уделение времени тестированию различных вариантов экспорта на целевом устройстве может значительно повлиять на реальную производительность. Правильно подобранный формат экспорта помогает обеспечить эффективную и надежную работу YOLO26 со скоростью, необходимой для вашего приложения.

Совет 3: Спросите, нужна ли вашей модели квантование

После выбора формата экспорта также рекомендуется определить, следует ли квантовать модель.

Квантование модели снижает численную точность весов и вычислений модели, обычно преобразуя их из 32-разрядного плавающего запятого формата в форматы с более низкой точностью, такие как 16-разрядный или 8-разрядный. Это помогает уменьшить размер модели, снизить использование памяти и повысить скорость вывода, особенно на периферийных устройствах или системах, работающих на базе CPU.

В зависимости от вашего оборудования, формата экспорта и зависимостей среды выполнения, квантование может заметно улучшить производительность. Некоторые среды выполнения оптимизированы для моделей с более низкой точностью, что позволяет им работать быстрее и эффективнее.

Однако квантование может немного повлиять на точность, если его применять неаккуратно. При выполнении квантования после обучения убедитесь, что вы передаете изображения для валидации. Эти изображения используются во время калибровки, чтобы помочь модели адаптироваться к более низкой точности и сохранить стабильность прогнозов.

Совет 4: Учитывайте смещение данных

Даже самая хорошо обученная модель со временем может потерять свою эффективность из-за сдвига данных. Сдвиг данных происходит, когда данные, которые ваша модель видит в производственной среде, отличаются от данных, на которых она была обучена.

Другими словами, реальный мир меняется, а ваша модель остается неизменной. В результате точность может постепенно снижаться.

Например, вы можете обучить модель YOLO26 с использованием изображений, снятых в дневное время. Если эта же модель будет позже использоваться в ночное время, в других условиях освещения, производительность может снизиться. Такая же проблема может возникнуть при изменении углов камеры, погодных условий, фона или внешнего вида объектов.

Смещение данных является обычным явлением в реальных системах искусственного интеллекта для обработки изображений. Окружающая среда редко бывает статичной, и даже небольшие изменения могут повлиять на точность распознавания. Чтобы уменьшить влияние смещения, можно убедиться, что обучающий набор данных максимально точно отражает реальные условия.

Включите изображения, снятые в разное время суток, при разных условиях освещения и в различных средах. После развертывания вы можете продолжать отслеживать производительность и при необходимости обновлять или настраивать модель.

Совет 5: Проводите тестирование в реальных условиях

Перед полным развертыванием модели вы можете протестировать ее в реальных условиях.

Рис. 4. Сравнение YOLO26 с другими моделями (Источник)

Обычно производительность тестируется в контролируемой среде с использованием образцов изображений или небольших наборов данных. Однако в реальных системах поведение часто бывает иным. На производительность могут влиять аппаратные ограничения, сетевые задержки, несколько видеопотоков и непрерывный ввод данных.

Бенчмаркинг — это измерение производительности вашей модели на реальном устройстве и в реальной конфигурации, в которой она будет работать. Это включает в себя проверку скорости вывода, общей задержки, использования памяти и стабильности системы. Важно тестировать не только саму модель, но и весь конвейер, включая этапы предварительной обработки и любой последующей обработки.

Модель может хорошо работать при тестировании на одном изображении, но испытывать трудности при непрерывной обработке видео в реальном времени. Аналогичным образом, производительность на мощной машине для разработки может не отражать поведение модели на периферийном устройстве с низким энергопотреблением.

Проводя тестирование в реалистичных условиях, вы можете заранее выявить узкие места и внести необходимые корректировки до запуска в эксплуатацию. Тестирование в той же среде, в которой будет работать YOLO26, помогает обеспечить надежную, стабильную и постоянную производительность в производственной среде.

Другие ключевые соображения по развертыванию модели

Вот несколько дополнительных факторов, которые следует учитывать при развертывании YOLO26:

Мониторинг и регистрация: настройте инструменты мониторинга для track таких track , как задержка, точность и работоспособность системы после развертывания.
Безопасность и конфиденциальность: внедрите меры защиты для защиты конфиденциальных визуальных данных, особенно при использовании облачной или удаленной инфраструктуры.
Оптимизация узких мест в конвейере: оцените весь конвейер, включая такие модули, как предварительная обработка, вывод, постобработка и передача данных, поскольку задержки могут возникать за пределами самой модели.
Планирование масштабируемости: заранее планируйте рост, обеспечив способность вашей системы обрабатывать увеличенный трафик, дополнительные камеры или расширенные рабочие нагрузки.

Основные выводы

Эффективное развертывание YOLO26 начинается с понимания того, где будет работать ваша модель и что действительно нужно вашему приложению. Выбрав правильный подход к развертыванию, подобрав формат экспорта в соответствии с вашим оборудованием и протестировав производительность в реальных условиях, вы сможете создать надежные и отзывчивые системы Vision AI. При правильной настройке Ultralytics упрощает внедрение быстрого, готового к производству компьютерного зрения в периферийные устройства и облако.

Присоединяйтесь к нашему сообществу и изучите наш репозиторий GitHub. Посетите наши страницы с решениями, чтобы узнать о различных приложениях, таких как ИИ в сельском хозяйстве и компьютерное зрение в здравоохранении. Ознакомьтесь с нашими вариантами лицензирования и начните использовать Vision AI уже сегодня!

5 лучших советов по эффективному развертыванию YOLO26 на периферии и в облаке

Что такое развертывание модели в компьютерном зрении?

Понимание рабочих процессов развертывания Ultralytics

Изучение вариантов модели YOLO26

Советы по эффективному развертыванию YOLO26

Совет 1: Рассмотрите варианты развертывания модели

Совет 2: Выберите формат экспорта, соответствующий вашему оборудованию

Совет 3: Спросите, нужна ли вашей модели квантование

Совет 4: Учитывайте смещение данных

Совет 5: Проводите тестирование в реальных условиях

Другие ключевые соображения по развертыванию модели

Основные выводы

Читать больше в этой категории

5 лучших советов по эффективному развертыванию YOLO26 на периферии и в облаке

Как настроить Ultralytics для сегментации экземпляров

Обзор использованияYOLO Ultralytics YOLO для обнаружения угроз с помощью искусственного интеллекта

Давайте строить будущее
ИИ вместе!

5 лучших советов по эффективному развертыванию YOLO26 на периферии и в облаке

Что такое развертывание модели в компьютерном зрении?

Понимание рабочих процессов развертывания Ultralytics

Изучение вариантов модели YOLO26

Советы по эффективному развертыванию YOLO26

Совет 1: Рассмотрите варианты развертывания модели

Совет 2: Выберите формат экспорта, соответствующий вашему оборудованию

Совет 3: Спросите, нужна ли вашей модели квантование

Совет 4: Учитывайте смещение данных

Совет 5: Проводите тестирование в реальных условиях

Другие ключевые соображения по развертыванию модели

Основные выводы

Читать больше в этой категории

5 лучших советов по эффективному развертыванию YOLO26 на периферии и в облаке

Как настроить Ultralytics для сегментации экземпляров

Обзор использованияYOLO Ultralytics YOLO для обнаружения угроз с помощью искусственного интеллекта

Давайте строить будущее ИИ вместе!

Давайте строить будущее
ИИ вместе!