Встречай YOLO26: ИИ компьютерного зрения нового поколения.
Ultralytics
Ultralytics YOLO

Влияние более быстрого, ориентированного на периферию дизайна Ultralytics YOLO26

Узнай, почему Ultralytics YOLO26 быстрее работает на периферийных устройствах и почему это важно для компьютерного зрения следующего поколения, требующего низкой задержки и высокой эффективности.

АБАбирами Вина
6 min read
Более быстрый дизайн Ultralytics YOLO26 для периферийных устройств в компьютерном зрении

Ранее на этой неделе Ultralytics официально выпустила Ultralytics YOLO26 — более быструю, легкую и компактную модель YOLO, призванную переосмыслить работу систем компьютерного зрения на периферии. YOLO26 поддерживает те же базовые задачи компьютерного зрения, что и предыдущие модели YOLO, включая обнаружение объектов и сегментацию экземпляров.

Пример использования YOLO26 для сегментации объекта

Рис. 1. Пример использования YOLO26 для сегментации объекта.

Главное отличие YOLO26 от предыдущих моделей заключается в среде, для которой она была разработана. Вместо того чтобы оптимизироваться преимущественно под облачные графические процессоры (GPU) или производительность в бенчмарках, YOLO26 с самого начала создавалась для реального развертывания на периферийных устройствах и встроенном оборудовании.

По мере перехода компьютерного зрения от исследований к внедрению в производство, реальность ограничений производительности становится все более очевидной. Периферийные среды характеризуются жесткими лимитами задержки, ограниченной памятью, питанием и тепловыми ограничениями, а также необходимостью предсказуемого поведения на различных платформах.

В таких условиях общая производительность системы зависит не только от скорости чистого вывода, но и от эффективности работы всего конвейера. Накладные расходы на постобработку, нагрузка на память и специфические для платформы пути выполнения часто становятся «бутылочным горлышком».

YOLO26 решает эти проблемы, используя более быстрый, ориентированный на периферию подход, который рассматривает весь конвейер вывода, а не отдельные метрики модели. Сосредоточившись на оптимизации для периферии, упрощении конвейера вывода и устранении лишних этапов постобработки, YOLO26 обеспечивает прирост скорости, что приводит к снижению задержек и более надежному поведению в производстве.

В этой статье мы разберем, как архитектурные решения YOLO26 превращаются в реальное повышение производительности, и почему более высокая скорость на периферии фундаментально меняет возможности для следующего поколения приложений компьютерного зрения.

Link to this sectionРеалии развертывания на периферии#

Запуск моделей компьютерного зрения на периферии сильно отличается от их запуска в облаке. В облачных средах системы обычно имеют доступ к мощным GPU, большому объему памяти и стабильному оборудованию. На периферии эти предположения не работают.

Большинство периферийных развертываний работают на различных аппаратных архитектурах, а не на GPU. Устройства обычно используют несколько специализированных процессоров для разных задач, которые оптимизированы для эффективности и низкого энергопотребления, а не для сырой вычислительной мощности облачных GPU.

Задержка — еще одно серьезное ограничение. Периферийные системы часто работают в условиях жестких ограничений реального времени, где даже небольшие задержки могут повлиять на отзывчивость или безопасность. В таких случаях общая задержка (от входа до выхода) важнее, чем скорость вывода. Модель может быть быстрой на бумаге, но показать себя хуже после добавления постобработки и перемещения данных.

Память также играет большую роль. Многие периферийные устройства имеют ограниченную память и общие кэши. Большие промежуточные тензоры и неэффективное использование памяти могут замедлить систему, даже если сама модель эффективна.

Лимиты по питанию и нагреву создают дополнительные ограничения. Периферийные устройства часто работают без активного охлаждения и в рамках жестких бюджетов энергопотребления. Производительность должна быть эффективной и устойчивой, а не только быстрой в кратковременных всплесках.

Ко всему этому добавляется требование к согласованности. Модели должны вести себя одинаково на разных устройствах и средах выполнения. Специфический для платформы код или сложные шаги постобработки могут внести тонкие различия, которые усложняют развертывание и обслуживание систем.

Взгляд на ограничения при развертывании на периферийных устройствах

Рис. 2. Взгляд на ограничения развертывания на периферии. Изображение от автора.

Эти ограничения определяют, что на самом деле означает производительность на периферии. Иными словами, производительность определяется всем конвейером, а не одной метрикой.

Link to this sectionПочему периферийное зрение требует другой модели производительности#

Итак, как ограничения развертывания на периферии связаны с требованиями к модели компьютерного зрения, созданной для таких условий? Связь становится очевидной, когда модели переходят из исследовательских настроек в реальные системы.

В облачных средах производительность часто измеряется такими бенчмарками, как скорость вывода и точность. На периферии эти метрики рассказывают лишь часть истории. Системы зрения обычно работают на гетерогенном оборудовании, где вывод нейронной сети переносится на специализированные ускорители, в то время как другие части конвейера работают на универсальных процессорах.

В этом контексте скорости одной модели недостаточно. Ключевым является то, как вся система работает после развертывания модели. Модель может казаться быстрой сама по себе, но уступить, если постобработка, перемещение данных или специфические для платформы шаги создают дополнительные накладные расходы.

Вот почему для периферийного зрения требуется модель производительности, ориентированная на эффективность на уровне системы, а не на изолированные бенчмарки. YOLO26 отражает этот сдвиг, фокусируясь на оптимизации для периферии, упрощенном выводе и сквозном (end-to-end) исполнении, созданном для реального развертывания.

Link to this sectionОснова скорости: дизайн, ориентированный на периферию#

На периферии производительность определяется тем, насколько хорошо модель соотносится с фактической аппаратной архитектурой устройства. Проектирование с ориентацией на периферию гарантирует, что системы зрения будут надежно работать на реальных платформах, независимо от конкретного набора доступных процессоров.

Подход, ориентированный на периферию, отдает приоритет предсказуемому и эффективному исполнению на гетерогенном оборудовании, а не адаптации моделей, оптимизированных под облачные GPU «постфактум». Проще говоря, это означает предпочтение операциям, которые хорошо переводятся на ускорители нейронных сетей, минимизацию не-нейронной работы вне модели и снижение ненужной сложности, которая может замедлить сквозное исполнение.

YOLO26 была разработана с учетом этих ограничений. Ее архитектура фокусируется на стабильной производительности, а не на пиковой пропускной способности в идеальных условиях. Упрощая пути выполнения и исключая лишние вычисления, YOLO26 снижает накладные расходы во всем конвейере вывода и лучше использует доступное ускорение и иерархию памяти устройства.

Этот подход также повышает надежность. Оптимизация для периферии ведет к более предсказуемому таймингу и меньшему количеству скачков производительности, что критично для систем реального времени. Вместо того чтобы полагаться на специализированное оборудование или тяжелую постобработку для достижения скорости, YOLO26 делает акцент на эффективности во всем конвейере вывода.

Link to this sectionСквозной вывод и цена постобработки#

Возможно, тебе интересно, что значит «исключить ненужные этапы постобработки». Чтобы понять это, давай сделаем шаг назад и посмотрим, как работают традиционные системы обнаружения объектов.

Во многих конвейерах обнаружения объектов вывод не заканчивается, когда модель выдает свои предсказания. Вместо этого модель выдает большое количество перекрывающихся ограничивающих рамок (bounding boxes), которые затем нужно отфильтровать и уточнить, прежде чем их можно будет использовать. Эта очистка происходит через шаги постобработки, которые запускаются вне самой модели.

Одним из самых распространенных шагов постобработки является Non-Maximum Suppression (подавление немаксимумов) или NMS. NMS сравнивает перекрывающиеся рамки и оставляет только наиболее уверенные обнаружения, удаляя дубликаты, относящиеся к одному и тому же объекту. Хотя этот подход эффективен, он вносит дополнительные вычисления после завершения вывода.

Понимание подавления немаксимумов (NMS) в детекции объектов

Рис. 3. Понимание NMS. Изображение от автора.

На периферии эта дополнительная работа имеет свою цену. Шаги постобработки, такие как NMS, плохо подходят для специализированных ускорителей, используемых для вывода нейронных сетей, которые оптимизированы для плотных нейронных вычислений, а не для операций, требующих сложного управления или интенсивного использования памяти.

В результате NMS вносит дополнительную задержку и нагрузку на память, а ее стоимость растет по мере увеличения количества обнаружений. Даже если сама модель быстрая, NMS все равно может потреблять значительную часть общего времени выполнения.

Постобработка также увеличивает сложность системы. Поскольку она находится вне модели, ее приходится реализовывать отдельно для разных сред выполнения и аппаратных целей. Это часто ведет к появлению специфического для платформы кода, несогласованному поведению на разных устройствах и более хрупким конвейерам развертывания.

Самое важное: постобработка разрушает саму идею истинной сквозной (end-to-end) производительности. Измерение скорости вывода модели не отражает того, как система ведет себя в производстве. В конечном счете важно общее время от входа до финального выхода, включая каждый шаг в конвейере.

В таких ситуациях постобработка становится скрытым узким местом на периферии. Она добавляет задержку, потребляет ресурсы CPU и усложняет развертывание, оставаясь при этом вне самой модели.

Link to this sectionКак YOLO26 удаляет NMS и почему это делает ее быстрее#

YOLO26 удаляет NMS, воздействуя на первопричину дублирующихся обнаружений, а не очищая их после вывода. Вместо того чтобы выдавать много перекрывающихся предсказаний, которые нужно фильтровать, модель обучается генерировать меньший набор уверенных финальных обнаружений напрямую.

Это стало возможным благодаря изменению того, как обнаружения изучаются во время обучения. YOLO26 поощряет более четкую связь «один к одному» между объектами и предсказаниями, уменьшая избыточность у источника. В результате дублирующиеся обнаружения разрешаются внутри самой сети, а не через внешнюю постобработку.

Удаление NMS оказывает мгновенное влияние на производительность на периферии. Поскольку NMS плохо соотносится с ускорителями нейронных сетей, ее устранение сокращает перемещение данных в памяти и позволяет избежать дорогостоящих этапов не-нейронной обработки. Это снижает сквозную задержку и делает производительность более предсказуемой, особенно на периферийных устройствах, где постобработка в противном случае могла бы занимать заметную часть общего времени выполнения.

Это также упрощает конвейер вывода. Благодаря меньшему количеству шагов вне модели, происходит меньше перемещений данных и меньше переключений между компонентами. Вывод модели — это уже финальный результат, что делает выполнение более предсказуемым.

Link to this sectionУдаление DFL для обеспечения истинной сквозной производительности#

Еще одно новшество в YOLO26 — удаление Distribution Focal Loss (DFL), которая использовалась в ранних моделях YOLO для регрессии ограничивающих рамок. Вместо того чтобы предсказывать одну координату напрямую, модели с DFL изучали распределение возможных значений, а затем вычисляли итоговую рамку из этого распределения. Этот подход помогал улучшить точность локализации и был важным шагом вперед в предыдущих поколениях.

Однако со временем DFL привнесла и свои недостатки. Предсказание распределений увеличивает вычислительную нагрузку и добавляет сложности архитектуре модели, что может замедлить вывод на CPU и затруднить экспорт моделей в различные форматы развертывания. DFL также накладывала фиксированные диапазоны регрессии, что могло ограничивать гибкость при обнаружении очень крупных объектов.

YOLO26 удаляет DFL как часть перехода к более простому сквозному дизайну. Регрессия ограничивающих рамок была переработана, чтобы стать более прямой, сокращая ненужные вычисления при сохранении точности. Это изменение гармонирует с подходом YOLO26 без использования NMS.

Link to this sectionОткуда берутся 43% ускорения вывода на CPU#

В бенчмарках на базе CPU модель YOLO26 демонстрирует явное улучшение производительности по сравнению с ранними моделями YOLO. По сравнению с Ultralytics YOLO11, модель YOLO26 nano обеспечивает до 43% более быстрый вывод на CPU — разница, которая имеет значительное влияние в реальных периферийных развертываниях.

Бенчмаркинг скорости инференса YOLO26 на CPU

Рис. 4. Бенчмаркинг скорости YOLO26 на CPU.

Этот прирост достигается за счет упрощения всего конвейера вывода, а не оптимизации отдельного компонента. Сквозное исполнение исключает накладные расходы на постобработку, более прямой метод регрессии ограничивающих рамок сокращает вычисления, а выбор в пользу дизайна, ориентированного на CPU, улучшает эффективность выполнения на универсальных процессорах.

В совокупности эти изменения снижают задержку, уменьшают нагрузку на CPU и приводят к более быстрой и стабильной производительности на реальном периферийном оборудовании.

Link to this sectionВлияние YOLO26 на развертывание на периферии и экспорт#

Преимущества производительности YOLO26 выходят за рамки просто более быстрого вывода. Благодаря упрощению модели и снижению нагрузки на память, ее становится проще развертывать, и она надежнее работает в периферийных средах.

Сквозной дизайн YOLO26 также упрощает экспорт. С меньшим количеством вспомогательных компонентов и отсутствием этапов внешней постобработки, экспортированные модели полностью автономны. Это снижает специфические для платформы зависимости и помогает обеспечить согласованное поведение между средами выполнения и аппаратными целями.

На практике это означает, что YOLO26 можно проще развертывать на периферийных устройствах, таких как камеры, роботы и встроенные системы, используя различные форматы экспорта. То, что ты экспортируешь, — это то, что ты запускаешь, с меньшим количеством шагов интеграции и меньшим риском «дрейфа» при развертывании.

Link to this sectionБолее быстрый периферийный вывод открывает возможности для робототехники и промышленного зрения AI#

Мы рассмотрели, как дизайн YOLO26, ориентированный на периферию, улучшает производительность на уровне системы. Однако реальное влияние заключается в том, как это облегчает интеграцию зрения AI в реальные приложения.

Например, в робототехнике и промышленных средах системы зрения часто работают в условиях жестких ограничений реального времени. Решения должны приниматься быстро и стабильно, используя ограниченные вычислительные ресурсы и без опоры на облачное соединение. С Ultralytics YOLO26 выполнение этих требований становится практичным.

Приложения, такие как навигация роботов и манипуляция объектами, выигрывают от меньшей задержки и более предсказуемого вывода, позволяя роботам плавно реагировать на изменения в окружающей среде. Точно так же в промышленных условиях модели зрения могут работать прямо на производственных линиях для обнаружения дефектов, отслеживания компонентов и мониторинга процессов без внесения задержек или дополнительной сложности.

Обеспечивая быстрый и надежный вывод на периферийном оборудовании, YOLO26 помогает сделать зрение AI естественной частью робототехники и промышленных систем, а не сложной задачей для развертывания и обслуживания.

Link to this sectionОсновные выводы#

YOLO26 была создана для периферии, где реальные ограничения, такие как задержка, память и надежность, определяют возможности. Проектируя модель вокруг исполнения с приоритетом CPU, сквозного вывода и простого развертывания, YOLO26 делает интеграцию зрения AI в реальные системы практичной. Этот ориентированный на периферию подход открывает широкий спектр приложений, от робототехники и промышленного зрения до встроенного и локального AI, где производительность и предсказуемость имеют наибольшее значение.

Присоединяйся к нашему растущему сообществу и изучай наш репозиторий на GitHub для получения практических ресурсов по AI. Чтобы начать разработку с AI зрения уже сегодня, ознакомься с нашими вариантами лицензирования. Узнай, как AI в сельском хозяйстве преобразует фермерство и как зрение AI в здравоохранении формирует будущее, посетив наши страницы решений.

Explore solutions

Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше

Давай строить будущее ИИ вместе!

Начни свой путь в будущее машинного обучения