Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас

Встречайте Ultralytics YOLO26: более совершенная, быстрая и компактная модель YOLO

Ознакомьтесь с новейшей моделью Ultralytics YOLO , Ultralytics YOLO26, и ее передовыми функциями, обеспечивающими оптимальный баланс скорости, точности и удобства развертывания.

25 сентября на ежегодном гибридном мероприятии YOLO Vision 2025 (YV25) в Лондоне Гленн Джочер, наш основатель и генеральный директор, официально объявил о последнем прорыве в серии моделей Ultralytics YOLO - Ultralytics YOLO26! Наша новая модель компьютерного зрения, YOLO26, может анализировать и интерпретировать изображения и видео с помощью оптимизированной архитектуры, которая обеспечивает баланс между скоростью, точностью и простотой развертывания. 

В Ultralytics YOLO26 упрощены некоторые аспекты дизайна модели и добавлены новые усовершенствования, но при этом она продолжает предлагать привычные функции, которые пользователи ожидают от моделей Ultralytics YOLO . Например, Ultralytics YOLO26 проста в использовании, поддерживает ряд задач компьютерного зрения и обеспечивает гибкие возможности интеграции и развертывания. 

Нет необходимости говорить о том, что переход на использование Ultralytics YOLO26 не требует особых усилий, и мы с нетерпением ждем, когда пользователи смогут сами оценить его возможности, когда он станет общедоступным в конце октября. 

Рис. 1. Пример использования YOLO26 для detect объектов на изображении.

Проще говоря, Ultralytics YOLO26 - это более совершенная, быстрая и компактная модель Vision AI. В этой статье мы рассмотрим ключевые особенности Ultralytics YOLO26 и то, что она дает. Давайте начнем! 

Расширяя границы Vision AI с помощью Ultralytics YOLO26

Прежде чем мы погрузимся в ключевые особенности Ultralytics YOLO26 и приложения, которые он позволяет использовать, давайте сделаем шаг назад и обсудим вдохновение и мотивацию, которые лежали в основе разработки этой модели.

В компании Ultralytics мы всегда верили в силу инноваций. С самого начала наша миссия была двойной. С одной стороны, мы хотим сделать искусственный интеллект Vision AI доступным, чтобы каждый мог использовать его без барьеров. С другой стороны, мы в равной степени стремимся поддерживать его на передовом уровне, расширяя границы возможностей моделей компьютерного зрения.

Ключевым фактором, лежащим в основе этой миссии, является то, что пространство AI постоянно развивается. Например, edge AI, который включает в себя запуск моделей AI непосредственно на устройствах, а не полагаться на облако, быстро внедряется в различных отраслях.

От умных камер до автономных систем — теперь ожидается, что устройства на периферии будут обрабатывать информацию в режиме реального времени. Этот сдвиг требует более легких и быстрых моделей, которые при этом обеспечивают тот же высокий уровень точности.

Именно поэтому нам постоянно приходится совершенствовать модели Ultralytics YOLO . По словам Глена Джочера, "одна из самых сложных задач заключалась в том, чтобы пользователи могли получить максимум от YOLO26, сохраняя при этом высочайшую производительность".

Обзор Ultralytics YOLO26

YOLO26 поставляется в пяти различных вариантах моделей, что позволяет использовать его возможности в приложениях любого масштаба.
Все эти варианты моделей поддерживают множество задач компьютерного зрения, как и предыдущие модели Ultralytics YOLO . Это означает, что независимо от выбранного размера, вы можете положиться на YOLO26 в плане предоставления широкого спектра возможностей, как и в случае с Ultralytics YOLO11.

Вот обзор задач компьютерного зрения, поддерживаемых YOLO26:

  • Обнаружение объектов: YOLO26 может определять и находить множество объектов в кадре изображения или видео.
  • ‍Сегментация объектов: Выходя за рамки обнаружения, YOLO26 может генерировать границы с точностью до пикселя вокруг каждого идентифицированного объекта. 
  • ‍Классификация изображений: Модель может анализировать все изображение и относить его к определенной категории или метке.‍
  • Оценка позы: YOLO26 может detect ключевые точки и оценивать позы людей и других объектов.‍
  • Ориентированные ограничительные рамки (OBB): Модель может detect объекты под любым углом, что особенно полезно при съемке с воздуха, беспилотников и спутников, когда такие объекты, как здания, автомобили или сельскохозяйственные культуры, могут быть не совмещены с кадром изображения.‍
  • Отслеживание объектов: YOLO26 можно использовать для track объектов в видеокадрах или потоках реального времени.
Рис. 2. Обнаружение объектов на изображении с использованием YOLO26.

Обзор архитектуры YOLO26

Теперь, когда у нас есть лучшее понимание того, на что способен YOLO26, давайте рассмотрим некоторые инновации в его архитектуре.

Конструкция модели была оптимизирована путем удаления модуля Distribution Focal Loss (DFL), который ранее замедлял вывод и ограничивал регрессию ограничивающей рамки. 

Процесс прогнозирования также был упрощен благодаря опции сквозного вывода (E2E), которая позволяет модели пропустить традиционный этап немаксимального подавленияNMS). Это усовершенствование снижает сложность и позволяет модели быстрее получать результаты, что упрощает ее применение в реальных приложениях.

Другие улучшения делают модель более интеллектуальной и надежной. Progressive Loss Balancing (ProgLoss) помогает стабилизировать обучение и повысить точность, а Small-Target-Aware Label Assignment (STAL) обеспечивает более эффективное обнаружение мелких объектов. Кроме того, новый оптимизатор MuSGD улучшает сходимость обучения и повышает общую производительность.

Фактически, самая маленькая версия YOLO26, модель nano, теперь работает до 43% быстрее на стандартных процессорах, что делает ее особенно подходящей для мобильных приложений, интеллектуальных камер и других периферийных устройств, где скорость и эффективность имеют решающее значение.

Вот краткий обзор функций YOLO26 и того, чего могут ожидать пользователи:

  • Удаление DFL: Мы удалили модуль Distribution Focal Loss из архитектуры модели. Независимо от размеров объектов на изображении, YOLO26 может размещать индивидуальные ограничительные рамки, работая при этом более эффективно.
  • Сплошной вывод NMS: В YOLO26 добавлен дополнительный режим, в котором не требуется Non-Maximum Suppression (NMS), шаг, обычно используемый для удаления дублирующихся предсказаний, что упрощает и ускоряет развертывание для использования в реальном времени.
  • ProgLoss и STAL: эти улучшения делают обучение более стабильным и значительно повышают точность, особенно при обнаружении мелких объектов в сложных сценах.
  • Оптимизатор MuSGD: В YOLO26 используется новый оптимизатор, который сочетает в себе сильные стороны двух обучающих оптимизаторов (Muon и SGD), помогая модели обучаться быстрее и достигать более высокой точности.
Рис. 3. Бенчмаркинг YOLO26.

Упрощение развертывания с помощью Ultralytics YOLO26 

Независимо от того, работаете ли вы над мобильными приложениями, интеллектуальными камерами или корпоративными системами, развертывание YOLO26 является простым и гибким. ПакетUltralytics Python поддерживает постоянно растущее число форматов экспорта, что облегчает интеграцию YOLO26 в существующие рабочие процессы и делает его совместимым практически с любой платформой. 

Среди вариантов экспорта - TensorRT для максимального ускорения GPU , ONNX для широкой совместимости, CoreML для родных приложений iOS , TFLite для Android и edge-устройств, а также OpenVINO для оптимизации производительности на оборудовании Intel . Благодаря такой гибкости YOLO26 можно легко и без лишних хлопот перевести с разработки на производство.

Еще один важный аспект развертывания — обеспечение эффективной работы моделей на устройствах с ограниченными ресурсами. Здесь на помощь приходит квантование. Благодаря своей упрощенной архитектуре, YOLO26 отлично справляется с этой задачей. Она поддерживает развертывание INT8 (использование 8-битного сжатия для уменьшения размера и повышения скорости с минимальной потерей точности), а также половинную точность (FP16) для более быстрого вывода на поддерживаемом оборудовании. 

Самое главное, YOLO26 обеспечивает стабильную производительность на всех этих уровнях квантования, поэтому вы можете положиться на него, независимо от того, работает ли он на мощном сервере или на компактном периферийном устройстве.

От робототехники до производства: примеры использования YOLO26 

YOLO26 можно использовать в широком спектре приложений компьютерного зрения в различных отраслях и вариантах использования. От робототехники до производства, это может оказать значительное влияние за счет улучшения рабочих процессов и обеспечения более быстрого и точного принятия решений.

Например, хорошим примером является робототехника, где YOLO26 может помочь роботам интерпретировать свое окружение в режиме реального времени. Это делает навигацию более плавной, а управление объектами — более точным. Это также обеспечивает более безопасное сотрудничество с людьми.

Другой пример — производство, где модель может использоваться для обнаружения дефектов. Она может автоматически выявлять дефекты на производственных линиях быстрее и точнее, чем при ручном контроле.

Рис. 4. Обнаружение бутылок на производственной фабрике с использованием YOLO26.

В целом, поскольку YOLO26 лучше, быстрее и легче, она легко адаптируется к широкому спектру сред, от легких периферийных устройств до крупных корпоративных систем. Это делает ее практичным выбором для отраслей, стремящихся повысить эффективность, точность и надежность.

Основные выводы 

Ultralytics YOLO26 - это модель компьютерного зрения, которая стала лучше, быстрее и легче, при этом оставаясь простой в использовании и сохраняя высокую производительность. Она работает в широком диапазоне задач и платформ и будет доступна всем желающим к концу октября. Нам не терпится увидеть, как сообщество использует ее для создания новых решений и расширения границ компьютерного зрения.

Присоединяйтесь к нашему растущему сообществу! Изучите наш репозиторий GitHub, чтобы узнать больше об ИИ. Откройте для себя такие инновации, как компьютерное зрение в розничной торговле и ИИ в автомобильной промышленности, посетив страницы с нашими решениями. Чтобы начать создавать решения на основе компьютерного зрения уже сегодня, ознакомьтесь с нашими вариантами лицензирования.

Давайте строить будущее
ИИ вместе!

Начните свой путь в будущее машинного обучения

Начать бесплатно