Нажимая “Принять все файлы cookie”, вы соглашаетесь на сохранение файлов cookie на вашем устройстве с целью улучшения навигации по сайту, анализа использования сайта и помощи в наших маркетинговых усилиях. Подробнее
Настройки cookie
Нажимая “Принять все файлы cookie”, вы соглашаетесь на сохранение файлов cookie на вашем устройстве с целью улучшения навигации по сайту, анализа использования сайта и помощи в наших маркетинговых усилиях. Подробнее
Узнайте, как Ultralytics устанавливает новый стандарт для Vision AI с приоритетом периферийных устройств благодаря сквозному выводу NMS, более быстрой CPU и упрощенному развертыванию в производственной среде.
Сегодня Ultralytics запускает YOLO26, самую передовую и готовую к внедрению YOLO на сегодняшний день. Впервые анонсированная на YOLO 2025 (YV25), YOLO26 представляет собой фундаментальный сдвиг в подходе к обучению, внедрению и масштабированию моделей компьютерного зрения в реальных системах.
Искусственный интеллект быстро продвигается в область периферийных устройств. Все чаще изображения и видео обрабатываются непосредственно на устройствах, камерах, роботах и встроенных системах, где задержка, надежность и стоимость имеют большее значение, чем вычислительные мощности облачных сервисов. YOLO26 разработан с учетом этой реальности и обеспечивает ведущую в мире производительность, эффективно работая на процессорах, периферийных ускорителях и энергоэффективном оборудовании.
Хотя YOLO26 представляет собой значительный шаг вперед, он по-прежнему сохраняет привычный, оптимизированный Ultralytics YOLO , на который полагаются разработчики. Он легко вписывается в существующие рабочие процессы, поддерживает широкий спектр задач машинного зрения и остается простым в использовании, что упрощает его внедрение как для исследовательских, так и для производственных команд.
Рис. 1. Пример использования Ultralytics для обнаружения объектов
В этой статье мы расскажем вам все, что нужно знать об Ultralytics , а также о том, что более легкая, компактная и быстрая YOLO означает для будущего искусственного интеллекта в области зрения. Приступим!
Ultralytics устанавливает новый стандарт для искусственного интеллекта в области зрения
Ultralytics основан на идее, что мощные возможности искусственного интеллекта в области зрения должны быть доступны каждому. Мы считаем, что мощные инструменты компьютерного зрения не должны быть закрытыми или ограниченными для небольшой группы организаций.
На конференции YV25 в Лондоне наш основатель и генеральный директор Гленн Джочер поделился своими мыслями об этой концепции, сказав: «Самая удивительная технология искусственного интеллекта скрыта за закрытыми дверями. Она не является открытой. Крупные компании контролируют новые разработки, а все остальные вынуждены ждать своей очереди, чтобы получить к ним доступ. В Ultralytics у нас другое видение. Мы хотим, чтобы искусственный интеллект был доступен каждому».
Он также пояснил, что это означает перенос ИИ из облака в реальную среду, добавив: «Мы хотим, чтобы эта технология не просто висела в облаке, а была перенесена в периферийные устройства, в ваши телефоны, автомобили и системы с низким энергопотреблением. И мы хотим, чтобы эти замечательные люди, которые создают решения, имели к ним доступ».
YOLO26 отражает эту концепцию на практике: модель, разработанная для работы там, где фактически используется искусственный интеллект для распознавания изображений, а не там, где проще всего создать прототип.
Разбор Ultralytics : современная модель машинного зрения
Как и более ранниеYOLO Ultralytics YOLO , YOLO26 поддерживает несколько задач компьютерного зрения в рамках единой семьи моделей. Она доступна в пяти размерах: Nano (n), Small (s), Medium (m), Large (l) и Extra Large (x), что позволяет командам балансировать скорость, точность и размер модели в зависимости от ограничений развертывания.
Помимо гибкости, YOLO26 поднимает планку производительности. По сравнению с YOLO11, нано-модель YOLO26 обеспечивает до 43% более быстрое CPU , что делает ее одной из самых быстрых высокоточных моделей обнаружения объектов, доступных для развертывания на периферии и CPU.
Рис. 2. Ultralytics — это современная модель машинного зрения.
Классификация изображений: YOLO26 может анализировать все изображение и отнести его к определенной категории, помогая системам понять общий контекст сцены.
Обнаружение объектов: модель может находить и определять местоположение нескольких объектов на изображениях или в видео.
Сегментация экземпляров: YOLO26 может обводить отдельные объекты с детализацией на уровне пикселей.
Оценка позы: может использоваться для определения ключевых точек и оценки поз людей и других объектов.
Обнаружение ориентированных ограничительных рамок (OBB): YOLO26 может detect под разными углами, что особенно полезно для аэро- и спутниковых снимков.
Отслеживание объектов: в сочетании с Python Ultralytics Python , YOLO26 может использоваться для отслеживания объектов в видеокадрах и прямых трансляциях.
Все задачи поддерживают обучение, валидацию, вывод и экспорт в рамках единой структуры.
Ключевые инновации, лежащие в основе Ultralytics
Ultralytics представляет несколько основных инноваций, которые улучшают скорость вывода, стабильность обучения и простоту развертывания. Вот обзор этих инноваций:
Удаление Distribution Focal Loss (DFL): модуль DFL был удален, чтобы упростить прогнозирование граничных рамок, улучшить совместимость оборудования и упростить экспорт и запуск моделей на периферийных и маломощных устройствах.
Сквозное выведение NMS: YOLO26 разработан как нативная сквозная модель, которая напрямую выдает окончательные прогнозы, устраняя необходимость в подавлении не максимальных значений и сокращая задержку вывода и сложность развертывания.
Прогрессивное уравновешивание потерь + STAL: эти усовершенствованные стратегии устранения потерь стабилизируют обучение и повышают точность обнаружения, особенно для небольших,detect .
Оптимизатор MuSGD: YOLO26 использует новый гибридный оптимизатор, который сочетает SGD методами оптимизации, вдохновленными мюонами, для более стабильного обучения.
Ускорение CPU до 43%: специально оптимизированная для пограничных вычислений, YOLO26 обеспечивает ускорение CPU до 43%, что позволяет достичь производительности в реальном времени на пограничных устройствах.
Далее давайте подробно рассмотрим эти функции нового поколения, которые делают YOLO26 более быстрым, эффективным и простым в развертывании.
Упрощение прогнозирования за счет удаления фокальной потери распределения
Ранее YOLO использовали Distribution Focal Loss (DFL) во время обучения для повышения точности ограничивающей рамки. Несмотря на свою эффективность, DFL вносил дополнительную сложность и накладывал фиксированные ограничения регрессии, что затрудняло экспорт и развертывание, особенно на периферийном и маломощном оборудовании.
YOLO26 полностью устраняет DFL. Устранение DFL устраняет ограничения регрессии фиксированной ограничительной рамки, присутствующие в более ранних моделях, повышая надежность и точность при обнаружении очень больших объектов.
Благодаря упрощению процесса прогнозирования граничной рамки YOLO26 стало проще экспортировать и более надежно работает на широком спектре периферийных устройств и устройств с низким энергопотреблением.
Сквозное выведение NMS с Ultralytics
Традиционные конвейеры обнаружения объектов используют метод подавления не максимальных значений (NMS) в качестве этапа постобработки для фильтрации перекрывающихся прогнозов. Несмотря на свою эффективность, NMS задержку, сложность и уязвимость, особенно при развертывании моделей на нескольких средах выполнения и аппаратных целях.
YOLO26 представляет собственный режим сквозного вывода, в котором модель напрямую выдает окончательные прогнозы без необходимости использования NMS отдельного этапа постобработки. Дублирующиеся прогнозы обрабатываются внутри самой сети.
Устранение NMS задержки, упрощает процессы развертывания и снижает риск ошибок интеграции, что делает YOLO26 особенно подходящим для развертывания в режиме реального времени и на периферии.
Улучшение распознавания с помощью прогрессивного балансирования потерь + STAL
Важной особенностью, связанной с обучением, является внедрение функций Progressive Loss Balancing (ProgLoss) и Small-Target-Aware Label Assignment (STAL). Эти усовершенствованные функции потери помогают стабилизировать обучение и повысить точность обнаружения.
ProgLoss помогает модели учиться более последовательно во время обучения, снижая нестабильность и позволяя ей сходиться более плавно. Между тем, STAL фокусируется на улучшении способности модели учиться на небольших объектах, которые часто сложнее detect ограниченной визуальной детализации.
Вместе ProgLoss и STAL обеспечивают более надежное обнаружение с заметным улучшением распознавания мелких объектов. Это особенно важно для передовых приложений, таких как Интернет вещей (IoT), робототехника и аэрофотосъемка, где объекты часто бывают мелкими, удаленными или частично видимыми.
Более стабильное обучение с оптимизатором MuSGD
В YOLO26 мы использовали новый оптимизатор под названием MuSGD, разработанный для обеспечения более стабильного и эффективного обучения. MuSGD — это гибридный подход, сочетающий в себе преимущества традиционного стохастического градиентного спуска (SGD) и методов, вдохновленных Muon, оптимизатором, используемым при обучении больших языковых моделей (LLM).
SGD долгое время SGD надежным выбором в области компьютерного зрения благодаря своей простоте и сильной обобщаемости. В то же время, недавние достижения в области обучения LLM показали, что новые методы оптимизации могут улучшить стабильность и скорость при тщательном применении. MuSGD привносит некоторые из этих идей в область компьютерного зрения.
Вдохновленный Kimi K2 от Moonshot AI, MuSGD включает в себя стратегии оптимизации, которые помогают модели более плавно сходиться во время обучения. Это позволяет YOLO26 быстрее достигать высокой производительности, одновременно снижая нестабильность обучения, особенно в более крупных или сложных конфигурациях обучения.
MuSGD помогает YOLO26 обучаться более предсказуемо для моделей разных размеров, способствуя как повышению производительности, так и стабильности обучения.
Ultralytics обеспечивает до 43% более быстрое CPU
По мере того как искусственный интеллект в области машинного зрения продолжает приближаться к месту генерации данных, все большее значение приобретает высокая производительность пограничных вычислений. Специально оптимизированная для пограничных вычислений, YOLO26 обеспечивает до 43% более быстрое CPU , гарантируя производительность в реальном времени на устройствах без графических процессоров. Это улучшение позволяет отзывчивым и надежным системам машинного зрения работать непосредственно на камерах, роботах и встроенном оборудовании, где возможности определяются задержками, эффективностью и ограничениями по стоимости.
Улучшенные задачи компьютерного зрения, поддерживаемые Ultralytics
Помимо архитектурных улучшений, которые повышают точность обнаружения объектов, YOLO26 также включает в себя оптимизации для конкретных задач, предназначенные для повышения производительности при выполнении задач компьютерного зрения. Например, он улучшает сегментацию экземпляров, оценку позы и обнаружение ориентированных ограничительных рамок с помощью целевых обновлений, которые повышают точность и надежность.
Вот обзор этих оптимизаций:
Сегментация экземпляров: YOLO26 использует потерю семантической сегментации для улучшения обучения модели во время тренировки, что приводит к более точным и согласованным маскам экземпляров. Обновленный модуль proto также позволяет использовать информацию из нескольких масштабов, благодаря чему модель более эффективно обрабатывает объекты разных размеров, даже в сложных сценах.
Оценка позы: благодаря интеграции метода оценки остаточной логарифмической вероятности (RLE), который моделирует неопределенность в прогнозировании ключевых точек, и улучшению процесса декодирования, YOLO26 обеспечивает более точные ключевые точки с лучшей производительностью в режиме реального времени.
Ориентированное обнаружение ограничивающей рамки: YOLO26 вводит специальную угловую потерю, которая помогает модели более точно учиться распознавать поворот объектов, особенно для объектов квадратной формы, где ориентация может быть неоднозначной. Оптимизированное декодирование OBB также уменьшает резкие скачки в прогнозах углов вблизи границ поворота, что приводит к более стабильным и последовательным оценкам ориентации.
Рис. 3. Использование Ultralytics для сегментации экземпляров.
Ultralytics : сегментация с открытым словарем, построенная на YOLO26
Ultralytics также Ultralytics YOLOE-26, новую семью моделей сегментации с открытым словарем, построенных на архитектуре YOLO26 и инновациях в области обучения.
YOLOE-26 — это не новая задача или функция, а специализированная серия моделей, которая повторно использует существующую задачу сегментации, одновременно обеспечивая возможность использования текстовых подсказок, визуальных подсказок и вывода без подсказок. Доступная во всех стандартных YOLO , YOLOE-26 обеспечивает более высокую точность и более надежную производительность в реальных условиях, чем предыдущие модели сегментации с открытым словарем.
Ultralytics разработан для тех случаев, когда Vision AI действительно работает.
От камер с функцией распознавания изображений до роботов, работающих на основе компьютерного зрения и крошечных процессоров на периферии, компьютерное зрение и искусственный интеллект внедряются непосредственно в устройства для вывода результатов в режиме реального времени. Ultralytics создан специально для таких сред, где важны низкая задержка, эффективность и надежная работа.
На практике это означает, что YOLO26 можно легко развернуть на широком спектре оборудования. В частности, с помощьюPython Ultralytics Python и его широких возможностей интеграции модели можно экспортировать в форматы, оптимизированные для различных платформ и аппаратных ускорителей.
Например, экспорт в TensorRT высокопроизводительное вычисление на NVIDIA , CoreML нативное развертывание на устройствах Apple, а OpenVINO производительность на Intel . YOLO26 также можно экспортировать для запуска на нескольких специализированных ускорителях, что обеспечивает высокопроизводительное и энергоэффективное вычисление на специализированном оборудовании Edge AI.
Это лишь несколько примеров, на самом деле существует гораздо больше интеграций, поддерживаемых в периферийных и производственных средах. Такая гибкость позволяет одной модели YOLO26 работать на различных целевых платформах. Это оптимизирует производственные рабочие процессы и приближает Vision AI к периферии.
Переосмысление сценариев использования компьютерного зрения в различных отраслях
Разработанный для реального внедрения, YOLO26 может использоваться в широком спектре задач компьютерного зрения в различных отраслях. Вот несколько примеров его применения:
Робототехника: YOLO26 может использоваться для таких задач, как навигация, обнаружение препятствий и взаимодействие с объектами. Эти возможности обеспечивают безопасную и эффективную работу роботов в динамичных средах.
Производство: на производственных линиях YOLO26 может анализировать изображения и видео для выявления дефектов, отсутствующих компонентов или проблем в процессе. Обработка данных на устройстве обеспечивает быстрое обнаружение и снижает зависимость от облачных систем.
Применение в авиации и дронах: при установке на дронах YOLO26 может обрабатывать аэрофотоснимки во время полета для целей инспекции, картографирования и съемки. Это позволяет анализировать сцены в режиме реального времени даже в удаленных местах.
Встроенные системы и системы IoT: благодаря своей легкой конструкции YOLO26 может работать на встроенном оборудовании с низким энергопотреблением для локальной обработки визуальных данных. Типичные варианты использования включают интеллектуальные камеры, подключенные датчики и автоматические устройства мониторинга.
Умные города: в городской среде YOLO26 может анализировать видеопотоки с камер дорожного движения и общественных мест. Это позволяет использовать такие приложения, как мониторинг дорожного движения, обеспечение общественной безопасности и управление инфраструктурой на периферии.
Рис. 4. YOLO26 может использоваться для различных приложений компьютерного зрения.
Начало работы с Ultralytics
Ultralytics можно использовать в двух взаимодополняющих рабочих процессах, в зависимости от того, как вы создаете и внедряете искусственный интеллект для обработки изображений.
Вариант 1: Использование Ultralytics через Ultralytics (рекомендуется)
Ultralytics предоставляет централизованный способ обучения, развертывания и мониторинга моделей YOLO26 в производственной среде. Она объединяет наборы данных, эксперименты и развертывания в одном месте, упрощая управление рабочими процессами искусственного интеллекта в области зрения в больших масштабах, особенно для команд, развертывающих решения в периферийных и производственных средах.
С помощью Платформы пользователи могут:
Доступ к моделям YOLO26
Обучение и настройка на пользовательских наборах данных
Экспорт моделей для развертывания на периферии и в производственной среде
Мониторинг экспериментов и развернутых моделей в едином рабочем процессе
Вариант 2: Использование Ultralytics через рабочие процессы с открытым исходным кодом
YOLO26 остается полностью доступным через экосистему открытого исходного кода Ultralyticsи может использоваться с существующими рабочими процессами Python для обучения, вывода и экспорта.
Разработчики могут установить Ultralytics , загрузить предварительно обученные модели YOLO26 и развернуть их с помощью привычных инструментов и форматов, таких как ONNX, TensorRT, CoreML или OpenVINO.
pip install ultralytics
from ultralytics import YOLO
# Load a COCO-pretrained YOLO26n model
model = YOLO("yolo26n.pt")
# Run inference with the YOLO26n model on the 'bus.jpg' image
results = model("path/to/bus.jpg")
Для пользователей, которые предпочитают ручное управление или настраиваемые конвейеры, в Ultralytics доступны полные инструкции и руководства.
Ultralytics : создан для будущего компьютерного зрения
Ultralytics разработан для удовлетворения потребностей будущих решений в области искусственного интеллекта для машинного зрения, где модели должны быть быстрыми, эффективными и простыми в развертывании на реальном оборудовании. Благодаря повышению производительности, упрощению развертывания и расширению возможностей модели, YOLO26 естественным образом вписывается в широкий спектр реальных приложений. YOLO26 устанавливает новый стандарт в области создания, развертывания и масштабирования искусственного интеллекта для машинного зрения. Мы с нетерпением ждем, чтобы увидеть, как сообщество будет использовать его для создания реальных систем компьютерного зрения.