Встречай YOLO26: ИИ компьютерного зрения нового поколения.
Ultralytics
Ultralytics YOLO

Ultralytics YOLO26 против других моделей Ultralytics YOLO для оценки поз

Узнай, как Ultralytics YOLO26 улучшает оценку поз благодаря поддержке нечеловеческих ключевых точек, более быстрой сходимости, улучшенной обработке перекрытий и эффективному развертыванию в реальном времени.

АБАбирами Вина
4 min read
Сравнение Ultralytics YOLO26 с другими моделями YOLO для оценки поз

Когда ты смотришь на чью-то осанку, легко заметить, сутулится ли человек, наклоняется вперед или стоит прямо. Люди могут быстро понять, как различные части тела соотносятся друг с другом.

Это неотъемлемая часть того, как мы интерпретируем движение и язык тела в повседневной жизни. Однако для машин такое визуальное понимание не является автоматическим. Обучение системы распознаванию движений и структуры требует передовых методов глубокого обучения и computer vision, которые позволяют интерпретировать изображения осмысленным образом.

В частности, pose estimation — это технология компьютерного зрения, которая позволяет модели создать аналогичное понимание. Вместо простого обнаружения объекта на изображении модель предсказывает ключевые точки, представляющие важные структурные ориентиры.

Эти ключевые точки могут соответствовать суставам тела, конечностям животных, компонентам механизмов или даже фиксированным точкам, таким как углы корта. Идентифицируя и отслеживая эти точки, система может понимать положение, выравнивание и движение в структурированном и измеримом виде.

По мере применения оценки позы в реальных сценариях моделям приходится более эффективно работать с нечеловеческими ключевыми точками, сложными сценами и пользовательскими наборами данных. Например, современные модели, такие как Ultralytics YOLO26, поддерживают задачи компьютерного зрения, такие как оценка позы, и развивают предыдущие модели YOLO pose, предлагая архитектурные и обучающие улучшения для повышения гибкости и общей производительности.

Пример оценки позы, реализованной с помощью YOLO

Рис. 1. Пример оценки позы, реализованной с помощью YOLO (Source)

В этой статье мы сравним YOLO26-pose с предыдущими моделями Ultralytics YOLO pose и разберем, как она повышает гибкость, скорость сходимости и производительность в сложных сценах. Давай начнем!

Link to this sectionЧто такое оценка позы?#

Прежде чем мы углубимся в сравнение моделей Ultralytics YOLO pose, давай внимательнее рассмотрим, что на самом деле означает оценка позы в контексте компьютерного зрения.

Оценка позы — это метод, используемый для обнаружения и отслеживания определенных ключевых точек на изображении или кадре видео. Эти ключевые точки могут представлять собой важные структурные ориентиры, такие как суставы человеческого тела, конечности животного, компоненты машины или фиксированные опорные точки в сцене.

Оценка позы рабочих с использованием оценки позы человека

Рис. 2. Оценка позы рабочих с использованием оценки позы человека (Source)

Идентифицируя координаты этих точек, модель может понять, как расположен объект и как он перемещается с течением времени. В отличие от классификации изображений, которая присваивает одну метку всему изображению, или моделей обнаружения объектов, фокусирующихся на рисовании bbox вокруг объектов, оценка позы предоставляет более детальную пространственную информацию о структуре и движении.

Link to this sectionОбзор YOLO26-pose#

YOLO26-pose доступна в нескольких вариантах или размерах модели, включая легковесные варианты, такие как YOLO26n-pose, и более крупные модели, такие как YOLO26m-pose, YOLO26l-pose и YOLO26x-pose. Это позволяет командам выбирать правильный баланс между скоростью и точностью в зависимости от их аппаратного обеспечения и потребностей в производительности.

Ultralytics также предоставляет предобученные модели для оценки позы, обученные на больших общих наборах данных, таких как COCO, а именно на аннотациях COCO-Pose (ключевые точки COCO) для оценки позы человека, поэтому тебе не нужно начинать с нуля. В большинстве случаев команды дообучают эти модели на своем собственном наборе данных, чтобы адаптировать их к конкретным ключевым точкам, макетам или условиям.

Обычно это включает подготовку пользовательских файлов аннотаций, которые определяют координаты ключевых точек и метки классов в структурированном формате. Эти аннотации привязывают ключевые точки к конкретным координатам пикселей на каждом изображении, позволяя модели изучать точные пространственные отношения во время обучения.

Использование предобученных моделей ускоряет процесс обучения, снижает требования к данным и помогает быстрее переводить проекты в стадию продакшена.

Link to this sectionРеальное применение оценки позы человека#

Вот краткий обзор некоторых реальных случаев использования, где оценка позы играет важную роль:

  • Здравоохранение и реабилитация: Врачи могут использовать модели позы для оценки осанки, мониторинга прогресса восстановления и анализа паттернов движения во время физиотерапии.
  • Автономные системы: Дроны и умные камеры могут использовать информацию о позе, чтобы лучше понимать ориентацию объектов и их движение в динамических сценах.
  • Безопасность на рабочем месте: Организации могут отслеживать положение тела и повторяющиеся движения, чтобы помочь выявить потенциальные риски для безопасности.
  • Фитнес и персональные тренировки: Фитнес-приложения используют оценку позы для отслеживания правильности выполнения упражнений, подсчета повторений и предоставления обратной связи в реальном времени о позе и движениях во время фитнес-уроков.

Отслеживание ключевых точек тела при атлетических движениях

Рис. 3. Оценка позы помогает отслеживать ключевые точки тела при атлетических движениях. (Source)

Link to this sectionИсследование поддержки оценки позы в Ultralytics YOLO26#

Ultralytics YOLO26 основывается на более ранних моделях Ultralytics YOLO, включая обновления, призванные сделать обучение и развертывание более практичными.

Как и предыдущие версии, она поддерживает оценку позы в рамках единой инфраструктуры. Основное отличие заключается в том, что YOLO26 создана для того, чтобы быть более гибкой и стабильной в более широком спектре реальных сценариев.

Бенчмаркинг производительности Ultralytics YOLO26

Рис. 4. Бенчмаркинг YOLO26 (Source)

Предыдущие модели Ultralytics YOLO pose были во многом обусловлены человеческими pose datasets, что означало, что части старых методов были оптимизированы под структуру человеческих суставов. YOLO26 снимает эти специфические предположения о человеке.

В результате она лучше подходит для нечеловеческих ключевых точек, таких как обнаружение углов теннисного корта или других пользовательских структурных ориентиров. Это важно, поскольку «из коробки» предобученные модели YOLO26-pose обучаются на наборах данных, таких как COCO-pose, и предсказывают ключевые точки человека, определенные в аннотациях набора данных.

Однако, когда команды хотят обнаруживать другие типы ориентиров, например, компоненты механизмов, разметку спортивных полей или точки инфраструктуры, модель обычно нужно дообучать на пользовательском наборе данных, где аннотированы эти конкретные ключевые точки.

Поскольку YOLO26 не связана предположениями о структуре человеческих суставов, она может более эффективно адаптироваться во время дообучения. Эта гибкость позволяет модели более надежно изучать пользовательские конфигурации ключевых точек, что приводит к улучшению показателей оценки при валидации на наборах данных с уникальными конфигурациями ключевых точек.

YOLO26-pose также разработана для улучшения локализации ключевых точек, когда части объекта частично скрыты или имеют очень маленький размер. В реальных сценах, включающих удаленные объекты, кадры с дронов или сценарии с мелкими объектами, это может привести к более точным предсказаниям ключевых точек по сравнению с более ранними моделями позы.

Еще одно важное обновление — улучшенная формулировка функции потерь, используемая во время обучения. Функция потерь определяет, как модель исправляет свои ошибки в процессе обучения.

В случае с YOLO26-pose этот процесс более эффективен, что помогает модели обучаться быстрее и достигать высокой точности за меньшее количество эпох, где эпоха — это один полный проход по обучающему набору данных.

В целом, YOLO26-pose развивает предыдущие модели Ultralytics YOLO pose, предлагая более явные улучшения в поддержке нечеловеческих ключевых точек и сходимости обучения, сохраняя при этом тот же знакомый рабочий процесс.

Link to this sectionСравнение YOLO26-pose с Ultralytics YOLOv5#

Самая ранняя версия моделей Ultralytics YOLO, Ultralytics YOLOv5, была создана в первую очередь для обнаружения объектов. Хотя YOLOv5 позже была расширена для поддержки сегментации экземпляров, она не включает нативную специализированную голову оценки позы в официальной инфраструктуре Ultralytics.

Командам, которым требовалось обнаружение ключевых точек, обычно приходилось полагаться на отдельные реализации или пользовательские модификации. Ultralytics YOLO26 включает оценку позы как встроенную задачу с выделенной архитектурной головой, разработанной специально для предсказания ключевых точек.

Это означает, что модели YOLO26-pose могут обучаться, проходить валидацию и развертываться в рамках того же унифицированного рабочего процесса, что и обнаружение и сегментация. Для проектов, ориентированных на структурированное обнаружение ключевых точек, YOLO26 предоставляет нативную поддержку позы и специфичную для задачи архитектуру, которую YOLOv5 не предлагает «из коробки».

Link to this sectionКлючевые отличия: YOLO26-pose против Ultralytics YOLOv8-pose#

Ultralytics YOLOv8 внедрила нативную оценку позы в унифицированную инфраструктуру Ultralytics, упростив обучение и развертывание моделей ключевых точек с помощью того же рабочего процесса, что и для обнаружения и сегментации. Она опирается на традиционный конвейер постобработки с подавлением немаксимумов (NMS) и использует более ранние формулировки функции потерь для регрессии bbox и обучения.

YOLO26 опирается на этот фундамент с архитектурными и обучающими обновлениями, которые напрямую влияют на оценку позы. Одно из главных отличий — сквозной (end-to-end) дизайн. YOLO26 устраняет необходимость во внешней NMS во время инференса, что упрощает развертывание и повышает стабильность задержки, особенно на CPU и периферийных устройствах.

Еще одно ключевое улучшение — методология обучения. YOLO26 внедряет оптимизатор MuSGD вместе с обновленными стратегиями функции потерь. Для задач позы она интегрирует Residual Log-Likelihood Estimation, что улучшает моделирование неопределенности ключевых точек. Вместе эти изменения могут привести к более быстрой сходимости и более стабильным предсказаниям ключевых точек, особенно в сложных или частично окклюзированных сценах.

Короче говоря, YOLOv8-pose создала надежную и универсальную базу. YOLO26-pose совершенствует эту базу за счет повышения эффективности обучения, лучшей обработки окклюзий и большей гибкости для реальных приложений, работающих не с человеческими позами.

Link to this sectionYOLO26-pose против Ultralytics YOLO11-pose: что улучшилось?#

Ultralytics YOLO11 основывается на Ultralytics YOLOv8, совершенствуя бэкенд и слои извлечения признаков. Она снизила количество FLOPs, повысила эффективность параметров и обеспечила более высокий mAP, сохраняя при этом высокую производительность в реальном времени. Для задач позы это означало лучшую точность ключевых точек при более легкой архитектуре.

YOLO26-pose продолжает эту прогрессию более фундаментальным архитектурным сдвигом. Проще говоря, YOLO11 улучшила эффективность и точность YOLOv8, а YOLO26 развивает это основание за счет архитектурных и обучающих обновлений, направленных на более быструю сходимость, более стабильный инференс и улучшенную точность позы в сложных сценариях.

Link to this sectionПочему тебе стоит начать использовать модель YOLO26 для оценки позы?#

Исследуя различия между моделями Ultralytics YOLO, ты, возможно, задаешься вопросом, стоит ли переходить на YOLO26-pose.

Короткий ответ: это простое обновление. Если ты уже используешь Ultralytics YOLOv8-pose или Ultralytics YOLO11-pose, переход на YOLO26-pose обычно означает просто смену версии модели, а не перестройку твоего конвейера.

Ты сможешь воспользоваться преимуществами улучшенной поддержки нечеловеческих ключевых точек, более быстрой сходимости во время обучения и улучшенной обработки окклюзированных точек, оставаясь при этом в рамках той же инфраструктуры Ultralytics. Для большинства новых и существующих проектов по оценке позы переход на YOLO26-pose — это простой способ получить эти улучшения с минимальными усилиями.

Кроме того, YOLO26-pose полностью поддерживается в Ultralytics Python package, который построен на PyTorch и делает обучение, валидацию и развертывание простыми. Модели можно экспортировать в форматы, такие как ONNX, TensorRT, OpenVINO, CoreML и TFLite, что упрощает развертывание на GPU, CPU и периферийных устройствах без изменения общего рабочего процесса.

Link to this sectionОсновные выводы#

Ultralytics YOLO26-pose делает оценку позы более гибкой и надежной, особенно при работе с нечеловеческими ключевыми точками или в сложных сценах. Она обучается быстрее, лучше справляется с окклюзиями и обеспечивает более последовательные результаты на разных наборах данных. Для команд, уже использующих модели Ultralytics YOLO pose, YOLO26 предлагает очевидные улучшения без изменения существующих рабочих процессов.

Хочешь узнать больше об ИИ? Загляни в наше сообщество и репозиторий GitHub. Изучи наши страницы решений, чтобы узнать об ИИ в робототехнике и компьютерном зрении в сельском хозяйстве. Ознакомься с нашими вариантами лицензирования и начни создавать решения с помощью компьютерного зрения уже сегодня!

Explore solutions

Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше

Давай строить будущее ИИ вместе!

Начни свой путь в будущее машинного обучения