Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас

Ultralytics по сравнению с другимиYOLO Ultralytics YOLO для оценки позы

Узнайте, как Ultralytics улучшает оценку позы благодаря более качественной поддержке нечеловеческих ключевых точек, более быстрой конвергенции, улучшенной обработке окклюзии и эффективному развертыванию в режиме реального времени.

Масштабируйте свои проекты в области компьютерного зрения с Ultralytics

Связаться с нами

Когда вы смотрите на осанку человека, легко заметить, сутулится он, наклоняется вперед или стоит прямо. Люди могут быстро понять, как различные части тела соотносятся друг с другом. 

Это неотъемлемая часть того, как мы интерпретируем движения и язык тела в повседневной жизни. Однако для машин такое визуальное понимание не является автоматическим. Обучение системы распознаванию движений и структур требует передовых технологий глубокого обучения и компьютерного зрения, которые позволяют ей интерпретировать изображения осмысленным образом.

В частности, оценка позы — это метод искусственного интеллекта в области зрения, который позволяет модели компьютерного зрения построить аналогичное понимание. Вместо простого обнаружения объекта на изображении, модель предсказывает ключевые точки, которые представляют важные структурные ориентиры. 

Эти ключевые точки могут соответствовать суставам тела, конечностям животных, компонентам механизмов или даже фиксированным точкам, таким как углы корта. Определяя и отслеживая эти точки, система может понимать положение, выравнивание и движение структурированным и измеримым образом.

Поскольку оценка позы применяется в более реальных сценариях, модели должны более эффективно обрабатывать нечеловеческие ключевые точки, сложные сцены и настраиваемые наборы данных. Например, современные модели, такие как Ultralytics , поддерживают задачи компьютерного зрения, такие как оценка позы, и основываются на более ранних YOLO с усовершенствованиями архитектуры и обучения, предназначенными для повышения гибкости и общей производительности.

Рис. 1. Пример оценки позы с помощью YOLO Источник)

В этой статье мы сравним YOLO26-pose с предыдущими моделями Ultralytics YOLO и рассмотрим, как она улучшает гибкость, скорость сходимости и производительность в сложных сценах. Приступим!

Что такое оценка позы?

Прежде чем приступить к сравнению Ultralytics YOLO , давайте более подробно рассмотрим, что на самом деле означает оценка позы в контексте компьютерного зрения.

Оценка позы — это метод, используемый для detect track ключевых точек в изображении или кадре видео. Эти ключевые точки могут представлять важные структурные ориентиры, такие как суставы человеческого тела, конечности животного, компоненты машины или фиксированные ориентиры в сцене. 

Рис. 2. Оценка позы работников с помощью оценки позы человека (Источник)

Определяя координаты этих точек, модель может понять, как объект расположен и как он движется во времени. В отличие от классификации изображений, которая присваивает одну метку всему изображению, или моделей обнаружения объектов, которые сосредоточены на рисовании ограничительных рамок вокруг объектов, оценка положения предоставляет более подробную пространственную информацию о структуре и движении.

Обзор YOLO26-pose

YOLO26-pose доступен в нескольких вариантах моделей или размерах, включая легкие варианты, такие как YOLO26n-pose, и более крупные модели, такие как YOLO26m-pose, YOLO26l-pose и YOLO26x-pose. Это позволяет командам выбирать оптимальный баланс между скоростью и точностью в зависимости от их аппаратного обеспечения и требований к производительности.

Ultralytics предоставляет предварительно обученные модели поз, обученные на больших общих наборах данных, таких как COCO , в частности, аннотации COCO(COCO ) для оценки поз человека, поэтому вам не нужно начинать с нуля. В большинстве случаев команды настраивают эти модели на своем собственном наборе данных, чтобы адаптировать их к конкретным ключевым точкам, макетам или средам. 

Обычно это включает в себя подготовку настраиваемых файлов аннотаций, которые определяют координаты ключевых точек и метки классов в структурированном формате. Эти аннотации сопоставляют ключевые точки с конкретными координатами пикселей в каждом изображении, позволяя модели обучаться точным пространственным отношениям во время обучения.

Использование предварительно обученных моделей ускоряет обучение, снижает требования к данным и помогает более эффективно переводить проекты в производство. 

Реальные применения оценки позы человека

Вот несколько примеров из реальной жизни, в которых оценка позы играет важную роль:

  • Здравоохранение и реабилитация: врачи могут использовать модели позы для оценки осанки, мониторинга прогресса восстановления и анализа паттернов движений во время физиотерапии.
  • Автономные системы: дроны и интеллектуальные камеры могут использовать информацию о положении для лучшего понимания ориентации и движения объектов в динамичных сценах.
  • Безопасность на рабочем месте: организации могут отслеживать положение тела и повторяющиеся движения, чтобы выявить потенциальные риски для безопасности.
  • Фитнес и персональные тренировки: фитнес-приложения используют оценку позы для track формы track , подсчета повторений и предоставления обратной связи в режиме реального времени о позе и движениях, выполняемых во время фитнес-уроков.
Рис. 3. Оценка позы может помочь track точки тела во время спортивных движений. (Источник)

Изучение поддержки оценки позы в Ultralytics

Ultralytics основан на более раннихYOLO Ultralytics YOLO и содержит обновления, призванные сделать обучение и развертывание более практичными. 

Как и предыдущие версии, она поддерживает оценку позы в рамках единой структуры. Основное отличие заключается в том, что YOLO26 создана для обеспечения большей гибкости и стабильности в более широком спектре реальных случаев использования.

Рис. 4. Бенчмаркинг YOLO26 (Источник)

Ранее моделиYOLO Ultralytics YOLO в значительной степени зависели от наборов данных о позах человека, что означало, что часть старых методов была оптимизирована с учетом структуры суставов человека. YOLO26 устраняет эти специфические для человека допущения. 

В результате он лучше подходит для нечеловеческих ключевых точек, таких как обнаружение углов теннисного корта или других пользовательских структурных ориентиров. Это важно, потому что готовые к использованию, предварительно обученные модели YOLO26-pose обучаются на таких наборах данных, как COCO, и предсказывают ключевые точки человека, определенные в аннотациях набора данных. 

Однако, когда команды хотят detect типы ориентиров, такие как компоненты оборудования, маркеры спортивных полей или точки инфраструктуры, модель обычно требует тонкой настройки на основе набора данных, в котором эти конкретные ключевые точки имеют аннотации.

Поскольку YOLO26 не привязан к предположениям о структуре суставов человека, он может более эффективно адаптироваться во время тонкой настройки. Эта гибкость позволяет модели более надежно изучать индивидуальные расположения ключевых точек, что приводит к улучшению показателей оценки при валидации на наборах данных с уникальными конфигурациями ключевых точек.

YOLO26-pose также разработан для улучшения локализации ключевых точек, когда части объекта частично скрыты или отображаются в очень маленьком масштабе. В реальных сценах с удаленными объектами, съемках с дронов или сценариях с мелкими объектами это может привести к более точным прогнозам ключевых точек по сравнению с более ранними моделями позы.

Еще одно важное обновление — улучшенная формула потерь, используемая во время обучения. Функция потерь определяет, как модель исправляет свои ошибки в процессе обучения. 

Когда речь идет о YOLO26-pose, этот процесс является более эффективным, что помогает модели учиться быстрее и достигать высокой точности за меньшее количество эпох, где эпоха означает один полный проход по обучающему набору данных.

В целом, YOLO26-pose основана на более ранних моделях Ultralytics YOLO и отличается более заметными улучшениями в поддержке ключевых точек нечеловеческих объектов и сходимости обучения, при этом сохраняя привычный рабочий процесс.

Сравнение YOLO26-pose с Ultralytics YOLOv5

Самая ранняя версияYOLO Ultralytics YOLO , Ultralytics YOLOv5, была создана в первую очередь для обнаружения объектов. Хотя YOLOv5 была расширена для поддержки сегментации экземпляров, она не включает в себя нативный специализированный модуль оценки позы в официальной Ultralytics . 

Команды, которым требовалось обнаружение ключевых точек, обычно полагались на отдельные реализации или пользовательские модификации. Ultralytics включает оценку позы в качестве встроенной задачи, с помощью специальной архитектурной головки, разработанной специально для прогнозирования ключевых точек. 

Это означает, что модели YOLO26-pose могут быть обучены, проверены и развернуты в рамках того же унифицированного рабочего процесса, что и обнаружение и сегментация. Для проектов, ориентированных на обнаружение структурированных ключевых точек, YOLO26 предоставляет встроенную поддержку позы и специальную архитектуру, которую YOLOv5 предлагает в стандартной комплектации.

Основные различия: YOLO26-pose и Ultralytics YOLOv8

Ultralytics YOLOv8 внедрил встроенную оценку позы в единую Ultralytics , что упростило обучение и развертывание моделей ключевых точек с использованием того же рабочего процесса, что и для обнаружения и сегментации. Он основан на традиционном конвейере постобработки с немаксимальным подавлением (NMS) и использует более ранние формулировки потерь для регрессии и обучения ограничивающих рамок.

YOLO26 основан на этой платформе и включает в себя архитектурные и обучающие обновления, которые напрямую влияют на оценку позы. Одним из основных отличий является сквозной дизайн. YOLO26 устраняет необходимость в использовании внешнего NMS вывода, что упрощает развертывание и улучшает стабильность задержки, особенно на процессорах и периферийных устройствах.

Еще одно важное усовершенствование касается методологии обучения. В YOLO26 внедрен оптимизатор MuSGD наряду с обновленными стратегиями потери. Для задач определения позы в него интегрирована оценка остаточной логарифмической вероятности, которая улучшает моделирование неопределенности ключевых точек. В совокупности эти изменения могут привести к более быстрой конвергенции и более стабильным прогнозам ключевых точек, особенно в сложных или частично заслоненных сценах.

Короче говоря, YOLOv8 установил прочную и универсальную базовую линию. YOLO26-pose усовершенствует эту базовую линию за счет повышения эффективности обучения, лучшей обработки окклюзии и большей гибкости для реальных приложений, не связанных с позами человека.

YOLO26-Pose против Ultralytics YOLO11: что улучшилось?

Ultralytics YOLO11 основан на Ultralytics YOLOv8 усовершенствованными базовыми и выделяющими слоями. Он уменьшил FLOP, улучшил эффективность параметров и обеспечил более высокий mAP , сохранив mAP высокую производительность в режиме реального времени. Для задач определения позы это означало более высокую точность ключевых точек при более легкой архитектуре.

YOLO26-pose продолжает эту прогрессию с более фундаментальным изменением архитектуры. Проще говоря, YOLO11 эффективность и точность YOLOv8, а YOLO26 развивает эту основу с помощью обновлений архитектуры и обучения, направленных на более быструю конвергенцию, более стабильное выведение и улучшенную точность позы в сложных сценариях.

Почему стоит начать использовать модель YOLO26 для оценки позы?

Изучая различия междуYOLO Ultralytics YOLO , вы, возможно, задаетесь вопросом, стоит ли переходить на YOLO26-pose.

Короткий ответ: это простое обновление. Если вы уже используете Ultralytics YOLOv8 или Ultralytics YOLO11, переход на YOLO26-pose обычно означает только смену версии модели, а не перестроение вашего конвейера.

Вы можете воспользоваться улучшенной поддержкой нечеловеческих ключевых точек, более быстрой конвергенцией во время обучения и улучшенной обработкой заслоненных точек, оставаясь в той же Ultralytics . Для большинства новых и существующих проектов позе, переход на YOLO26-pose — это простой способ получить эти улучшения с минимальными затратами.

Кроме того, YOLO26-pose полностью поддерживается в Python Ultralytics Python , который построен на PyTorch упрощает обучение, валидацию и развертывание. Модели можно экспортировать в такие форматы, как ONNX, TensorRT, OpenVINO, CoreML и TFLite, что упрощает развертывание на графических процессорах, центральных процессорах и периферийных устройствах без изменения общего рабочего процесса.

Основные выводы

Ultralytics делает оценку позы более гибкой и надежной, особенно при работе с нечеловеческими ключевыми точками или сложными сценами. Он обучается быстрее, лучше справляется с окклюзией и обеспечивает более стабильные результаты для разных наборов данных. Для команд, уже использующих модели Ultralytics YOLO , YOLO26 предлагает явные улучшения без изменения существующих рабочих процессов.

Хотите узнать больше об ИИ? Посетите наше сообщество и репозиторий GitHub. Изучите страницы с нашими решениями, чтобы узнать об ИИ в робототехнике и компьютерном зрении в сельском хозяйстве. Откройте для себя наши варианты лицензирования и начните создавать решения с использованием компьютерного зрения уже сегодня!

Давайте строить будущее
ИИ вместе!

Начните свой путь в будущее машинного обучения

Начать бесплатно