Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

Оценка позы

Узнайте об оценке позы: как работают модели ключевых точек (сверху вниз и снизу вверх), о реальных способах применения - от здравоохранения до спорта, а также о ключевых преимуществах и проблемах.

Оценка позы - это специализированная задача компьютерного зрения (КВ), которая выходит за рамки обнаружения объектов и определения их геометрии и ориентации. Определяя координаты структурных ориентиров - известных как ключевые точки - этатехнология создает скелетное представление объекта. У людей ключевые точки обычно указывают на основные суставы - плечевые, локтевые, тазобедренные и коленные, бедра и колени. Эта возможность позволяет модели машинного обучения (ML) интерпретировать язык тела язык, активность и позу, преодолевая разрыв между простым обнаружением пикселей и пониманием сложного физического поведения. поведения.

Основные механизмы и подходы

Современная оценка позы в значительной степени опирается на архитектуры глубокого обучения (ГОО), в частности конволюционные нейронные сети (CNN) и, все чаще, трансформеры. Процесс, как правило, делится на две основные методологии:

  • Подход "сверху вниз": В этом методе сначала используется модель обнаружения объектов для определения местоположения отдельных объектов (например, людей) в пределах ограничительного поля. После того как После обрезки система оценивает ключевые точки для этого отдельного человека. Этот способ часто оказывается более точным, но вычислительно но требует больших вычислительных затрат при увеличении количества людей.
  • Подход "снизу вверх": В качестве альтернативы модель обнаруживает все потенциальные ключевые точки на всем изображении (например, каждый левый локоть), а затем объединяет их в отдельные скелеты. Этот способ часто предпочтителен для для вывода в реальном времени в многолюдных сценах, поскольку время обработки меньше зависит от количества объектов.

Для высокопроизводительных приложений используются такие модели, как Ultralytics YOLO11 объединяют эти концепции, чтобы обеспечить быструю быстрой оценки положения, подходящей для краевых устройств.

Различение смежных понятий

Очень важно отличать оценку позы от аналогичных задач зрения:

  • Обнаружение объектов: В то время как обнаружение объектов определяет, где находится объект и что это такое (метка класса), оно рассматривает объект как жесткую коробку. Оценка позы выявляет внутреннюю внутреннюю структуру и артикуляцию внутри этой коробки.
  • Отличие от сегментации экземпляров: Сегментация экземпляра обеспечивает пиксельно-идеальную маску формы объекта. Хотя она и очерчивает границы, в ней нет четкой идентификации суставов или скелетные связи, что необходимо для анализа динамики движения или кинематики.

Применение в реальном мире

Полезность оценки позы распространяется на различные отрасли, где анализ движения имеет решающее значение.

Здравоохранение и реабилитация

В области ИИ в здравоохранении оценка позы помогает в физиотерапии, автоматически отслеживая движения пациента. Системы могут измерять угол наклона суставов во время реабилитационных упражнений, чтобы убедиться, что пациенты поддерживают правильную форму, снижая риск повторной травмы. Это позволяет дистанционный мониторинг и телемедицину, делая качественное лечение более доступным.

Спортивная аналитика и биомеханика

Тренеры и спортсмены используют спортивная аналитика Для анализа спортивных результатов. Извлекая биомеханические данные из видеозаписей ИИ может проанализировать плоскость замаха гольфиста или эффективность походки бегуна без необходимости использования навязчивых маркеров костюмов, используемых при традиционном захвате движений.

Пример кода: Оценка позы с помощью YOLO11

Следующие Python Сниппет демонстрирует, как загрузить предварительно обученную модель YOLO11 и выполнить оценку позы на изображении. Для этого требуется ultralytics пакет и визуализирует скелетный вывод.

from ultralytics import YOLO

# Load the official YOLO11 nano pose model
model = YOLO("yolo11n-pose.pt")

# Run inference on an image source
results = model("https://docs.ultralytics.com/usage/python/")

# Visualize the detected keypoints and skeleton
results[0].show()

Проблемы и данные

Для обучения надежных моделей позы требуются обширные аннотированные наборы данных. Стандартные эталоны, такие как набор данныхCOCO Pose, предоставляют тысячи помеченных человеческих фигур. Однако остаются проблемы, такие как окклюзия (когда части тела скрыты) и самоокклюзия (когда человек блокирует себя). Окклюзия (когда части тела скрыты) и самоокклюзия (когда человек блокирует собственные конечности). Для их решения требуются передовые методы дополнения данных и разнообразные разнообразных обучающих данных, охватывающих различные ракурсы и условия освещения условий.

Кроме того, развертывание этих моделей на устройствах с пограничным ИИ требует тщательной оптимизации, такой как квантование модели, чтобы сохранить высокую точность без ущерба для скорости.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас