Узнайте, как оценка позы использует ключевые точки для track . Изучите реальные приложения и начните работать с Ultralytics для получения быстрых и точных результатов.
Оценка позы — это специализированная техника компьютерного зрения, которая выходит за рамки простого обнаружения объектов и позволяет понять их геометрическую структуру и физическую ориентацию. В то время как стандартное обнаружение объектов рисует простой прямоугольный прямоугольник вокруг объекта, оценка позы определяет конкретные семантические точки, известные как ключевые точки, такие как суставы на теле человека (локти, колени, плечи) или структурные углы на транспортном средстве. Путем отображения этих ориентиров модели машинного обучения могут реконструировать скелетную репрезентацию объекта, что позволяет системам интерпретировать язык тела, динамику движений и точное положение в 2D- или 3D-пространстве.
Современная оценка позы в значительной степени опирается на сложные архитектуры глубокого обучения, часто использующие сверточные нейронные сети (CNN) для обработки визуальных данных. Алгоритмы обычно следуют одной из двух основных стратегий для идентификации ключевых точек:
Современные модели, такие как YOLO26, используют передовые архитектуры «из конца в конец», которые уравновешивают эти потребности, обеспечивая высокоскоростную оценку позы, подходящую для развертывания на периферийных устройствах искусственного интеллекта и мобильных платформах.
Полезно отличать оценку позы от других задач визуального распознавания, чтобы понять ее уникальную ценность в рабочих процессах компьютерного зрения:
Способность оцифровывать движения человека и объектов привела к появлению трансформационных приложений в различных отраслях промышленности, часто обучаемых с помощью таких инструментов, как Ultralytics , для управления большими наборами данных с аннотированными ключевыми точками.
В области медицины искусственный интеллект используется для удаленного мониторинга реабилитации пациентов. Отслеживая углы сгибания суставов и амплитуду движений, автоматизированные системы могут обеспечить правильное выполнение пациентами физиотерапевтических упражнений в домашних условиях. Это снижает риск повторных травм и позволяет врачам количественно оценивать прогресс в выздоровлении без использования дорогостоящего лабораторного оборудования.
Тренеры и спортсмены используют спортивную аналитику для оптимизации результатов. Модели оценки позы могут анализировать плоскость замаха гольфиста, длину шага бегуна или биомеханику питчера без необходимости использования навязчивых костюмов с маркерами, которые применяются в традиционной системе захвата движения. Это обеспечивает немедленную обратную связь на основе данных для улучшения техники и предотвращения травм от перенапряжения.
В коммерческой среде искусственный интеллект в розничных системах использует обнаружение поз для понимания поведения покупателей, например, когда они тянутся за товарами на высоких полках или задерживаются в определенных проходах. Эти данные помогают оптимизировать планировку магазина и улучшить управление запасами за счет сопоставления физических действий с решениями о покупке.
Реализация оценки позы не представляет сложности с помощью современных Python фреймворки.
Следующий пример демонстрирует, как использовать ultralytics пакет для загрузки предварительно обученного
YOLO26 модель (преемник
YOLO11) и detect ключевые точки detect на изображении.
from ultralytics import YOLO
# Load the YOLO26 pose model (nano version for speed)
model = YOLO("yolo26n-pose.pt")
# Perform inference on an image source
# The model identifies bounding boxes and specific keypoints (joints)
results = model("https://ultralytics.com/images/bus.jpg")
# Print the xy coordinates of detected keypoints
print(results[0].keypoints.xy)
# Visualize the skeletal results directly
results[0].show()