Откройте для себя ключевые моменты в области компьютерного зрения: оценка позы с помощью Ultralytics YOLO11 для фитнеса, распознавание жестов и быстрое и точное отслеживание.
Ключевые точки - это точные, информативные пространственные точки на изображении, которые определяют отличительные особенности объекта или сцены. сцены. В области компьютерного зрения эти координаты - обычно представленные в виде значений X и Y - отмечают важные точки интереса, такие как углы здания, центр глаза или суставы человеческого тела. Например, углы здания, центр глаза или суставы человеческого тела. В отличие от обработки каждого пикселя изображения, фокусировка на этих редких, семантически насыщенных точках позволяет модели искусственного интеллекта (ИИ) эффективно понимать геометрию, анализировать формы и track движение с высокой точностью. Эта концепция является основополагающей для сложных задач, требующих структурного понимания объекта, а не только его присутствия или местоположения.
Ключевые точки служат фундаментальными строительными блоками для отображения структуры динамических объектов. Когда несколько ключевых точек обнаруживаются и соединяются, они образуют скелетный граф или каркас, который представляет позу объекта. Этот наиболее часто применяется в оценке позы, где Алгоритмы предсказывают расположение анатомических суставов - плеч, локтей, бедер и коленей - для восстановления осанки человека.
Используя такие архитектуры глубокого обучения, как YOLO11системы могут регрессировать эти координаты непосредственно из входных изображений. Этот процесс включает сложное извлечение признаков, в ходе которого сеть учится определять локальные паттерны, инвариантные к освещению, повороту и масштабу. Полученные данные являются легкими и вычислительно эффективны, что делает их идеальными для для выводов в реальном времени на устройствах, расположенных на границе.
Чтобы понять особую полезность ключевых точек, полезно сравнить их с другими основными задачами компьютерного зрения задачами:
Возможность track конкретные точки на предмете открывает возможности для применения в различных отраслях:
Современные библиотеки позволяют легко реализовать обнаружение ключевых точек с помощью предварительно обученных моделей. Сайт
ultralytics пакет обеспечивает мгновенный доступ к
YOLO11 модели, обученные на массивных наборах данных, таких как
COCO для идентификации человеческих суставов.
В следующем примере показано, как загрузить модель оценки позы и визуализировать обнаруженные ключевые точки:
from ultralytics import YOLO
# Load a pretrained YOLO11n-pose model
model = YOLO("yolo11n-pose.pt")
# Run inference on a local image or URL
results = model("https://docs.ultralytics.com/tasks/detect/")
# Visualize the results, showing the skeletal keypoints
results[0].show()
В этом рабочем процессе модель выдает Keypoints объект, содержащий координаты и
показатель доверия для каждой обнаруженной точки. Разработчики могут
извлекать эти необработанные данные x, y значения для построения пользовательской логики, например, подсчета повторений в тренажерном зале или
управление игровым персонажем с помощью
человеко-компьютерное взаимодействие.