Откройте для себя ключевые моменты в области компьютерного зрения: оценка позы с помощью Ultralytics YOLO11 для фитнеса, распознавание жестов и быстрое и точное отслеживание.
Ключевые точки — это конкретные, информативные пространственные положения в изображении, которые определяют отличительные черты объекта или сцены. В области компьютерного зрения (CV) эти точки, обычно представленные в виде координат X и Y, отмечают значимые области интереса, такие как углы здания, черты лица, такие как глаза и нос, или анатомические суставы человеческого тела. В отличие от обработки каждого пикселя в плотной сетке, фокусировка на этих редких, семантически богатых точках позволяет моделям искусственного интеллекта (ИИ) эффективно понимать геометрию, анализировать формы и track с высокой точностью. Эта концепция является основополагающей для сложных задач, требующих структурного понимания объекта, а не только его присутствия или местоположения.
Ключевые точки служат в качестве фундаментальных строительных блоков для отображения структуры динамических объектов. Когда обнаруживается и соединяется несколько ключевых точек, они образуют скелетный граф или каркас, который представляет позу объекта. Это наиболее часто применяется в оценке позы, где алгоритмы глубокого обучения (DL) предсказывают расположение суставов — плеч, локтей, бедер и колен — для реконструкции позы человека или животного.
Используя передовые архитектуры, такие как модель Ultralytics , системы могут регрессировать эти координаты непосредственно из входных изображений с поразительной скоростью. Этот процесс включает в себя сложную экстракцию признаков, при которой нейронная сеть учится идентифицировать локальные паттерны, независимые от освещения, поворота и масштаба. Поскольку ключевые точки представляют собой сжатое резюме состояния объекта, они эффективны с точки зрения вычислений, что делает их идеальными для вывода в реальном времени на периферийных вычислительных устройствах.
Чтобы понять конкретную полезность ключевых точек, полезно сравнить их с другими основными задачами компьютерного зрения, представленными в Ultralytics :
Возможность track конкретные точки на предмете открывает возможности для применения в различных отраслях:
Современные библиотеки позволяют легко реализовать обнаружение ключевых точек с помощью предварительно обученных моделей. Сайт
ultralytics Пакет обеспечивает мгновенный доступ к современным моделям, таким как YOLO26 и
YOLO11, который можно обучить на таких наборах данных, как
COCO или
Поза тигра.
Следующий пример демонстрирует, как загрузить модель оценки позы и визуализировать обнаруженные ключевые точки с помощью Python:
from ultralytics import YOLO
# Load a pretrained YOLO26n-pose model
model = YOLO("yolo26n-pose.pt")
# Run inference on a local image
results = model("path/to/runner.jpg")
# Visualize the results, showing the skeletal keypoints
results[0].show()
В этом рабочем процессе модель выдает объект результата, содержащий координаты и
показатель доверия для каждой обнаруженной точки. Разработчики могут
извлекать эти необработанные данные x, y значения для построения пользовательской логики, например, подсчета повторений в тренажерном зале или
управление игровым персонажем с помощью захват движения.