Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

Ключевые моменты

Откройте для себя ключевые моменты в области компьютерного зрения: оценка позы с помощью Ultralytics YOLO11 для фитнеса, распознавание жестов и быстрое и точное отслеживание.

Ключевые точки - это точные, информативные пространственные точки на изображении, которые определяют отличительные особенности объекта или сцены. сцены. В области компьютерного зрения эти координаты - обычно представленные в виде значений X и Y - отмечают важные точки интереса, такие как углы здания, центр глаза или суставы человеческого тела. Например, углы здания, центр глаза или суставы человеческого тела. В отличие от обработки каждого пикселя изображения, фокусировка на этих редких, семантически насыщенных точках позволяет модели искусственного интеллекта (ИИ) эффективно понимать геометрию, анализировать формы и track движение с высокой точностью. Эта концепция является основополагающей для сложных задач, требующих структурного понимания объекта, а не только его присутствия или местоположения.

Роль ключевых точек в искусственном интеллекте зрения

Ключевые точки служат фундаментальными строительными блоками для отображения структуры динамических объектов. Когда несколько ключевых точек обнаруживаются и соединяются, они образуют скелетный граф или каркас, который представляет позу объекта. Этот наиболее часто применяется в оценке позы, где Алгоритмы предсказывают расположение анатомических суставов - плеч, локтей, бедер и коленей - для восстановления осанки человека.

Используя такие архитектуры глубокого обучения, как YOLO11системы могут регрессировать эти координаты непосредственно из входных изображений. Этот процесс включает сложное извлечение признаков, в ходе которого сеть учится определять локальные паттерны, инвариантные к освещению, повороту и масштабу. Полученные данные являются легкими и вычислительно эффективны, что делает их идеальными для для выводов в реальном времени на устройствах, расположенных на границе.

Различение ключевых моментов и смежных понятий

Чтобы понять особую полезность ключевых точек, полезно сравнить их с другими основными задачами компьютерного зрения задачами:

  • Ключевые точки по сравнению с обнаружением объектов: Стандартное обнаружение определяет , что и где находится объект, заключая его в ограничительную рамку. Однако рамка рассматривает объект как жесткий прямоугольник. Ключевые точки смотрят внутрь рамки, чтобы определить внутреннее сочленение и позу.
  • Ключевые точки против сегментации экземпляров. Сегментация экземпляров: Сегментация создает пиксельно-идеальную маску силуэта объекта. Хотя сегментация обеспечивает максимальную детализацию границ, она часто требует больших вычислительных затрат. Ключевые точки дают упрощенную структурную сводку, которая часто предпочтительно при анализе кинематики или динамики движения.
  • Ключевые точки по сравнению с аннотацией данных: Аннотирование - это процесс маркировки данных человеком, в то время как обнаружение ключевых точек - это предсказание модели. Создание наборов данных предполагает ручное выделение определенных точек (например, "левое запястье") для обучения модели.

Применение в реальном мире

Возможность track конкретные точки на предмете открывает возможности для применения в различных отраслях:

  • Спортивная аналитика: Тренеры и спортсмены используют определение ключевых точек для анализа биомеханики. Отслеживая углы между суставами во время гольфа или спринта, системы могут обеспечить автоматическую обратную связь для оптимизации производительности и предотвращения травм. Этот часто включает в себя вычисление степеней свободы, чтобы понять диапазон движения.
  • ИИ в робототехнике: Роботы полагаются на ключевых точек для захвата и манипулирования объектами. Определение конкретных точек захвата на объекте позволяет роботизированной руке рассчитать обратную кинематику и правильно позиционировать и правильно позиционировать конечный движитель.
  • ИИ в здравоохранении: Физическая Приложения для терапии удаленно контролируют упражнения пациентов. Отслеживая ориентиры тела, система следит за тем, чтобы упражнения выполняются в правильной форме, способствуя эффективной реабилитации.
  • Дополненная реальность (AR): В социальных фильтрах и виртуальных приложениях для примерки, ключевые точки на лице (лицевые ориентиры) позволяют цифровым маскам или очкам идеально согласовываться с движениями пользователя.

Реализация обнаружения ключевых точек

Современные библиотеки позволяют легко реализовать обнаружение ключевых точек с помощью предварительно обученных моделей. Сайт ultralytics пакет обеспечивает мгновенный доступ к YOLO11 модели, обученные на массивных наборах данных, таких как COCO для идентификации человеческих суставов.

В следующем примере показано, как загрузить модель оценки позы и визуализировать обнаруженные ключевые точки:

from ultralytics import YOLO

# Load a pretrained YOLO11n-pose model
model = YOLO("yolo11n-pose.pt")

# Run inference on a local image or URL
results = model("https://docs.ultralytics.com/tasks/detect/")

# Visualize the results, showing the skeletal keypoints
results[0].show()

В этом рабочем процессе модель выдает Keypoints объект, содержащий координаты и показатель доверия для каждой обнаруженной точки. Разработчики могут извлекать эти необработанные данные x, y значения для построения пользовательской логики, например, подсчета повторений в тренажерном зале или управление игровым персонажем с помощью человеко-компьютерное взаимодействие.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас