Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

Ключевые моменты

Откройте для себя ключевые моменты в области компьютерного зрения: оценка позы с помощью Ultralytics YOLO11 для фитнеса, распознавание жестов и быстрое и точное отслеживание.

Ключевые точки — это конкретные, информативные пространственные положения в изображении, которые определяют отличительные черты объекта или сцены. В области компьютерного зрения (CV) эти точки, обычно представленные в виде координат X и Y, отмечают значимые области интереса, такие как углы здания, черты лица, такие как глаза и нос, или анатомические суставы человеческого тела. В отличие от обработки каждого пикселя в плотной сетке, фокусировка на этих редких, семантически богатых точках позволяет моделям искусственного интеллекта (ИИ) эффективно понимать геометрию, анализировать формы и track с высокой точностью. Эта концепция является основополагающей для сложных задач, требующих структурного понимания объекта, а не только его присутствия или местоположения.

Роль ключевых точек в искусственном интеллекте зрения

Ключевые точки служат в качестве фундаментальных строительных блоков для отображения структуры динамических объектов. Когда обнаруживается и соединяется несколько ключевых точек, они образуют скелетный граф или каркас, который представляет позу объекта. Это наиболее часто применяется в оценке позы, где алгоритмы глубокого обучения (DL) предсказывают расположение суставов — плеч, локтей, бедер и колен — для реконструкции позы человека или животного.

Используя передовые архитектуры, такие как модель Ultralytics , системы могут регрессировать эти координаты непосредственно из входных изображений с поразительной скоростью. Этот процесс включает в себя сложную экстракцию признаков, при которой нейронная сеть учится идентифицировать локальные паттерны, независимые от освещения, поворота и масштаба. Поскольку ключевые точки представляют собой сжатое резюме состояния объекта, они эффективны с точки зрения вычислений, что делает их идеальными для вывода в реальном времени на периферийных вычислительных устройствах.

Различение ключевых моментов и смежных понятий

Чтобы понять конкретную полезность ключевых точек, полезно сравнить их с другими основными задачами компьютерного зрения, представленными в Ultralytics :

  • Ключевые точки против обнаружения объектов: Стандартное обнаружение определяет, что представляет собой объект и где он находится, заключая его в ограничивающую рамку. Однако рамка рассматривает объект как жесткий прямоугольник. Ключевые точки смотрят внутрь рамки, чтобы определить внутреннюю артикуляцию, позу и гибкую структуру.
  • Ключевые точки против сегментации экземпляров. Сегментация экземпляров: Сегментация создает пиксельно-идеальную маску силуэта объекта. Хотя сегментация обеспечивает максимальную детализацию границ, она часто требует больших вычислительных затрат. Ключевые точки дают упрощенную структурную сводку, которая часто предпочтительно при анализе кинематики или динамики движения.
  • Ключевые точки и аннотация данных: Аннотация — это процесс маркировки данных человеком, тогда как обнаружение ключевых точек — это прогноз модели. Создание учебного набора данных включает в себя ручное выделение определенных точек (например, «левое запястье») для обучения модели с помощью контролируемого обучения.

Применение в реальном мире

Возможность track конкретные точки на предмете открывает возможности для применения в различных отраслях:

  • ИИ в здравоохранении и реабилитации: Приложения для физиотерапии удаленно контролируют выполнение упражнений пациентами. Отслеживая ориентиры тела, система обеспечивает правильное выполнение упражнений, способствуя эффективной реабилитации. Часто это включает в себя расчет степени свободы для понимания диапазона движений пациента.
  • Спортивная аналитика: Тренеры и спортсмены используют обнаружение ключевых точек для анализа биомеханики. Отслеживая углы между суставами во время гольф-свинга или спринта, системы могут предоставлять автоматическую обратную связь для оптимизации результатов и предотвращения травм.
  • Системы мониторинга водителей: в автомобильной промышленности системы распознавания лиц track особенности track (глаза, рот) для detect усталости или отвлечения внимания, предупреждая водителей, чтобы предотвратить аварии.
  • Дополненная реальность (AR): в фильтрах социальных сетей и приложениях для виртуальной примерки ключевые точки на лице позволяют цифровым маскам или очкам идеально совпадать с движениями пользователя, что требует точного взаимодействия человека и компьютера.

Реализация обнаружения ключевых точек

Современные библиотеки позволяют легко реализовать обнаружение ключевых точек с помощью предварительно обученных моделей. Сайт ultralytics Пакет обеспечивает мгновенный доступ к современным моделям, таким как YOLO26 и YOLO11, который можно обучить на таких наборах данных, как COCO или Поза тигра.

Следующий пример демонстрирует, как загрузить модель оценки позы и визуализировать обнаруженные ключевые точки с помощью Python:

from ultralytics import YOLO

# Load a pretrained YOLO26n-pose model
model = YOLO("yolo26n-pose.pt")

# Run inference on a local image
results = model("path/to/runner.jpg")

# Visualize the results, showing the skeletal keypoints
results[0].show()

В этом рабочем процессе модель выдает объект результата, содержащий координаты и показатель доверия для каждой обнаруженной точки. Разработчики могут извлекать эти необработанные данные x, y значения для построения пользовательской логики, например, подсчета повторений в тренажерном зале или управление игровым персонажем с помощью захват движения.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас