Настраивайтесь на YOLO Vision 2025!
25 сентября 2025 г.
10:00 — 18:00 BST
Гибридное мероприятие
Yolo Vision 2024
Глоссарий

Ключевые моменты

Откройте для себя ключевые моменты в области компьютерного зрения: оценка позы с помощью Ultralytics YOLO11 для фитнеса, распознавание жестов и быстрое и точное отслеживание.

В компьютерном зрении ключевые точки - это особые точки интереса на изображении, которые отличаются друг от друга и повторяются. Эти точки служат компактными структурными ориентирами, которые представляют объект или сцену, позволяя машинам понимать и анализировать визуальный контент с большей детализацией. Вместо того чтобы обрабатывать каждый пиксель, алгоритмы концентрируются на этих ключевых точках - углах, краях или суставах человеческого тела - для выполнения сложных задач, таких как отслеживание движения, распознавание объектов и реконструкция 3D-сцен. Сосредоточившись на этих информативных точках, модели компьютерного зрения могут достичь высокой эффективности и точности.

Обнаружение ключевых точек и оценка позы

Основное применение ключевых точек - оценка позы, задача компьютерного зрения, направленная на определение положения и ориентации объекта или человека. При оценке позы человека ключевые точки соответствуют основным суставам тела, таким как плечи, локти, колени и запястья. Обнаружив эти точки на изображении или видео, модель может построить скелетное представление человеческого тела. Этот "цифровой скелет" позволяет системе искусственного интеллекта анализировать позу, жесты и движения без необходимости понимать внешность человека, его одежду или окружающую обстановку.

Передовые модели глубокого обучения, такие как Ultralytics YOLO11, обучаются на больших аннотированных наборах данных, таких как COCO, чтобы точно предсказывать местоположение этих ключевых точек в режиме реального времени. Ранние системы, такие как OpenPose, проложили путь, продемонстрировав способность определять ключевые точки на всем теле, руках и лицах нескольких людей одновременно. Современные архитектуры опираются на эти основы и позволяют получать более быстрые и точные результаты для широкого круга приложений.

Ключевые точки по сравнению с другими концепциями компьютерного зрения

Важно отличать обнаружение ключевых точек от других задач, связанных с компьютерным зрением:

  • Ограничительные рамки: Для обнаружения объектов обычно используется ограничивающая рамка -простой прямоугольник, показывающий местоположение объекта. Обнаружение ключевых точек обеспечивает более детальное понимание, определяя конкретные структурные точки в пределах этой рамки, описывая позу и форму объекта.
  • Сегментация экземпляров: В то время как ключевые точки создают скелетный контур, сегментация экземпляров идет дальше, определяя точную форму объекта на уровне пикселей. Сегментация обеспечивает полную границу, в то время как ключевые точки дают краткое описание структуры.
  • Дескрипторы признаков: После обнаружения ключевой точки можно вычислить дескриптор признаков для описания участка изображения вокруг нее. Такие алгоритмы, как SIFT и ORB, генерируют эти дескрипторы, которые выступают в качестве числового "отпечатка пальца", используемого для сопоставления соответствующих ключевых точек между различными изображениями.

Применение в реальном мире

Способность обнаруживать и отслеживать ключевые точки позволила добиться значительных успехов в различных отраслях. Вот два ярких примера:

  1. Интеллектуальная фитнес- и спортивная аналитика: В фитнес-приложениях модели оценки позы отслеживают основные суставы тела, чтобы контролировать форму пользователя во время таких упражнений, как приседания или йога. Система может подсчитывать количество повторений, обеспечивать обратную связь в реальном времени для предотвращения травм и анализировать спортивные результаты с высокой точностью. Эта технология помогает создавать персонализированные и интерактивные тренировки, доступные через обычную камеру.
  2. Распознавание жестов рук: Определяя ключевые точки на руке и пальцах, системы ИИ могут интерпретировать сложные движения рук. Это очень важно для разработки интуитивно понятных элементов управления в дополненной и виртуальной реальности, создания средств перевода языка жестов и обеспечения бесконтактного взаимодействия с интеллектуальными устройствами. Модели, обученные на базе данных по точкам кистей рук, могут распознавать различные жесты - от простого щипка до сложных знаков.

Среди других применений - обнаружение ориентиров на лице для анализа эмоций и AR-фильтров, оценка позы животных для изучения поведения при охране дикой природы, а также робототехника для помощи машинам в навигации и взаимодействии с окружающей средой.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас
Ссылка скопирована в буфер обмена