Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

Ключевые моменты

Узнайте, как ключевые точки определяют геометрию и положение объекта в искусственном интеллекте. Изучите оценку положения с помощью Ultralytics и начните работу с нашим простым в использовании Python .

Ключевые точки — это отдельные пространственные положения или ориентиры в изображении, которые определяют значимые особенности объекта или предмета. В контексте компьютерного зрения и машинного обучения ключевая точка обычно представлена набором координат (X, Y), которые точно указывают конкретную часть объекта, например локоть человека, угол здания или центр колеса автомобиля. В отличие от более простых задач, которые только определяют наличие объекта, определение ключевых точек позволяет моделям искусственного интеллекта (ИИ) понимать геометрию, позу и структурное расположение объекта. Эта способность имеет основополагающее значение для продвинутого визуального анализа, позволяя машинам интерпретировать язык тела, track движения и сопоставлять цифровые наложения с реальными объектами.

Роль ключевых точек в моделях искусственного интеллекта

Ключевые точки служат в качестве исходных данных для оценки позы, техники, которая отображает скелетную структуру человека или животного. Обнаруживая заранее определенный набор точек, таких как плечи, колени и лодыжки, алгоритмы могут реконструировать полную позу объекта в режиме реального времени. Этот процесс выходит за рамки стандартного обнаружения объектов, которое обычно выводит ограничительную рамку вокруг объекта, не понимая его внутреннюю форму.

Современные архитектуры, такие как ультрасовременная Ultralytics , эволюционировали, чтобы предсказывать эти ключевые точки с высокой точностью и скоростью. Эти модели используют сети глубокого обучения (DL), обученные на огромных аннотированных наборах данных, таких как COCO , для изучения визуальных паттернов, связанных с суставами и чертами лица. Во время вывода модель регрессирует координаты для каждой ключевой точки, часто включая оценку достоверности, чтобы указать надежность прогноза.

Ключевые моменты и связанные концепции

Чтобы понять уникальную полезность ключевых точек, полезно отличать их от других распространенных результатов компьютерного зрения:

  • Ключевые точки и ограничительные рамки: Ограничительная рамка обеспечивает грубую локализацию, объединяя весь объект в прямоугольник. Ключевые точки обеспечивают точную локализацию определенных частей внутри этого объекта.
  • Ключевые точки против сегментации изображения: Сегментация изображения классифицирует каждый пиксель для создания точной маски формы объекта. В то время как сегментация предоставляет подробную информацию о границах, ключевые точки предоставляют структурное резюме («скелет»), которое часто более эффективно для анализа движения и кинематики.
  • Ключевые точки против дескрипторов признаков: В традиционной обработке изображений, такой как SIFT (Scale-Invariant Feature Transform), ключевые точки — это точки интереса (углы, пятна), используемые для сопоставления изображений. В современной оценке позы с помощью глубокого обучения ключевые точки — это семантические метки (например, «левое запястье»), изученные сетью.

Применение в реальном мире

Возможность track части тела или особенности объектов открывает широкие возможности для применения в различных отраслях:

  • Спортивная аналитика: тренеры и спортсмены используют оценку положения тела для анализа биомеханики. Отслеживая ключевые точки на суставах, системы могут рассчитывать углы и скорости для улучшения техники в таких видах спорта, как гольф, теннис или спринт. Посмотрите, как YOLO Ultralytics YOLO track , чтобы предоставить полезную обратную связь.
  • Здравоохранение и реабилитация: Платформы физиотерапии используют ключевые точки для удаленного мониторинга упражнений пациентов. Система обеспечивает поддержание правильной формы пациентами во время реабилитационных процедур, снижая риск травм и отслеживая прогресс восстановления.
  • Дополненная реальность (AR): Фильтры в социальных сетях и приложения для виртуальной примерки используют ключевые точки лица (глаза, нос, контуры рта), чтобы надежно закрепить цифровые маски или очки на лице пользователя, сохраняя выравнивание даже при его движении.
  • Мониторинг водителя: автомобильные системы безопасности track ориентиры track , чтобы detect сонливости или отвлечения внимания, предупреждая водителя, если его глаза закрываются или положение головы указывает на недостаток внимания.

Реализация обнаружения ключевых точек с помощью YOLO26

Используя Ultralytics или Python , разработчики могут легко реализовать обнаружение ключевых точек. В следующем примере показано, как загрузить предварительно обученную модель YOLO26-pose и запустить инференцию на изображении для detect скелетов.

from ultralytics import YOLO

# Load a pre-trained YOLO26 pose estimation model
model = YOLO("yolo26n-pose.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Visualize the results showing detected keypoints and skeletons
for result in results:
    result.show()  # Display the image with keypoints drawn

    # Access keypoint coordinates (x, y, confidence)
    keypoints = result.keypoints.data
    print(f"Detected keypoints shape: {keypoints.shape}")

Этот простой рабочий процесс позволяет быстро развертывать сложные приложения компьютерного зрения (CV). Для пользователей, желающих обучить свои собственные модели ключевых точек — например, для detect точек на промышленном оборудовании или видах животных — Ultralytics упрощает процесс аннотирования данных и обучения моделей в облаке.

Дополнительные соображения

Для успешного внедрения обнаружения ключевых точек необходимо решать такие проблемы, как окклюзия (когда часть тела скрыта) и разнообразные условия освещения. Современные модели решают эту проблему за счет надежного увеличения объема данных во время обучения, подвергая сеть воздействию различных сценариев. Кроме того, интеграция ключевых точек с алгоритмами отслеживания объектов позволяет обеспечить постоянную идентификацию людей в видеопотоках, что необходимо для таких приложений, как безопасность или поведенческий анализ.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас