Узнайте, как ключевые точки определяют геометрию и положение объекта в искусственном интеллекте. Изучите оценку положения с помощью Ultralytics и начните работу с нашим простым в использовании Python .
Ключевые точки — это отдельные пространственные положения или ориентиры в изображении, которые определяют значимые особенности объекта или предмета. В контексте компьютерного зрения и машинного обучения ключевая точка обычно представлена набором координат (X, Y), которые точно указывают конкретную часть объекта, например локоть человека, угол здания или центр колеса автомобиля. В отличие от более простых задач, которые только определяют наличие объекта, определение ключевых точек позволяет моделям искусственного интеллекта (ИИ) понимать геометрию, позу и структурное расположение объекта. Эта способность имеет основополагающее значение для продвинутого визуального анализа, позволяя машинам интерпретировать язык тела, track движения и сопоставлять цифровые наложения с реальными объектами.
Ключевые точки служат в качестве исходных данных для оценки позы, техники, которая отображает скелетную структуру человека или животного. Обнаруживая заранее определенный набор точек, таких как плечи, колени и лодыжки, алгоритмы могут реконструировать полную позу объекта в режиме реального времени. Этот процесс выходит за рамки стандартного обнаружения объектов, которое обычно выводит ограничительную рамку вокруг объекта, не понимая его внутреннюю форму.
Современные архитектуры, такие как ультрасовременная Ultralytics , эволюционировали, чтобы предсказывать эти ключевые точки с высокой точностью и скоростью. Эти модели используют сети глубокого обучения (DL), обученные на огромных аннотированных наборах данных, таких как COCO , для изучения визуальных паттернов, связанных с суставами и чертами лица. Во время вывода модель регрессирует координаты для каждой ключевой точки, часто включая оценку достоверности, чтобы указать надежность прогноза.
Чтобы понять уникальную полезность ключевых точек, полезно отличать их от других распространенных результатов компьютерного зрения:
Возможность track части тела или особенности объектов открывает широкие возможности для применения в различных отраслях:
Используя Ultralytics или Python , разработчики могут легко реализовать обнаружение ключевых точек. В следующем примере показано, как загрузить предварительно обученную модель YOLO26-pose и запустить инференцию на изображении для detect скелетов.
from ultralytics import YOLO
# Load a pre-trained YOLO26 pose estimation model
model = YOLO("yolo26n-pose.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Visualize the results showing detected keypoints and skeletons
for result in results:
result.show() # Display the image with keypoints drawn
# Access keypoint coordinates (x, y, confidence)
keypoints = result.keypoints.data
print(f"Detected keypoints shape: {keypoints.shape}")
Этот простой рабочий процесс позволяет быстро развертывать сложные приложения компьютерного зрения (CV). Для пользователей, желающих обучить свои собственные модели ключевых точек — например, для detect точек на промышленном оборудовании или видах животных — Ultralytics упрощает процесс аннотирования данных и обучения моделей в облаке.
Для успешного внедрения обнаружения ключевых точек необходимо решать такие проблемы, как окклюзия (когда часть тела скрыта) и разнообразные условия освещения. Современные модели решают эту проблему за счет надежного увеличения объема данных во время обучения, подвергая сеть воздействию различных сценариев. Кроме того, интеграция ключевых точек с алгоритмами отслеживания объектов позволяет обеспечить постоянную идентификацию людей в видеопотоках, что необходимо для таких приложений, как безопасность или поведенческий анализ.