AI'da anahtar noktaların nesne geometrisini ve duruşunu nasıl tanımladığını öğrenin. Ultralytics ile poz tahminini keşfedin ve kullanımı kolay Python la çalışmaya başlayın.
Anahtar noktalar, bir nesnenin veya konunun önemli özelliklerini tanımlayan, görüntü içindeki belirgin uzamsal konumlar veya işaretlerdir. Bilgisayar görme ve makine öğrenimi bağlamında, bir anahtar nokta genellikle bir nesnenin belirli bir bölümünü, örneğin bir kişinin dirseğini, bir binanın köşesini veya bir araba tekerleğinin merkezini gösteren bir dizi koordinat (X, Y) ile temsil edilir. Sadece bir nesnenin varlığını belirleyen daha basit görevlerin aksine, anahtar noktaların belirlenmesi, yapay zeka (AI) modellerinin konunun geometrisini, duruşunu ve yapısal düzenini anlamasını sağlar. Bu yetenek, gelişmiş görsel analiz için temel öneme sahiptir ve makinelerin vücut dilini yorumlamasına, track hareketleri track ve dijital kaplamaları gerçek dünyadaki nesnelerle hizalamasına olanak tanır.
Anahtar noktalar, insan veya hayvanların iskelet yapısını haritalayan bir teknik olan poz tahmininde temel veri görevi görür. Omuzlar, dizler ve ayak bilekleri gibi önceden tanımlanmış bir dizi noktayı algılayarak algoritmalar, bir nesnenin tam pozunu gerçek zamanlı olarak yeniden oluşturabilir. Bu süreç, genellikle nesnenin iç şeklini anlamadan nesnenin etrafına bir sınır kutusu çıkaran standart nesne algılamanın ötesine geçer. Bu teknik, nesnenin iç şeklini anlamadan nesnenin etrafına bir sınır kutusu çıkaran standart nesne algılamanın ötesine geçer.
En son teknolojiye sahip Ultralytics gibi modern mimariler, bu kilit noktaları yüksek doğruluk ve hızla tahmin etmek için geliştirilmiştir. Bu modeller, COCO gibi büyük açıklamalı veri kümeleri üzerinde eğitilmiş derin öğrenme (DL) ağlarını kullanarak eklemler ve yüz özellikleriyle ilişkili görsel kalıpları öğrenir. Çıkarım sırasında model, her bir kilit noktanın koordinatlarını geriye doğru hesaplar ve genellikle tahminin güvenilirliğini gösteren bir güven puanı da ekler.
Anahtar noktaları diğer yaygın bilgisayar görme çıktılarıdan ayırmak, bunların benzersiz faydasını anlamak açısından yararlıdır:
track vücut kısımlarını veya nesne özelliklerini track yeteneği, çeşitli sektörlerde çok çeşitli uygulamaların önünü açmaktadır:
Ultralytics veya Python kullanarak, geliştiriciler kolayca anahtar nokta algılamayı uygulayabilirler. Aşağıdaki örnek, önceden eğitilmiş bir YOLO26-pose modelini yüklemeyi ve bir görüntü üzerinde insan iskeletlerini detect için çıkarım yapmayı göstermektedir.
from ultralytics import YOLO
# Load a pre-trained YOLO26 pose estimation model
model = YOLO("yolo26n-pose.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Visualize the results showing detected keypoints and skeletons
for result in results:
result.show() # Display the image with keypoints drawn
# Access keypoint coordinates (x, y, confidence)
keypoints = result.keypoints.data
print(f"Detected keypoints shape: {keypoints.shape}")
Bu basit iş akışı, sofistike bilgisayar görme (CV) uygulamalarının hızlı bir şekilde devreye alınmasını sağlar. Kendi özel kilit nokta modellerini eğitmek isteyen kullanıcılar için (örneğin, endüstriyel makineler veya hayvan türleri üzerindeki detect noktaları detect için), Ultralytics bulutta veri açıklama ve model eğitimi sürecini basitleştirir.
Anahtar nokta algılamayı başarıyla uygulamak için, örtülme (vücut parçasının gizlenmesi) ve çeşitli aydınlatma koşulları gibi zorlukların üstesinden gelinmesi gerekir. Modern modeller, eğitim sırasında sağlam veri artırımı yoluyla bu sorunu çözerek, ağı çeşitli senaryolara maruz bırakır. Ayrıca, anahtar noktaları nesne izleme algoritmalarıyla entegre etmek, video akışlarında zaman içinde bireylerin tutarlı bir şekilde tanımlanmasını sağlar; bu da güvenlik veya davranış analizi gibi uygulamalar için çok önemlidir .