Bilgisayar görme alanında nokta izlemenin temellerini keşfedin. Ultralytics ve gelişmiş yapay zeka modellerinin robotik ve görsel efektler için hareketleri nasıl track öğrenin.
Nokta izleme, bilgisayar görme alanında temel bir görevdir ve zaman içinde bir video dizisindeki ardışık kareler boyunca belirli, konumlandırılmış noktaların ( pikseller veya belirgin özellikler gibi) hareketinin tahmin edilmesini ve izlenmesini içerir. Sınırlayıcı kutular veya bölümleme maskeleri kullanarak tüm nesnelerin genel konumunu izleyen nesne izlemeden farklı olarak, nokta izleme çok daha ince, piksel altı düzeyde ayrıntılara odaklanır. Bu kesin konumlar arasındaki karşılıkları belirleyip koruyarak, yapay zeka (AI) sistemleri, karmaşık hareket analizi gerektiren gelişmiş video anlama görevlerini gerçekleştirebilir.
Dinamik bir sahnedeki noktaları doğru bir şekilde izlemek oldukça zordur. İzlenen noktalar sıklıkla görüntü engellenmesisorunuyla karşılaşır —yani nesneler kameranın görüş alanını geçici olarak kapatır— ya da görüş alanından tamamen çıkabilir. Ayrıca, ışıklandırmadaki değişiklikler, perspektif kaymaları ve hızlı hareketler, bir noktanın görsel görünümünü önemli ölçüde değiştirebilir.
Tarihsel olarak, Lucas-Kanade optik akışı gibi klasik algoritmalar bu görevleri yerine getiriyordu. Ancak modern yaklaşımlar, güçlü derin öğrenme mimarileri kullanmaktadır. Google TAPIR (Tracking Any Point with Initialization and Refinement) ve Meta AI’nın CoTracker3 gibi büyük araştırma kuruluşlarından gelen son yenilikler, bu alanda devrim niteliğinde gelişmeler sağlamıştır. Noktaları bağımsız olarak izleyen eski yöntemlerin aksine, CoTracker3 gibi modeller, aynı nesneye ait noktalar arasındaki fiziksel bağımlılıklardan yararlanarak birden fazla noktanın ortak izlemesini gerçekleştirmek için dönüştürücüler kullanır. Bu son teknoloji modeller ayrıca, gerçek dünya videolarında sözde etiketlemeyi kullanarak, veri gereksinimlerini önemli ölçüde azaltan yüksek doğruluklu sistemler eğitir.
Nokta izleme, diğer bilgisayar görme görevleriyle yakından ilişkili olsa da, bunlardan önemli ölçüde farklılık gösterir:
Nokta izleme, çeşitli gelişmiş uygulamalar için hayati bir unsurdur:
Genel nokta izleme sistemleri rastgele görsel pikselleri takip ederken,
bu sistemin poz izleme özelliklerini kullanarak track yapısal anahtar noktaları (örneğin bir
kişinin gözleri, omuzları veya bilekleri) track ultralytics paket.
Önerilen YOLO26 Bu model, hareket analizi için ideal olan yüksek hızlı, uçtan uca
anahtar nokta izleme özelliği sunar.
from ultralytics import YOLO
# Load the recommended YOLO26 pose model for keypoint tracking
model = YOLO("yolo26n-pose.pt")
# Perform pose tracking on a video stream to follow human keypoints over time
results = model.track(source="video.mp4", stream=True)
# Iterate through the stream to process temporal keypoint tracking data
for frame_result in results:
# Each keypoint maintains its association across frames
print(f"Tracked {len(frame_result.keypoints)} human skeletons in current frame.")
Bilgisayar görme iş akışlarını geniş ölçekte devreye alırken, Ultralytics veri etiketleme, model eğitimi ve sorunsuz devreye alma için entegre bir çözüm sunarak, çeşitli kenar ve bulut ortamlarında güvenilir performans sağlar.
Makine öğreniminin geleceği ile yolculuğunuza başlayın