Point Tracking
Bilgisayarlı görüde nokta takibinin temellerini keşfet. Ultralytics YOLO26 ve gelişmiş AI modellerinin robotik ve VFX için hassas hareketleri nasıl takip ettiğini öğren.
Nokta takibi, bilgisayarlı görüde temel bir görev olup, bir video dizisindeki belirli, yerelleştirilmiş noktaların (örneğin piksel veya ayırt edici özellikler) zaman içindeki hareketini tahmin etmeyi ve izlemeyi içerir. Nesne takibi genel varlıkların konumunu sınırlayıcı kutular veya segmentasyon maskeleri kullanarak izlerken, nokta takibi çok daha ince, piksel altı düzeyde bir detaya odaklanır. Yapay zeka (AI) sistemleri, bu kesin konumlar arasındaki karşılıkları tanımlayıp koruyarak, karmaşık hareket analizi gerektiren ileri düzey video anlama görevlerini gerçekleştirebilir.
Link to this sectionNokta Takibini Anlamak#
Dinamik bir sahnede noktaları doğru bir şekilde takip etmek oldukça zordur. Takip edilen noktalar sıklıkla nesnelerin kameranın görüşünü geçici olarak engellediği tıkanmalara maruz kalır veya görüş alanından tamamen çıkabilirler. Ayrıca, aydınlatmadaki değişimler, perspektif kaymaları ve hızlı hareketler bir noktanın görsel görünümünü önemli ölçüde değiştirebilir.
Tarihsel olarak, Lucas-Kanade optik akış gibi klasik algoritmalar bu görevleri yönetiyordu. Ancak günümüz yaklaşımları güçlü derin öğrenme mimarilerini kullanmaktadır. Google DeepMind'ın TAPIR (Başlatma ve İyileştirme ile Herhangi Bir Noktayı İzleme) ve Meta AI'ın CoTracker3 gibi büyük araştırma kuruluşlarının yakın zamandaki yenilikleri bu alanda devrim yarattı. Noktaları bağımsız olarak takip eden eski yöntemlerin aksine, CoTracker3 gibi modeller, aynı nesneye ait noktalar arasındaki fiziksel bağımlılıklardan yararlanarak çok sayıda noktanın ortak takibini gerçekleştirmek için Transformer mimarilerini kullanır. Bu en son teknoloji modeller, çok daha düşük veri gereksinimiyle yüksek doğruluklu sistemleri eğitmek için gerçek dünya videolarında sözde etiketlemeden yararlanır.
Link to this sectionNokta Takibi ve İlgili Görevler#
Yakından ilişkili olsalar da, nokta takibi diğer bilgisayarlı görü görevlerinden önemli ölçüde farklıdır:
- Nesne Takibi: Tüm nesnelere (örneğin bir kişi veya araba) benzersiz kimlikler atar ve onları takip eder. Büyük ölçüde Ultralytics YOLO26 gibi nesne algılama modellerine dayanır.
- Poz Tahmini: Rastgele pikseller yerine belirli anlamsal anahtar noktaları (insan eklemleri gibi) takip eder. Nokta takibiyle benzerlikler taşısa da, poz tahmini nesnenin yapısal çerçevesinin anlamsal olarak anlaşılmasını gerektirir.
Link to this sectionGerçek Dünya Uygulamaları#
Nokta takibi, çeşitli ileri düzey uygulamalar için kritik bir kolaylaştırıcıdır:
- 3B Yeniden Oluşturma ve Hareketten Yapı (SfM): Sistemler, farklı kamera açılarındaki veya video karelerindeki belirli özellikleri takip ederek derinliği çıkarabilir ve artırılmış gerçeklik (AR) haritalaması için gerekli olan ortamların doğru 3B yeniden oluşturmalarını inşa edebilir.
- Robotics and Autonomous Navigation: Autonomous vehicles and robots use point tracking (often via visual odometry) to understand their movement relative to their surroundings, calculate trajectories, and navigate safely through complex dynamic environments.
- Video Düzenleme ve Özel Efektler: Profesyonel görsel efekt (VFX) yazılımları, titrek görüntüleri sabitlemek veya bilgisayar tarafından oluşturulan görüntüleri (CGI) fiziksel bir sahnedeki hareketli nesnelere sorunsuz bir şekilde sabitlemek için nokta takibine büyük ölçüde güvenir.
Link to this sectionUltralytics ile Anahtar Noktaları Takip Etme#
Genel nokta takipçileri rastgele görsel pikselleri takip ederken, ultralytics paketinin poz takibi yeteneklerini kullanarak belirli yapısal anahtar noktaları (bir kişinin gözleri, omuzları veya bilekleri gibi) takip edebilirsin. Önerilen YOLO26 modeli, hareket analizi için ideal olan yüksek hızlı, uçtan uca anahtar nokta takibi sağlar.
from ultralytics import YOLO
# Load the recommended YOLO26 pose model for keypoint tracking
model = YOLO("yolo26n-pose.pt")
# Perform pose tracking on a video stream to follow human keypoints over time
results = model.track(source="video.mp4", stream=True)
# Iterate through the stream to process temporal keypoint tracking data
for frame_result in results:
# Each keypoint maintains its association across frames
print(f"Tracked {len(frame_result.keypoints)} human skeletons in current frame.")Bilgisayarlı görü iş akışlarını ölçekli bir şekilde dağıtırken, Ultralytics Platform, veri etiketleme, model eğitimi ve sorunsuz dağıtım için modern bir çözüm sunarak çeşitli uç ve bulut ortamlarında güvenilir performans sağlar.






