Uzamsal zeka sayesinde yapay zekanın 3D dünyayı nasıl algıladığını ve bu dünyada nasıl hareket ettiğini keşfedin. Ultralytics ve Ultralytics ile uzamsal farkındalığa sahip sistemler oluşturmayı öğrenin.
Uzamsal zeka, yapay zeka sisteminin fiziksel dünyayı üç boyutlu olarak algılama, anlama ve yönlendirme yeteneğini ifade eder. Genellikle 2D görüntüleri statik anlık görüntüler olarak analiz eden geleneksel bilgisayar görüşünden farklı olarak, uzamsal zeka, dinamik bir ortamda derinlik, geometri, hareket ve nesneler arasındaki ilişkiler hakkında akıl yürütmeyi içerir. Bu, makinelerin sadece pikselleri "görmesini" değil, bir sahnenin fiziksel bağlamını anlamasını da sağlar ve gerçek dünyayla daha etkili bir şekilde etkileşime girmesini mümkün kılar. Bu yetenek, dijital görsel veriler ile fiziksel eylemler arasında bir köprü görevi görür ve gelişmiş yapay zeka ajanları ve robotik sistemler için bir temel taşıdır. AI ajanları ve robotik sistemler.
İnsan benzeri bir uzay anlayışına ulaşmak için, bir yapay zeka sistemi birbiriyle bağlantılı birkaç teknoloji ve kavrama dayanır.
Uzamsal zeka, makinelerin karmaşık ortamlarda özerk bir şekilde çalışmasını sağlayarak endüstrileri dönüştürüyor.
Yakından ilişkili olmakla birlikte, uzamsal zeka ile bilgisayar görüşünü birbirinden ayırmak yararlıdır. Bilgisayar Görüşü, dijital görüntülerden, videolardan ve diğer görsel girdilerden anlamlı bilgiler elde etmeye odaklanan daha geniş bir alandır. Sınıflandırma veya temel 2D algılama gibi görevleri içerir. Uzamsal Zeka, bilgisayar görüşünün özel bir alt kümesi veya evrimidir ve özellikle uzay ve fizik boyutunu ekler. "Bu nesne nedir?" (Görüş) sorusundan "Bu nesne nerede, nasıl yönlendirilmiş ve onunla nasıl etkileşime girebilirim?" (Uzamsal Zeka) sorusuna geçer.
Geliştiriciler, Ultralytics kullanarak uzamsal zeka sistemlerinin temelini oluşturabilirler. Ultralytics gibi modelleri Yönlendirilmiş Sınırlayıcı Kutu (OBB) algılama veya poz tahmin gibi görevler üzerinde eğiterek, mühendisler gerekli geometrik verileri alt robotik veya AR uygulamalarına sağlayabilirler.
İşte, 3D uzayda insan hareketini anlamada kritik bir adım olan poz tahmin modelini kullanarak uzamsal anahtar noktaları çıkarmak için basit bir örnek: :
from ultralytics import YOLO
# Load a pre-trained YOLO26 pose estimation model
model = YOLO("yolo26n-pose.pt")
# Run inference on an image to detect human keypoints
results = model("path/to/image.jpg")
# Access the keypoints (x, y coordinates and confidence)
for result in results:
# keypoints.xy returns a tensor of shape (N, 17, 2)
keypoints = result.keypoints.xy
print(f"Detected keypoints for {len(keypoints)} persons.")
Görme Dönüştürücüler (ViT) ve temel modellerdeki son gelişmeler, bu alanı daha da hızlandırarak, sistemlerin kapsamlı bir yeniden eğitim olmadan farklı ortamlarda uzamsal anlayışı genelleştirmesine olanak tanıyor. Stanford'un HAI ve Google gibi grupların araştırmaları devam ettikçe, uzamsal zekanın yeni nesil akıllı cihazlarda standart bir özellik haline gelmesini bekleyebiliriz.