Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Uzamsal Zeka

Uzamsal zeka sayesinde yapay zekanın 3D dünyayı nasıl algıladığını ve bu dünyada nasıl hareket ettiğini keşfedin. Ultralytics ve Ultralytics ile uzamsal farkındalığa sahip sistemler oluşturmayı öğrenin.

Uzamsal zeka, yapay zeka sisteminin fiziksel dünyayı üç boyutlu olarak algılama, anlama ve yönlendirme yeteneğini ifade eder. Genellikle 2D görüntüleri statik anlık görüntüler olarak analiz eden geleneksel bilgisayar görüşünden farklı olarak, uzamsal zeka, dinamik bir ortamda derinlik, geometri, hareket ve nesneler arasındaki ilişkiler hakkında akıl yürütmeyi içerir. Bu, makinelerin sadece pikselleri "görmesini" değil, bir sahnenin fiziksel bağlamını anlamasını da sağlar ve gerçek dünyayla daha etkili bir şekilde etkileşime girmesini mümkün kılar. Bu yetenek, dijital görsel veriler ile fiziksel eylemler arasında bir köprü görevi görür ve gelişmiş yapay zeka ajanları ve robotik sistemler için bir temel taşıdır. AI ajanları ve robotik sistemler.

Mekansal Zekanın Temel Bileşenleri

İnsan benzeri bir uzay anlayışına ulaşmak için, bir yapay zeka sistemi birbiriyle bağlantılı birkaç teknoloji ve kavrama dayanır.

  • Derinlik Algılama ve 3D Yeniden Yapılandırma: Sistemler, kameralardan gelen 2D girdileri 3D temsillere dönüştürmelidir. Monoküler derinlik tahmini gibi teknikler, modellerin tek bir görüntüden mesafeyi tahmin etmesine olanak sağlarken, 3D nesne algılama, o alan içindeki öğelerin hacmini ve yönünü belirlemeye yardımcı olur.
  • SLAM (Eşzamanlı Yerelleştirme ve Haritalama): Bu, robot veya drone gibi bir cihazın, içindeki kendi track bilinmeyen bir ortamı haritalamasını sağlar. Modern yaklaşımlar, değişen aydınlatma koşullarında sağlamlığı artırmak için genellikle görsel SLAM'ı derin öğrenme ile entegre eder.
  • Geometrik Akıl Yürütme: Algılamanın ötesinde, sistem fiziksel kısıtlamaları anlamalıdır — bir bardağın masanın üzerinde durduğunu veya bir kapının geçmek için açılması gerektiğini bilmelidir. Bu genellikle nesnelerin veya insan eklemlerinin track gerçek zamanlı olarak track için poz tahminini içerir.
  • Somutlaştırılmış AI: Bu kavram, algıyı eylemle ilişkilendirir. Somutlaştırılmış bir ajan sadece gözlemlemekle kalmaz; uzamsal verileri kullanarak hareketleri planlar, engelleri önler ve nesneleri manipüle eder, tıpkı robotik alanındaki AI'nın üretim katında işlev görmesi gibi.

Gerçek Dünya Uygulamaları

Uzamsal zeka, makinelerin karmaşık ortamlarda özerk bir şekilde çalışmasını sağlayarak endüstrileri dönüştürüyor.

  • Otonom Robotik ve Lojistik: Depolamada robotlar, uzamsal zeka kullanarak kalabalık koridorlarda gezinir, nesne algılama özelliği ile belirli paketleri tanımlar ve bunları konveyörlere hassas bir şekilde yerleştirir. Robotlar, ürünü ezmeden güvenli bir şekilde tutmak için kıskaçları ile kutu arasındaki uzamsal ilişkiyi hesaplamalıdır.
  • Artırılmış Gerçeklik (AR) ve Karma Gerçeklik: Akıllı gözlükler gibi cihazlar, dijital içeriği fiziksel dünyaya bağlamak için uzamsal bilgi işlem kullanır. Örneğin, bir AR bakım uygulaması, onarım talimatlarını doğrudan belirli bir motor parçasına yerleştirebilir. Bu, kullanıcının başını hareket ettirirken grafiklerin hizalı kalmasını sağlamak için hassas nesne takibi gerektirir. Artırılmış gerçeklik, gerçek dünyayı dijital içerikle zenginleştirir. Karma gerçeklik ise, dijital içeriği gerçek dünyaya yerleştirir.

Uzamsal Zeka ve Bilgisayar Görme

Yakından ilişkili olmakla birlikte, uzamsal zeka ile bilgisayar görüşünü birbirinden ayırmak yararlıdır. Bilgisayar Görüşü, dijital görüntülerden, videolardan ve diğer görsel girdilerden anlamlı bilgiler elde etmeye odaklanan daha geniş bir alandır. Sınıflandırma veya temel 2D algılama gibi görevleri içerir. Uzamsal Zeka, bilgisayar görüşünün özel bir alt kümesi veya evrimidir ve özellikle uzay ve fizik boyutunu ekler. "Bu nesne nedir?" (Görüş) sorusundan "Bu nesne nerede, nasıl yönlendirilmiş ve onunla nasıl etkileşime girebilirim?" (Uzamsal Zeka) sorusuna geçer.

Ultralytics ile Mekansal Farkındalık Uygulaması

Geliştiriciler, Ultralytics kullanarak uzamsal zeka sistemlerinin temelini oluşturabilirler. Ultralytics gibi modelleri Yönlendirilmiş Sınırlayıcı Kutu (OBB) algılama veya poz tahmin gibi görevler üzerinde eğiterek, mühendisler gerekli geometrik verileri alt robotik veya AR uygulamalarına sağlayabilirler.

İşte, 3D uzayda insan hareketini anlamada kritik bir adım olan poz tahmin modelini kullanarak uzamsal anahtar noktaları çıkarmak için basit bir örnek: :

from ultralytics import YOLO

# Load a pre-trained YOLO26 pose estimation model
model = YOLO("yolo26n-pose.pt")

# Run inference on an image to detect human keypoints
results = model("path/to/image.jpg")

# Access the keypoints (x, y coordinates and confidence)
for result in results:
    # keypoints.xy returns a tensor of shape (N, 17, 2)
    keypoints = result.keypoints.xy
    print(f"Detected keypoints for {len(keypoints)} persons.")

Görme Dönüştürücüler (ViT) ve temel modellerdeki son gelişmeler, bu alanı daha da hızlandırarak, sistemlerin kapsamlı bir yeniden eğitim olmadan farklı ortamlarda uzamsal anlayışı genelleştirmesine olanak tanıyor. Stanford'un HAI ve Google gibi grupların araştırmaları devam ettikçe, uzamsal zekanın yeni nesil akıllı cihazlarda standart bir özellik haline gelmesini bekleyebiliriz.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın