Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Yeni Görünüm Sentezi (NVS)

2D görüntülerden 3D perspektifler oluşturmak için yeni görüntü sentezi yöntemlerini keşfedin. Sağlam bir yapay zeka sistemi için Ultralytics modellerini sentezlenmiş verilerle nasıl geliştirebileceğinizi öğrenin.

Sınırlı sayıda 2B görüntüden bir 3B sahnenin yeni ve daha önce görülmemiş bakış açılarını oluşturma süreci, bilgisayar görme (CV) alanında gelişmiş bir görevdir. Bu teknik, altta yatan geometri, aydınlatma, dokular ve örtülmeleri doğru bir şekilde tahmin edebilmek için büyük ölçüde derin öğrenmeye (DL) dayanır. Nesnelerin ve ortamların kaydedilmemiş açılardan nasıl görünmesi gerektiğini tahmin ederek, bu teknoloji 2B görüntüleme ile sürükleyici 3B sahne temsilinin arasındaki boşluğu doldurur.

Gelişim ve Son Dönemdeki Gelişmeler

Tarihsel olarak, yeni bakış açılarının oluşturulması klasik çoklu görüşlü stereo ve geleneksel fotogrametri tekniklerine dayanıyordu; bu teknikler genellikle karmaşık ışıklandırma koşulları ve yansıtıcı yüzeylerle başa çıkmakta zorlanıyordu. Günümüzde ise bu alanda sinir ağı tabanlı görüntü işleme hakimdir. Bu geniş kavramı, Neural Radiance Fields (NeRF) ve Gaussian Splatting gibi belirli mimari uygulamalardan ayırt etmek önemlidir. Bu terimler, sahneleri görüntülemek için belirli matematiksel ve yapısal yöntemleri ifade etse de, her ikisinin de çözdüğü genel amaç yeni görünümler oluşturmaktır.

2024 ve 2025 yıllarında kaydedilen son gelişmeler, üretken difüzyon modellerini doğrudan sentez sürecine entegre etmiştir. Bu yeni mimariler, sıfır atışlı öğrenme yeteneklerini mümkün kılar ve modellerin, açık bir 3B ağ yeniden yapılandırmasına gerek kalmadan, eksik detayları doğrudan piksel uzayında inandırıcı bir şekilde tamamlamasına olanak tanır. Bu, geleneksel olarak bilgisayar grafikleri işlemeyle ilişkili hesaplama yükünü azaltır ve foto-gerçekçi çıktıların oluşturulmasını hızlandırır.

Gerçek Dünya Uygulamaları

Görünmeyen bakış açılarını ortaya çıkarma yeteneği, birçok sektörde derin etkileri olan bir konudur:

  • Sürükleyici Medya: Modern mekânsal bilgi işlem alanında bu teknoloji, sadece birkaç sıradan akıllı telefon fotoğrafından keşfedilebilir sanal gerçeklik ortamları ve etkileşimli artırılmış gerçeklik uygulamaları oluşturmak için temel öneme sahiptir.
  • E-ticaret: Perakendeciler, az sayıda 2D görüntüden kapsamlı 3D ürün sunumları oluşturabilir ve böylece müşterilerin ürünleri her açıdan dijital olarak inceleyebilmesini sağlar.
  • Simülasyon ve Eğitim: Otonom araçlar ve robotik alanında, gerçek dünyadaki olağan dışı durumları toplamak hem tehlikeli hem de maliyetlidir. Mühendisler, mevcut sokak veya depo verilerinden yeni bakış açıları oluşturarak, bir sahnenin sınırsız varyasyonunu yaratabilirler. Bu, güçlü bir veri zenginleştirme yöntemi olarak işlev görür ve son aşamadaki yapay zeka (AI) navigasyon modellerinin sağlamlığını artırır.

Ultralytics Akışlarıyla Entegrasyon

Yeni görüşler oluşturulduktan sonra, genellikle yapısal analiz gerektirir. Ultralytics kullanarak, geliştiriciler bu yapay olarak oluşturulan veri kümeleri için veri toplama ve etiketleme işlemlerini sorunsuz bir şekilde yönetebilirler.

Ultralytics gibi en yeni nesil modelleri bu farklı bakış açılarıyla eğiterek, nesne algılama, görüntü segmentasyonu ve duruş tahmin görevlerinin doğruluğunu önemli ölçüde artırabilirsiniz. Model, daha önce yakalanmamış açılardan nesneleri tanımayı öğrendiği için, ortaya çıkan modelin gerçek dünya senaryolarında çok daha dayanıklı hale gelmesini sağlar.

Oluşturulan görüntüyü hızlı bir şekilde analiz etmek için, işlenmiş görüntüyü doğrudan önceden eğitilmiş bir modele aktarabilirsiniz:

import cv2
from ultralytics import YOLO

# Load the highly recommended Ultralytics YOLO26 model
model = YOLO("yolo26n.pt")

# Load a synthesized novel view using the OpenCV library
synthesized_view = cv2.imread("novel_view_render.jpg")

# Perform real-time object detection on the newly generated perspective
results = model(synthesized_view)

# Display the detection results
results[0].show()

İster PyTorch3D kütüphanesini kullanarak ortamları işliyor olun, ister tensor birimleri (TPU'lar) gibi donanımlarda çıkarım işlemlerini hızlandırıyor olun, yeni görünümlerin oluşturulması ve ardından analiz edilmesi, yapay zeka araştırmalarının en ön saflarında yer almaya devam ediyor; bu çalışmalar, son zamanlarda yayınlanan akademik ön baskılar ve devasa bulut tabanlı makine öğrenimi kümeleri tarafından sürekli olarak destekleniyor.

Hadi birlikte yapay zekanın geleceğini şekillendirelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın