2D görüntülerden 3D perspektifler oluşturmak için yeni görüntü sentezi yöntemlerini keşfedin. Sağlam bir yapay zeka sistemi için Ultralytics modellerini sentezlenmiş verilerle nasıl geliştirebileceğinizi öğrenin.
Sınırlı sayıda 2B görüntüden bir 3B sahnenin yeni ve daha önce görülmemiş bakış açılarını oluşturma süreci, bilgisayar görme (CV) alanında gelişmiş bir görevdir. Bu teknik, altta yatan geometri, aydınlatma, dokular ve örtülmeleri doğru bir şekilde tahmin edebilmek için büyük ölçüde derin öğrenmeye (DL) dayanır. Nesnelerin ve ortamların kaydedilmemiş açılardan nasıl görünmesi gerektiğini tahmin ederek, bu teknoloji 2B görüntüleme ile sürükleyici 3B sahne temsilinin arasındaki boşluğu doldurur.
Tarihsel olarak, yeni bakış açılarının oluşturulması klasik çoklu görüşlü stereo ve geleneksel fotogrametri tekniklerine dayanıyordu; bu teknikler genellikle karmaşık ışıklandırma koşulları ve yansıtıcı yüzeylerle başa çıkmakta zorlanıyordu. Günümüzde ise bu alanda sinir ağı tabanlı görüntü işleme hakimdir. Bu geniş kavramı, Neural Radiance Fields (NeRF) ve Gaussian Splatting gibi belirli mimari uygulamalardan ayırt etmek önemlidir. Bu terimler, sahneleri görüntülemek için belirli matematiksel ve yapısal yöntemleri ifade etse de, her ikisinin de çözdüğü genel amaç yeni görünümler oluşturmaktır.
2024 ve 2025 yıllarında kaydedilen son gelişmeler, üretken difüzyon modellerini doğrudan sentez sürecine entegre etmiştir. Bu yeni mimariler, sıfır atışlı öğrenme yeteneklerini mümkün kılar ve modellerin, açık bir 3B ağ yeniden yapılandırmasına gerek kalmadan, eksik detayları doğrudan piksel uzayında inandırıcı bir şekilde tamamlamasına olanak tanır. Bu, geleneksel olarak bilgisayar grafikleri işlemeyle ilişkili hesaplama yükünü azaltır ve foto-gerçekçi çıktıların oluşturulmasını hızlandırır.
Görünmeyen bakış açılarını ortaya çıkarma yeteneği, birçok sektörde derin etkileri olan bir konudur:
Yeni görüşler oluşturulduktan sonra, genellikle yapısal analiz gerektirir. Ultralytics kullanarak, geliştiriciler bu yapay olarak oluşturulan veri kümeleri için veri toplama ve etiketleme işlemlerini sorunsuz bir şekilde yönetebilirler.
Ultralytics gibi en yeni nesil modelleri bu farklı bakış açılarıyla eğiterek, nesne algılama, görüntü segmentasyonu ve duruş tahmin görevlerinin doğruluğunu önemli ölçüde artırabilirsiniz. Model, daha önce yakalanmamış açılardan nesneleri tanımayı öğrendiği için, ortaya çıkan modelin gerçek dünya senaryolarında çok daha dayanıklı hale gelmesini sağlar.
Oluşturulan görüntüyü hızlı bir şekilde analiz etmek için, işlenmiş görüntüyü doğrudan önceden eğitilmiş bir modele aktarabilirsiniz:
import cv2
from ultralytics import YOLO
# Load the highly recommended Ultralytics YOLO26 model
model = YOLO("yolo26n.pt")
# Load a synthesized novel view using the OpenCV library
synthesized_view = cv2.imread("novel_view_render.jpg")
# Perform real-time object detection on the newly generated perspective
results = model(synthesized_view)
# Display the detection results
results[0].show()
İster PyTorch3D kütüphanesini kullanarak ortamları işliyor olun, ister tensor birimleri (TPU'lar) gibi donanımlarda çıkarım işlemlerini hızlandırıyor olun, yeni görünümlerin oluşturulması ve ardından analiz edilmesi, yapay zeka araştırmalarının en ön saflarında yer almaya devam ediyor; bu çalışmalar, son zamanlarda yayınlanan akademik ön baskılar ve devasa bulut tabanlı makine öğrenimi kümeleri tarafından sürekli olarak destekleniyor.
Makine öğreniminin geleceği ile yolculuğunuza başlayın