Tutarlı zamansal veri üretimi için otoregresif tahmin ile dizi difüzyonunu birleştiren bir üretken modelleme paradigması olan Diffusion Forcing'i keşfedin.
Difüzyon Zorlaması, 2024 yılında ortaya çıkan ve otoregresif bir sonraki simge tahmini ile tam dizi difüzyonunun güçlü yönlerini birleştiren gelişmiş bir üretken modelleme paradigmasıdır. Bir dizideki farklı adımlara bağımsız ve değişken gürültü seviyeleri uygulayarak, bu teknik makine öğrenimi modellerinin son derece tutarlı zamansal veriler üretmesini sağlar. Ayrık tokenleri tek tek tahmin eden veya tüm dizinin gürültüsünü aynı anda gideren geleneksel yöntemlerin aksine, Difüzyon Zorlaması modelleri sağlam planlayıcılar ve dizi üreticiler olarak hareket etmeleri için eğitir; böylece karmaşık, uzun vadeli bağımlılıklara sahip sürekli durumları yönetebilirler.
Temelde, Diffusion Forcing, tekrarlayan sinir ağlarında kullanılan klasik öğretmen zorlamasından ilham almaktadır. Ancak, bir sonraki adımı tahmin etmek için gerçek değerlere sahip ayrık tokenlar beslemek yerine, kısmen gürültülü sürekli geçmiş verileri bir nedensel dönüştürücüye besler. Model, geçmişe bağlı olarak mevcut durumdaki gürültüyü gidermeyi öğrenir. Bu, ağın kare başına gürültü seviyesini dinamik olarak ayarlamasını sağlar ve hem yerel hassasiyet hem de geniş zamansal farkındalık gerektiren görevler için esnek bir çerçeve sunar.
Bu yaklaşım, öngörülemeyen ortamlara tepki vermesi gereken aynı zamanda uzun vadeli bir plana bağlı kalması gereken akıllı AI ajanları geliştirirken son derece faydalıdır; bu sayede standart otoregresif modellerde sıklıkla görülen birikimli hata sorunlarını ortadan kaldırır.
Difüzyon Zorlaması, birçok karmaşık yapay zeka alanında hızla yaygınlaşmaktadır:
Temel gürültü giderme mekanizmasını paylaşsalar da, Diffusion Forcing standart Difüzyon Modellerinden belirgin şekilde farklıdır. Metinden görüntüye dönüştürme için kullanılanlar gibi geleneksel difüzyon modelleri, genellikle tek bir statik çıktının tüm piksellerini veya gizli değişkenlerini aynı anda gürültüden arındırır. Buna karşın, Diffusion Forcing bir zaman serisini açıkça modelleyerek, ağın nedensel sıra düzenine uymasını sağlar. Bu da onu yörünge tahmini ve eylem tanıma gibi zamansal görevler için çok daha uygun hale getirir.
Diffusion Forcing öncelikle üretken dizi görevlerinde kullanılırken, zamansal dizilerin yorumlanması da modern görüntü işleme süreçlerinde aynı derecede önemlidir. Örneğin, nesne izleme sırasında zamansal tutarlılığı yerel olarak sağlayan Ultralytics kullanarak sıralı video kareleri boyunca track verimli bir şekilde track .
from ultralytics import YOLO
# Load the recommended Ultralytics YOLO26 model for high-speed inference
model = YOLO("yolo26n.pt")
# Process a temporal sequence (video) to maintain consistent object identities
results = model.track(source="path/to/video.mp4", stream=True)
# Iterate through the sequence of frames
for frame_result in results:
# Access temporal tracking IDs for objects in the current state
print(f"Tracked {len(frame_result.boxes)} objects in the current frame.")
Sıra verilerinin toplanmasını genişletmek ve gelişmiş görme modellerini eğitmek isteyen ekipler için, Ultralytics , karmaşık veri kümelerini yönetmek, track ve modelleri uç cihazlara doğrudan dağıtmak için sağlam bulut tabanlı araçlar sunar. İster PyTorch 'ta en son teknoloji nedensel dönüştürücülerle deneyler yapıyor ya da gerçek zamanlı izleme sistemleri dağıtıyor olun, uzamsal ve zamansal verilerin kesişim noktasını ustaca kullanmak, AI'nın geleceği için hayati önem taşır.


Makine öğreniminin geleceği ile yolculuğunuza başlayın