YOLO26 ile tanış: yeni nesil görsel AI.
Ultralytics
Ultralytics Sözlüğüne dön

Diffusion Transformer (DiT)

Diffusion Transformer'ların (DiT) yüksek kaliteli sentez için transformer'ları difüzyon modelleriyle nasıl birleştirdiğini keşfet. Ölçeklendirme, Sora ve Ultralytics YOLO26 hakkında bilgi edin.

Diffusion Transformer (DiT), transformer mimarilerinin sıralı işleme gücü ile difüzyon modellerinin yüksek kaliteli görüntü sentezleme yeteneklerini birleştiren gelişmiş bir üretken mimaridir. Geleneksel olarak difüzyon tabanlı sistemler, girdileri yinelemeli olarak gürültüden arındırmak ve görüntüler oluşturmak için büyük ölçüde evrişimli U-Net mimarilerine güveniyordu. DiT'ler, bu U-Net temelini ölçeklenebilir bir transformer mimarisiyle değiştirerek, tıpkı Vision Transformer (ViT) modellerinin görüntüleri analiz ettiği gibi, görsel verileri bir yama dizisi olarak işler. Bu paradigma değişimi, modellerin daha öngörülebilir bir şekilde ölçeklenmesini sağlar ve giderek daha fotogerçekçi ve tutarlı çıktılar üretmek için artan hesaplama kaynaklarından yararlanır.

Link to this sectionDiT ile Geleneksel Difüzyon Modellerinin Karşılaştırılması#

Geleneksel difüzyon modelleri modern Üretken Yapay Zeka için temel teşkil etse de, U-Net temelleri devasa parametre sayılarına ölçeklenirken genellikle darboğazlarla karşılaşır. Buna karşılık Diffusion Transformer modelleri, Büyük Dil Modellerinde (LLM'ler) gözlemlenen ölçekleme yasalarını doğal olarak devralır. Uzamsal aşağı örnekleme önyargılarını ortadan kaldırarak ve global öz-dikkat mekanizmalarından yararlanarak bir DiT, tüm görüntü veya video karesi genelinde karmaşık uzamsal ilişkileri öğrenir. Bu ölçekleme davranışının kökenlerini daha derinlemesine incelemek için, bu verimlilik kıyaslamalarını oluşturan ve arXiv üzerinde yayınlanan orijinal DiT araştırma makalesine göz atabilirsin.

Link to this sectionGerçek Dünya Uygulamaları#

Diffusion Transformer modellerinin esnekliği ve ölçeklenebilirliği, çeşitli bilgisayarlı görü sektörlerinde önemli atılımları tetikledi:

  1. Yüksek Kaliteli Video Üretimi: DiT mimarisinin en öne çıkan uygulaması, OpenAI'ın Sora modeli gibi metinden videoya dönüştürme modellerinde bulunur. Zamansal tutarlılığı ve 3D alanı anlayarak DiT'ler, fiziksel mantığı kareden kareye koruyan ve dijital içerik oluşturma ile görsel efektlerde devrim yaratan, dakikalar süren hiper-gerçekçi video klipleri sentezleyebilir.

  2. Gelişmiş Görüntü Sentezleme: Ticari tasarım ve yapay zeka sanat üretiminde DiT'ler, benzeri görülmemiş bir metinden görüntüye sadakati sağlar. Yaratıcı ajanslar tarafından, daha önceki U-Net modellerinin başarmakta zorlandığı doğru tipografi ve kompozisyon gerçekçiliğiyle karmaşık istemleri işleyerek son derece hassas pazarlama varlıkları oluşturmak için kullanılırlar.

Link to this sectionTransformer Kavramlarını Uygulama#

DiT'ler öncelikli olarak ağır üretken görevler için kullanılsa da, dayandıkları temel öz-dikkat mekanizmalarını standart derin öğrenme kütüphanelerini kullanarak keşfedebilirsin. Aşağıdaki Python kod parçası, düzleştirilmiş görüntü yamalarının bir DiT ağındaki temel bir işlem olan bir transformer katmanından nasıl geçtiğini göstermek için PyTorch kullanır.

import torch
import torch.nn as nn

# Define a standard Transformer layer acting as a DiT building block
transformer_layer = nn.TransformerEncoderLayer(d_model=256, nhead=8)

# Simulate flattened latent image patches (Sequence Length, Batch Size, Features)
latent_patches = torch.rand(196, 1, 256)

# Apply self-attention to process and relate patches globally
output_features = transformer_layer(latent_patches)
print(f"Processed feature shape: {output_features.shape}")

Dikkat katmanları hakkındaki kapsamlı teknik detaylar için, PyTorch'un Transformer modülleri hakkındaki dokümantasyonu mükemmel bir başlangıç noktası sağlar.

Link to this sectionÜretim ve Tespit Arasında Köprü Kurma#

Diffusion Transformer modelleri içerik üretiminin en uç noktasını temsil eder, ancak birçok kurumsal iş akışı sentez yerine gerçek zamanlı görsel analiz gerektirir. Nesne tespiti ve görüntü segmentasyonu gibi yüksek hızlı çıkarım gerektiren görevler için, hafif ve uç cihazlar için optimize edilmiş modeller endüstri standardı olmaya devam etmektedir.

Ultralytics YOLO26, tam olarak bu analitik bilgisayarlı görü görevleri için tasarlanmıştır. Devasa üretken transformer modellerinin gerektirdiği ağır hesaplama yükünden kaçınarak, kutudan çıktığı anda eşsiz bir hız ve doğruluk sunar. Geliştiriciler, veri kümesi oluşturmadan kurumsal düzeyde dağıtıma zahmetsizce geçmek için, sağlam görsel yapay zeka hatlarını yönetmeye yönelik uçtan uca bir çözüm olan Ultralytics Platform'a güveniyor. Üretken modeller ile analitik modellerin nasıl karşılaştırıldığına dair daha geniş bir perspektif için Google'ın Makine Öğrenimi Hızlandırılmış Kursu mükemmel bir temel bağlam sunar.

Explore solutions

Real-time AI tailored to your operation

Tarımda Yapay Zeka

Ultralytics YOLO modelleri ile akıllı tarıma görsel yapay zekayı dahil et. Daha yüksek ve daha akıllı verim için mahsul izlemeyi, canlı hayvan takibini ve hassas tarımı güçlendir.

Daha fazla bilgi edin
Real-time AI that works with your operation

Otomotivde yapay zeka

Ultralytics YOLO modelleriyle otomotivde bilgisayarlı görü uygula. Görsel yapay zeka, daha akıllı yollar için yol güvenliğini, sürücü destek sistemlerini ve araç otomasyonunu yükseltir.

Daha fazla bilgi edin
Real-time AI that works with your team

Sağlık hizmetlerinde yapay zeka

Ultralytics YOLO modelleri ile sağlık çözümleri oluştur. Sağlık hizmetlerinde vizyon yapay zekası, daha hızlı tıbbi görüntüleme, daha akıllı teşhisler ve hasta takibini destekler.

Daha fazla bilgi edin
Real-time AI that works with your team

Perakendede Yapay Zeka

Ultralytics YOLO modelleri ile perakendeyi yeniden hayal et. Vizyon yapay zekası, envanter takibini, raf izlemeyi, sıra yönetimini ve daha akıllı müşteri içgörülerini destekler.

Daha fazla bilgi edin
Real-time AI that works with your team

Robotikte Yapay Zeka

Daha akıllı makineleri Ultralytics YOLO modelleriyle çalıştır. Robotikte Vision AI; otonom navigasyon, algılama, nesne takibi ve gerçek zamanlı kontrol sağlar.

Daha fazla bilgi edin
Real-time AI that works with your team

Üretimde yapay zeka

Üretimi Ultralytics YOLO modelleriyle optimize et. Vision AI; kalite kontrol, kusur tespiti, kişisel koruyucu ekipman (PPE) uyumluluğu ve montaj hattı otomasyonunu yönetir.

Daha fazla bilgi edin
Real-time AI that works with your team

Lojistikte yapay zeka

Ultralytics YOLO modelleriyle lojistiği kolaylaştır. Görsel yapay zeka, paket denetimi, sıralama, araç takibi ve gerçek zamanlı depo güvenliği izlemeyi sağlar.

Daha fazla bilgi edin
Real-time AI tailored to your operation

Tarımda Yapay Zeka

Ultralytics YOLO modelleri ile akıllı tarıma görsel yapay zekayı dahil et. Daha yüksek ve daha akıllı verim için mahsul izlemeyi, canlı hayvan takibini ve hassas tarımı güçlendir.

Daha fazla bilgi edin
Real-time AI that works with your operation

Otomotivde yapay zeka

Ultralytics YOLO modelleriyle otomotivde bilgisayarlı görü uygula. Görsel yapay zeka, daha akıllı yollar için yol güvenliğini, sürücü destek sistemlerini ve araç otomasyonunu yükseltir.

Daha fazla bilgi edin
Real-time AI that works with your team

Sağlık hizmetlerinde yapay zeka

Ultralytics YOLO modelleri ile sağlık çözümleri oluştur. Sağlık hizmetlerinde vizyon yapay zekası, daha hızlı tıbbi görüntüleme, daha akıllı teşhisler ve hasta takibini destekler.

Daha fazla bilgi edin
Real-time AI that works with your team

Perakendede Yapay Zeka

Ultralytics YOLO modelleri ile perakendeyi yeniden hayal et. Vizyon yapay zekası, envanter takibini, raf izlemeyi, sıra yönetimini ve daha akıllı müşteri içgörülerini destekler.

Daha fazla bilgi edin
Real-time AI that works with your team

Robotikte Yapay Zeka

Daha akıllı makineleri Ultralytics YOLO modelleriyle çalıştır. Robotikte Vision AI; otonom navigasyon, algılama, nesne takibi ve gerçek zamanlı kontrol sağlar.

Daha fazla bilgi edin
Real-time AI that works with your team

Üretimde yapay zeka

Üretimi Ultralytics YOLO modelleriyle optimize et. Vision AI; kalite kontrol, kusur tespiti, kişisel koruyucu ekipman (PPE) uyumluluğu ve montaj hattı otomasyonunu yönetir.

Daha fazla bilgi edin
Real-time AI that works with your team

Lojistikte yapay zeka

Ultralytics YOLO modelleriyle lojistiği kolaylaştır. Görsel yapay zeka, paket denetimi, sıralama, araç takibi ve gerçek zamanlı depo güvenliği izlemeyi sağlar.

Daha fazla bilgi edin
Real-time AI tailored to your operation

Tarımda Yapay Zeka

Ultralytics YOLO modelleri ile akıllı tarıma görsel yapay zekayı dahil et. Daha yüksek ve daha akıllı verim için mahsul izlemeyi, canlı hayvan takibini ve hassas tarımı güçlendir.

Daha fazla bilgi edin
Real-time AI that works with your operation

Otomotivde yapay zeka

Ultralytics YOLO modelleriyle otomotivde bilgisayarlı görü uygula. Görsel yapay zeka, daha akıllı yollar için yol güvenliğini, sürücü destek sistemlerini ve araç otomasyonunu yükseltir.

Daha fazla bilgi edin
Real-time AI that works with your team

Sağlık hizmetlerinde yapay zeka

Ultralytics YOLO modelleri ile sağlık çözümleri oluştur. Sağlık hizmetlerinde vizyon yapay zekası, daha hızlı tıbbi görüntüleme, daha akıllı teşhisler ve hasta takibini destekler.

Daha fazla bilgi edin
Real-time AI that works with your team

Perakendede Yapay Zeka

Ultralytics YOLO modelleri ile perakendeyi yeniden hayal et. Vizyon yapay zekası, envanter takibini, raf izlemeyi, sıra yönetimini ve daha akıllı müşteri içgörülerini destekler.

Daha fazla bilgi edin
Real-time AI that works with your team

Robotikte Yapay Zeka

Daha akıllı makineleri Ultralytics YOLO modelleriyle çalıştır. Robotikte Vision AI; otonom navigasyon, algılama, nesne takibi ve gerçek zamanlı kontrol sağlar.

Daha fazla bilgi edin
Real-time AI that works with your team

Üretimde yapay zeka

Üretimi Ultralytics YOLO modelleriyle optimize et. Vision AI; kalite kontrol, kusur tespiti, kişisel koruyucu ekipman (PPE) uyumluluğu ve montaj hattı otomasyonunu yönetir.

Daha fazla bilgi edin
Real-time AI that works with your team

Lojistikte yapay zeka

Ultralytics YOLO modelleriyle lojistiği kolaylaştır. Görsel yapay zeka, paket denetimi, sıralama, araç takibi ve gerçek zamanlı depo güvenliği izlemeyi sağlar.

Daha fazla bilgi edin

Yapay zekanın geleceğini birlikte inşa edelim!

Yolculuğuna makine öğreniminin geleceğiyle başla