YOLO26 ile tanış: yeni nesil görsel AI.
Ultralytics
Ultralytics Sözlüğüne dön

Mixture of Experts (MoE)

Uzman Karışımı (MoE) mimarisini keşfet. Gating ağlarının ve seyrek katmanların sinir ağlarını yüksek performanslı yapay zeka ve bilgisayarlı görü için nasıl ölçeklendirdiğini öğren.

Mixture of Experts (MoE) is a specialized architectural design in deep learning that allows models to scale to massive sizes without a proportional increase in computational cost. Unlike a standard dense neural network (NN), where every parameter is active for every input, an MoE model employs a technique called conditional computation. This approach dynamically activates only a small subset of the network's components—referred to as "experts"—based on the specific characteristics of the input data. By doing so, MoE architectures enable the creation of powerful foundation models that can possess trillions of parameters while maintaining the inference latency and operational speed of much smaller systems.

Link to this sectionMoE'nin Temel Mekanizmaları#

Bir Uzman Karışımı modelinin verimliliği, standart yoğun katmanların seyrek bir MoE katmanı ile değiştirilmesinden kaynaklanır. Bu katman genellikle bilgiyi verimli bir şekilde işlemek için birlikte çalışan iki ana unsurdan oluşur:

  • Uzmanlar: Bunlar, genellikle basit ileri beslemeli sinir ağları (FFN) olan bağımsız alt ağlardır. Her uzman, verilerin farklı yönlerini işleme konusunda uzmanlaşmıştır. Doğal dil işleme (NLP) bağlamında, bir uzman dilbilgisini işleme konusunda uzmanlaşırken, diğeri olgusal geri alma veya kod sözdizimi üzerine odaklanabilir.
  • Gating Ağı (Yönlendirici): Yönlendirici, veriler için bir trafik kontrolörü görevi görür. Bir görüntü yaması veya metin belirteci gibi bir girdi katmana girdiğinde, yönlendirici bir softmax fonksiyonu kullanarak bir olasılık puanı hesaplar. Daha sonra bu girdiyi yalnızca en yüksek puanlara sahip "En İyi K" (genellikle bir veya iki) uzmana yönlendirir. Bu, modelin enerjisini yalnızca en alakalı parametrelere harcamasını sağlar.

Link to this sectionModel Topluluklarından Farkı#

Her iki kavram da birden fazla alt model kullanmayı içerse de, bir Uzman Karışımını bir model topluluğundan ayırmak çok önemlidir. Geleneksel bir toplulukta, gruptaki her model aynı girdiyi işler ve doğruluğu en üst düzeye çıkarmak için sonuçlarının ortalaması alınır veya oylanır. Bu yaklaşım, hesaplama maliyetini model sayısıyla doğrusal olarak artırır.

Buna karşılık MoE, farklı girdilerin farklı yollardan geçtiği tek, birleşik bir modeldir. Seyrek bir MoE, herhangi bir çıkarsama adımı için toplam parametrelerin yalnızca bir kısmını çalıştırarak ölçeklenebilirlik ve verimlilik hedefler. Bu, yoğun topluluklarla ilişkili fahiş maliyetler olmadan çok miktarda eğitim verisi üzerinde eğitime olanak tanır.

Link to this sectionGerçek Dünya Uygulamaları#

MoE mimarisi, özellikle çok görevli yetenekler ve geniş bilgi tutma gerektiren senaryolarda modern yüksek performanslı yapay zeka için bir temel taşı haline gelmiştir.

  1. Çok Dilli Dil Modelleri: Mistral AI'nın Mixtral 8x7B gibi önde gelen modeller, çeşitli dil görevlerinde başarılı olmak için MoE'den yararlanır. Belirteçleri uzmanlaşmış uzmanlara yönlendirerek, bu sistemler tek bir model yapısı içinde çeviri, özetleme ve kodlama görevlerini yerine getirebilir ve benzer aktif parametre sayılarına sahip yoğun modellerden daha iyi performans gösterebilir.

  2. Ölçeklenebilir Bilgisayarlı Görü: Bilgisayarlı görü (CV) alanında araştırmacılar, devasa görü omurgaları oluşturmak için MoE uygular. Vision MoE (V-MoE) mimarisi, uzmanların farklı görsel özellikleri tanıma konusunda nasıl uzmanlaşabileceğini göstererek ImageNet gibi kıyaslamalarda performansı etkili bir şekilde ölçeklendirir. YOLO26 gibi yüksek düzeyde optimize edilmiş yoğun modeller, tahmin edilebilir bellek ayak izleri nedeniyle gerçek zamanlı uç tespiti için standart olmaya devam ederken, MoE araştırmaları sunucu tarafı görsel anlamanın sınırlarını zorlamaya devam ediyor.

Link to this sectionYönlendirme Mantığı Örneği#

Gating ağının uzmanları nasıl seçtiğini anlamak için bu basitleştirilmiş PyTorch örneğini düşün. Belirli bir girdi için en alakalı uzmanı seçen bir yönlendirme mekanizmasını gösterir.

import torch
import torch.nn as nn

# A simple router deciding between 4 experts for input dimension of 10
num_experts = 4
input_dim = 10
router = nn.Linear(input_dim, num_experts)

# Batch of 2 inputs
input_data = torch.randn(2, input_dim)

# Calculate scores and select the top-1 expert for each input
logits = router(input_data)
probs = torch.softmax(logits, dim=-1)
weights, indices = torch.topk(probs, k=1, dim=-1)

print(f"Selected Expert Indices: {indices.flatten().tolist()}")

Link to this sectionEğitim ve Dağıtımdaki Zorluklar#

Avantajlarına rağmen, MoE modelleri eğitim sürecine özgü zorluklar getirir. Birincil sorun yük dengeleme işlemidir; yönlendirici, diğerlerini görmezden gelirken birkaç "popüler" uzmanı destekleyebilir ve bu da kapasitenin boşa harcanmasına yol açar. Bunu azaltmak için araştırmacılar, tüm uzmanların eşit kullanımını teşvik etmek amacıyla yardımcı kayıp fonksiyonları kullanırlar.

Furthermore, deploying these massive models requires sophisticated hardware setups. Since the total parameter count is high (even if active parameters are low), the model often requires significant VRAM, necessitating distributed training across multiple GPUs. Frameworks like Microsoft DeepSpeed help manage the parallelism required to train these systems efficiently. For managing datasets and training workflows for such complex architectures, tools like the Ultralytics Platform provide essential infrastructure for logging, visualization, and deployment.

Explore solutions

Real-time AI that works with your team

Robotikte AI

Daha akıllı makineleri Ultralytics YOLO modelleriyle destekle. Robotikteki Vision AI; otonom navigasyonu, algılamayı, nesne takibini ve gerçek zamanlı kontrolü yönlendirir.
Daha fazla bilgi edin
Real-time AI that works with your team

Lojistikte Yapay Zeka

Ultralytics YOLO modelleri ile lojistiği kolaylaştır. Görü Yapay Zekası; paket inceleme, ayıklama, araç takibi ve gerçek zamanlı depo güvenliği izlemeyi mümkün kılar.
Daha fazla bilgi edin
Real-time AI that works with your team

Perakendede AI

Perakendeyi Ultralytics YOLO modelleri ile yeniden hayal et. Görü Yapay Zekası; envanter takibi, raf izleme, sıra yönetimi ve daha akıllı müşteri içgörüleri sağlar.
Daha fazla bilgi edin
Real-time AI that works with your team

Sağlıkta Yapay Zeka

Ultralytics YOLO modelleriyle sağlık çözümleri oluştur. Sağlıkta görüntü tabanlı yapay zeka; daha hızlı tıbbi görüntülemeyi, daha akıllı teşhisleri ve hasta izlemeyi güçlendirir.
Daha fazla bilgi edin
Real-time AI that works with your team

Üretimde Yapay Zeka

Ultralytics YOLO modelleri ile üretimi optimize et. Görü Yapay Zekası; kalite kontrol, kusur tespiti, KKD uyumu ve montaj hattı otomasyonunu yönlendirir.
Daha fazla bilgi edin
Real-time AI that works with your operation

Otomotivde yapay zeka

Ultralytics YOLO modelleriyle otomotivde bilgisayarlı görü uygula. Görüntü tabanlı yapay zeka; yol güvenliğini, sürücü yardımını ve araç otomasyonunu daha akıllı yollar için geliştirir.
Daha fazla bilgi edin
Real-time AI tailored to your operation

Tarımda yapay zeka

Ultralytics YOLO modelleriyle akıllı tarıma görüntü tabanlı yapay zeka getir. Daha yüksek ve akıllı verimler için mahsul takibini, hayvancılık izlemeyi ve hassas tarımı güçlendir.
Daha fazla bilgi edin
Real-time AI that works with your team

Robotikte AI

Daha akıllı makineleri Ultralytics YOLO modelleriyle destekle. Robotikteki Vision AI; otonom navigasyonu, algılamayı, nesne takibini ve gerçek zamanlı kontrolü yönlendirir.
Daha fazla bilgi edin
Real-time AI that works with your team

Lojistikte Yapay Zeka

Ultralytics YOLO modelleri ile lojistiği kolaylaştır. Görü Yapay Zekası; paket inceleme, ayıklama, araç takibi ve gerçek zamanlı depo güvenliği izlemeyi mümkün kılar.
Daha fazla bilgi edin
Real-time AI that works with your team

Perakendede AI

Perakendeyi Ultralytics YOLO modelleri ile yeniden hayal et. Görü Yapay Zekası; envanter takibi, raf izleme, sıra yönetimi ve daha akıllı müşteri içgörüleri sağlar.
Daha fazla bilgi edin
Real-time AI that works with your team

Sağlıkta Yapay Zeka

Ultralytics YOLO modelleriyle sağlık çözümleri oluştur. Sağlıkta görüntü tabanlı yapay zeka; daha hızlı tıbbi görüntülemeyi, daha akıllı teşhisleri ve hasta izlemeyi güçlendirir.
Daha fazla bilgi edin
Real-time AI that works with your team

Üretimde Yapay Zeka

Ultralytics YOLO modelleri ile üretimi optimize et. Görü Yapay Zekası; kalite kontrol, kusur tespiti, KKD uyumu ve montaj hattı otomasyonunu yönlendirir.
Daha fazla bilgi edin
Real-time AI that works with your operation

Otomotivde yapay zeka

Ultralytics YOLO modelleriyle otomotivde bilgisayarlı görü uygula. Görüntü tabanlı yapay zeka; yol güvenliğini, sürücü yardımını ve araç otomasyonunu daha akıllı yollar için geliştirir.
Daha fazla bilgi edin
Real-time AI tailored to your operation

Tarımda yapay zeka

Ultralytics YOLO modelleriyle akıllı tarıma görüntü tabanlı yapay zeka getir. Daha yüksek ve akıllı verimler için mahsul takibini, hayvancılık izlemeyi ve hassas tarımı güçlendir.
Daha fazla bilgi edin
Real-time AI that works with your team

Robotikte AI

Daha akıllı makineleri Ultralytics YOLO modelleriyle destekle. Robotikteki Vision AI; otonom navigasyonu, algılamayı, nesne takibini ve gerçek zamanlı kontrolü yönlendirir.
Daha fazla bilgi edin
Real-time AI that works with your team

Lojistikte Yapay Zeka

Ultralytics YOLO modelleri ile lojistiği kolaylaştır. Görü Yapay Zekası; paket inceleme, ayıklama, araç takibi ve gerçek zamanlı depo güvenliği izlemeyi mümkün kılar.
Daha fazla bilgi edin
Real-time AI that works with your team

Perakendede AI

Perakendeyi Ultralytics YOLO modelleri ile yeniden hayal et. Görü Yapay Zekası; envanter takibi, raf izleme, sıra yönetimi ve daha akıllı müşteri içgörüleri sağlar.
Daha fazla bilgi edin
Real-time AI that works with your team

Sağlıkta Yapay Zeka

Ultralytics YOLO modelleriyle sağlık çözümleri oluştur. Sağlıkta görüntü tabanlı yapay zeka; daha hızlı tıbbi görüntülemeyi, daha akıllı teşhisleri ve hasta izlemeyi güçlendirir.
Daha fazla bilgi edin
Real-time AI that works with your team

Üretimde Yapay Zeka

Ultralytics YOLO modelleri ile üretimi optimize et. Görü Yapay Zekası; kalite kontrol, kusur tespiti, KKD uyumu ve montaj hattı otomasyonunu yönlendirir.
Daha fazla bilgi edin
Real-time AI that works with your operation

Otomotivde yapay zeka

Ultralytics YOLO modelleriyle otomotivde bilgisayarlı görü uygula. Görüntü tabanlı yapay zeka; yol güvenliğini, sürücü yardımını ve araç otomasyonunu daha akıllı yollar için geliştirir.
Daha fazla bilgi edin
Real-time AI tailored to your operation

Tarımda yapay zeka

Ultralytics YOLO modelleriyle akıllı tarıma görüntü tabanlı yapay zeka getir. Daha yüksek ve akıllı verimler için mahsul takibini, hayvancılık izlemeyi ve hassas tarımı güçlendir.
Daha fazla bilgi edin

Yapay zekanın geleceğini birlikte inşa edelim!

Yolculuğuna makine öğreniminin geleceğiyle başla