YOLO26 ile tanış: yeni nesil görsel AI.
Ultralytics
Ultralytics Sözlüğüne dön

Sparse Autoencoders (SAE)

Seyrek Otomatik Kodlayıcıların (SAE) yapay zeka yorumlanabilirliğini ve özellik çıkarımını nasıl iyileştirdiğini öğren. Temel mekanizmaları, LLM uygulamalarını ve YOLO26 ile entegrasyonu keşfet.

Seyrek Otomatik Kodlayıcı (SAE), gizli katmanlara bir seyrelme kısıtlaması getirerek verilerin verimli ve yorumlanabilir temsillerini öğrenmek üzere tasarlanmış özel bir sinir ağı mimarisi türüdür. Verileri temel olarak daha küçük boyutlara sıkıştırmaya odaklanan geleneksel otomatik kodlayıcıların aksine, bir seyrek otomatik kodlayıcı veriyi genellikle daha yüksek boyutlu bir uzaya yansıtır ancak her an yalnızca az sayıda nöronun aktif olmasını sağlar. Bu, yalnızca belirli bir uyarana yanıt olarak birkaç nöronun ateşlendiği biyolojik sinir sistemlerini taklit ederek modelin karmaşık veri kümelerinden belirgin ve anlamlı özellikleri ayırmasına olanak tanır. Bu mimari, derin öğrenme içindeki "kara kutu" problemini çözmek ve açıklanabilir yapay zekayı geliştirmek için birincil bir araç olarak 2024 ve 2025 yıllarında büyük bir yeniden doğuş yaşamıştır.

Link to this sectionSeyrek Otomatik Kodlayıcılar Nasıl Çalışır#

Özünde, bir seyrek otomatik kodlayıcı standart bir otomatik kodlayıcı ile benzer şekilde işler. Girdi verisini gizli bir temsile eşleyen bir kodlayıcıdan ve orijinal girdiyi bu temsilden yeniden oluşturmaya çalışan bir kod çözücüden oluşur. Ancak SAE, eğitim sırasında genellikle kayıp fonksiyonuna eklenen, seyrelme cezası olarak bilinen kritik bir modifikasyon getirir.

Bu ceza, kesinlikle gerekli olmadıkça nöronların aktifleşmesini engeller. Ağı, bilgiyi mümkün olduğunca az aktif birim kullanarak temsil etmeye zorlayarak model, birbiriyle alakasız niteliklerin karmaşık bir bileşimi yerine tek ve anlaşılabilir kavramlara karşılık gelen "monosemantik" özellikleri öğrenmek zorundadır. Bu durum, SAE'leri bilgisayarlı görü ve büyük dil modellerinde kullanılan yüksek boyutlu verilerdeki kalıpları tanımlamak için özellikle değerli kılar.

Link to this sectionTemel Mekanizmalar#

  • Aşırı Tamamlanmış Temsiller: Boyutları azaltan standart sıkıştırmanın aksine, SAE'ler genellikle "aşırı tamamlanmış" (overcomplete) bir gizli katman kullanır; yani gizli katmanda girdiden daha fazla nöron bulunur. Bu, geniş bir olası özellikler sözlüğü sağlar, ancak seyrelme kısıtlaması, herhangi bir spesifik girdiyi tanımlamak için yalnızca birkaçının seçilmesini sağlar.
  • L1 Düzenlileştirme: Seyreltmeyi tetiklemenin en yaygın yöntemi, gizli katmanın aktivasyonlarına L1 düzenlileştirme uygulamaktır. Bu matematiksel baskı, ilgisiz nöronların aktivitesini sıfıra doğru iter.
  • Özellik Ayrıştırma: Karmaşık modellerde, tek bir nöron genellikle birden fazla ilgisiz kavramı kodlar (süperpozisyon adı verilen bir fenomen). SAE'ler, bu kavramları ayrı özelliklere atayarak ayrıştırılmasına yardımcı olur.

Link to this sectionSeyrek Otomatik Kodlayıcılar ve Standart Otomatik Kodlayıcılar#

Her iki mimari de etiketli veri olmadan kalıpları keşfetmek için denetimsiz öğrenmeye dayansa da hedefleri önemli ölçüde farklılık gösterir. Standart bir otomatik kodlayıcı, en fazla bilgiyi en küçük alanda korumaya çalışarak boyut indirgemeye odaklanır ve bu da genellikle insanlar için yorumlanması zor sıkıştırılmış özelliklerle sonuçlanır.

Buna karşılık, bir seyrek otomatik kodlayıcı özellik çıkarımına ve yorumlanabilirliğe öncelik verir. Yeniden oluşturma kalitesi biraz daha düşük olsa bile, bir SAE'nin gizli durumları, verinin temel yapısının daha net bir haritasını sağlar. Bu ayrım, SAE'leri basit dosya sıkıştırma için daha az kullanışlı, ancak modelin iç karar verme sürecini anlamanın en önemli olduğu yapay zeka güvenliği araştırmaları için vazgeçilmez kılar.

Link to this sectionGerçek Dünya Uygulamaları#

Seyrek Otomatik Kodlayıcıların uygulaması, temel görüntü analizinden devasa temel modellerin bilişsel süreçlerini çözmeye doğru evrilerek önemli ölçüde gelişmiştir.

Link to this sectionBüyük Dil Modellerini (LLM'ler) Yorumlama#

2024 yılında araştırmacılar, Transformer modellerinin "beyninin" içine bakmak için devasa SAE'ler kullanmaya başladılar. Bir LLM'nin iç aktivasyonları üzerinde bir SAE eğiterek mühendisler, belirli bir programlama dilini veya biyolojik bir varlığı tanımlarken ateşlenen nöronlar gibi soyut kavramlardan sorumlu belirli nöronları tanımlayabilirler. Bu, hassas model izlemeye olanak tanır ve hatalı özellik aktivasyonlarını belirleyip bastırarak LLM'lerde halüsinasyonları azaltmaya yardımcı olur.

Link to this sectionGörsel Denetimde Anomali Tespiti#

SAE'ler, üretimde anomali tespiti için oldukça etkilidir. Bir SAE, kusursuz ürünlerin görüntüleri üzerinde eğitildiğinde, normal parçaları belirli ve seyrek bir özellik kümesi kullanarak temsil etmeyi öğrenir. Kusurlu bir parça sunulduğunda, model kusuru öğrendiği seyrek sözlüğü kullanarak yeniden oluşturamaz ve bu da yüksek bir yeniden oluşturma hatasına yol açar. Bu sapma bir anomaliyi işaret eder. Gerçek zamanlı nesne tespiti genellikle Ultralytics YOLO26 gibi modeller tarafından yönetilse de SAE'ler, eğitim verilerinde bulunmayan bilinmeyen veya nadir kusurları tanımlamak için tamamlayıcı, denetimsiz bir yaklaşım sunar.

Link to this sectionTemel Bir SAE Uygulamak#

Aşağıdaki örnek, torch kullanarak basit bir seyrek otomatik kodlayıcı mimarisini göstermektedir. Seyrelme, eğitim döngüsü sırasında (kavramsal olarak) aktivasyonların mutlak ortalama değerinin kayba eklenmesiyle manuel olarak zorunlu kılınır.

import torch
import torch.nn as nn
import torch.nn.functional as F


class SparseAutoencoder(nn.Module):
    def __init__(self, input_dim, hidden_dim):
        super().__init__()
        # Encoder: Maps input to a hidden representation
        self.encoder = nn.Linear(input_dim, hidden_dim)
        # Decoder: Reconstructs the original input
        self.decoder = nn.Linear(hidden_dim, input_dim)

    def forward(self, x):
        # Apply activation function (e.g., ReLU) to get latent features
        latent = F.relu(self.encoder(x))
        # Reconstruct the input
        reconstruction = self.decoder(latent)
        return reconstruction, latent


# Example usage
model = SparseAutoencoder(input_dim=784, hidden_dim=1024)
dummy_input = torch.randn(1, 784)
recon, latent_acts = model(dummy_input)

# During training, you would add L1 penalty to the loss:
# loss = reconstruction_loss + lambda * torch.mean(torch.abs(latent_acts))
print(f"Latent representation shape: {latent_acts.shape}")

Link to this sectionModern Yapay Zeka Geliştirmedeki Önemi#

Seyrek Otomatik Kodlayıcıların yeniden canlanması, endüstrinin yapay zekada şeffaflığa doğru kayışını vurgulamaktadır. Modeller daha büyük ve daha opak hale geldikçe, karmaşık sinirsel aktiviteyi insan tarafından okunabilir bileşenlere ayrıştırabilen araçlar gerekli hale gelmektedir. Veri kümelerini ve eğitim iş akışlarını yönetmek için Ultralytics Platform'u kullanan araştırmacılar, veri dağılımlarını daha iyi anlamak ve model nicemleme stratejilerini geliştirmek için SAE'ler gibi denetimsiz tekniklerden elde edilen içgörülerden yararlanabilirler.

Özellikleri izole ederek SAE'ler, bir alanda öğrenilen anlamlı kalıpların bir başkasına daha kolay uyarlanmasını sağlayarak transfer öğrenmeye de katkıda bulunur. Bu verimlilik, YOLO26 gibi verimli dedektörlerin arkasındaki tasarım felsefesine benzer şekilde, bilişim kaynaklarının sınırlı olduğu uç cihazlarda sağlam yapay zekayı devreye almak için kritiktir.

Link to this sectionDaha Fazla Okuma#

Explore solutions

Real-time AI that works with your team

Robotikte AI

Daha akıllı makineleri Ultralytics YOLO modelleriyle destekle. Robotikteki Vision AI; otonom navigasyonu, algılamayı, nesne takibini ve gerçek zamanlı kontrolü yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Lojistikte Yapay Zeka

Ultralytics YOLO modelleri ile lojistiği kolaylaştır. Görü Yapay Zekası; paket inceleme, ayıklama, araç takibi ve gerçek zamanlı depo güvenliği izlemeyi mümkün kılar.

Daha fazla bilgi edin
Real-time AI that works with your team

Perakendede AI

Perakendeyi Ultralytics YOLO modelleri ile yeniden hayal et. Görü Yapay Zekası; envanter takibi, raf izleme, sıra yönetimi ve daha akıllı müşteri içgörüleri sağlar.

Daha fazla bilgi edin
Real-time AI that works with your team

Sağlıkta Yapay Zeka

Ultralytics YOLO modelleriyle sağlık çözümleri oluştur. Sağlıkta görüntü tabanlı yapay zeka; daha hızlı tıbbi görüntülemeyi, daha akıllı teşhisleri ve hasta izlemeyi güçlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Üretimde Yapay Zeka

Ultralytics YOLO modelleri ile üretimi optimize et. Görü Yapay Zekası; kalite kontrol, kusur tespiti, KKD uyumu ve montaj hattı otomasyonunu yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your operation

Otomotivde yapay zeka

Ultralytics YOLO modelleriyle otomotivde bilgisayarlı görü uygula. Görüntü tabanlı yapay zeka; yol güvenliğini, sürücü yardımını ve araç otomasyonunu daha akıllı yollar için geliştirir.

Daha fazla bilgi edin
Real-time AI tailored to your operation

Tarımda yapay zeka

Ultralytics YOLO modelleriyle akıllı tarıma görüntü tabanlı yapay zeka getir. Daha yüksek ve akıllı verimler için mahsul takibini, hayvancılık izlemeyi ve hassas tarımı güçlendir.

Daha fazla bilgi edin
Real-time AI that works with your team

Robotikte AI

Daha akıllı makineleri Ultralytics YOLO modelleriyle destekle. Robotikteki Vision AI; otonom navigasyonu, algılamayı, nesne takibini ve gerçek zamanlı kontrolü yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Lojistikte Yapay Zeka

Ultralytics YOLO modelleri ile lojistiği kolaylaştır. Görü Yapay Zekası; paket inceleme, ayıklama, araç takibi ve gerçek zamanlı depo güvenliği izlemeyi mümkün kılar.

Daha fazla bilgi edin
Real-time AI that works with your team

Perakendede AI

Perakendeyi Ultralytics YOLO modelleri ile yeniden hayal et. Görü Yapay Zekası; envanter takibi, raf izleme, sıra yönetimi ve daha akıllı müşteri içgörüleri sağlar.

Daha fazla bilgi edin
Real-time AI that works with your team

Sağlıkta Yapay Zeka

Ultralytics YOLO modelleriyle sağlık çözümleri oluştur. Sağlıkta görüntü tabanlı yapay zeka; daha hızlı tıbbi görüntülemeyi, daha akıllı teşhisleri ve hasta izlemeyi güçlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Üretimde Yapay Zeka

Ultralytics YOLO modelleri ile üretimi optimize et. Görü Yapay Zekası; kalite kontrol, kusur tespiti, KKD uyumu ve montaj hattı otomasyonunu yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your operation

Otomotivde yapay zeka

Ultralytics YOLO modelleriyle otomotivde bilgisayarlı görü uygula. Görüntü tabanlı yapay zeka; yol güvenliğini, sürücü yardımını ve araç otomasyonunu daha akıllı yollar için geliştirir.

Daha fazla bilgi edin
Real-time AI tailored to your operation

Tarımda yapay zeka

Ultralytics YOLO modelleriyle akıllı tarıma görüntü tabanlı yapay zeka getir. Daha yüksek ve akıllı verimler için mahsul takibini, hayvancılık izlemeyi ve hassas tarımı güçlendir.

Daha fazla bilgi edin
Real-time AI that works with your team

Robotikte AI

Daha akıllı makineleri Ultralytics YOLO modelleriyle destekle. Robotikteki Vision AI; otonom navigasyonu, algılamayı, nesne takibini ve gerçek zamanlı kontrolü yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Lojistikte Yapay Zeka

Ultralytics YOLO modelleri ile lojistiği kolaylaştır. Görü Yapay Zekası; paket inceleme, ayıklama, araç takibi ve gerçek zamanlı depo güvenliği izlemeyi mümkün kılar.

Daha fazla bilgi edin
Real-time AI that works with your team

Perakendede AI

Perakendeyi Ultralytics YOLO modelleri ile yeniden hayal et. Görü Yapay Zekası; envanter takibi, raf izleme, sıra yönetimi ve daha akıllı müşteri içgörüleri sağlar.

Daha fazla bilgi edin
Real-time AI that works with your team

Sağlıkta Yapay Zeka

Ultralytics YOLO modelleriyle sağlık çözümleri oluştur. Sağlıkta görüntü tabanlı yapay zeka; daha hızlı tıbbi görüntülemeyi, daha akıllı teşhisleri ve hasta izlemeyi güçlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Üretimde Yapay Zeka

Ultralytics YOLO modelleri ile üretimi optimize et. Görü Yapay Zekası; kalite kontrol, kusur tespiti, KKD uyumu ve montaj hattı otomasyonunu yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your operation

Otomotivde yapay zeka

Ultralytics YOLO modelleriyle otomotivde bilgisayarlı görü uygula. Görüntü tabanlı yapay zeka; yol güvenliğini, sürücü yardımını ve araç otomasyonunu daha akıllı yollar için geliştirir.

Daha fazla bilgi edin
Real-time AI tailored to your operation

Tarımda yapay zeka

Ultralytics YOLO modelleriyle akıllı tarıma görüntü tabanlı yapay zeka getir. Daha yüksek ve akıllı verimler için mahsul takibini, hayvancılık izlemeyi ve hassas tarımı güçlendir.

Daha fazla bilgi edin

Yapay zekanın geleceğini birlikte inşa edelim!

Yolculuğuna makine öğreniminin geleceğiyle başla