YOLO Vision 2025'i kaçırmayın!
25 Eylül 2025
10:00 — 18:00 BST
Hibrit etkinlik
Yolo Vision 2024
Sözlük

t-dağıtılmış Stokastik Komşu Gömme (t-SNE)

Yüksek boyutlu verileri görselleştirmek için güçlü bir teknik olan t-SNE'yi keşfedin. Yapay zeka ve makine öğrenimindeki kullanım alanlarını, faydalarını ve uygulamalarını öğrenin.

t-dağıtılmış Stokastik Komşu Gömme (t-SNE), öncelikle veri görselleştirmesi için kullanılan güçlü, doğrusal olmayan bir boyut azaltma tekniğidir. Makine Öğrenimi (ML)'ndeki araştırmacıların ve uygulayıcıların, yüksek boyutlu veri kümelerini düşük boyutlu bir uzayda, tipik olarak 2B veya 3B bir grafikte görselleştirmelerini sağlar. Laurens van der Maaten ve Geoffrey Hinton tarafından geliştirilen bu tekniğin temel gücü, diğer tekniklerin kaçırabileceği kümeler ve manifoldlar gibi verilerin temel yerel yapısını ortaya çıkarma konusundaki olağanüstü yeteneğidir. Uygulamalar, Scikit-learn gibi kitaplıklarda ve PyTorch gibi çerçevelerde yaygın olarak mevcuttur.

t-SNE'nin temel fikri, benzer veri noktalarını birbirine yakın ve farklı noktaları düşük boyutlu bir haritada birbirinden uzağa yerleştirmektir. Bunu, veri noktaları arasındaki yüksek boyutlu Öklid mesafelerini benzerlikleri temsil eden koşullu olasılıklara dönüştürerek gerçekleştirir. Daha sonra düşük boyutlu haritada benzer bir olasılık dağılımı kullanır ve bu iki dağılım arasındaki ayrışmayı en aza indirir.

Yapay Zeka ve MO'da Uygulamalar

t-SNE, Yapay Zeka (AI)'nın çeşitli alanlarında görsel keşif için yaygın olarak kullanılmaktadır.

  • Sinir Ağı Özelliklerini Görselleştirme: Bilgisayarla Görü (CV) alanında, t-SNE bir derin öğrenme modelinin ne öğrendiğini anlamak için çok değerlidir. Örneğin, bir görüntü sınıflandırması için eğitilmiş bir Evrişimsel Sinir Ağı'nın (CNN) ara katmanından özellik gömümlerini alıp bunları çizmek için t-SNE'yi kullanabilirsiniz. Ultralytics YOLO modeli gibi bir model, CIFAR-10 gibi bir veri kümesi üzerinde iyi eğitilmişse, ortaya çıkan grafik farklı görüntü kategorilerine (örneğin, "kediler", "köpekler", "arabalar") karşılık gelen belirgin kümeler gösterecektir. Bu, modelin ayırt edici gücünün görsel bir onayını sağlar.
  • Metin Verilerini Keşfetme: Doğal Dil İşleme (NLP)'de, t-SNE, Word2Vec veya GloVe gibi yüksek boyutlu kelime gömme (word embedding) işlemlerini görselleştirebilir. Bu, kelimeler arasındaki semantik ilişkileri anlamaya yardımcı olur; örneğin, "kral", "kraliçe", "prens" ve "prenses" gibi kelimeler birlikte kümelenir. Bu tür görselleştirmeler, metin derlemlerini keşfetmek ve belge sınıflandırması gibi görevlerde kullanılan dil modellerinde hata ayıklamak için kullanışlıdır.
  • Biyoenformatik ve Tıbbi Görüntüleme (Bioinformatics and Medical Imaging): Araştırmacılar, hücre popülasyonlarını veya hastalık alt tiplerini belirlemek için mikroarraylerden elde edilen gen ifade kalıpları gibi karmaşık biyolojik verileri görselleştirmek için t-SNE kullanır. Ayrıca, Beyin Tümörü veri kümesinde olduğu gibi, farklı türdeki dokuları veya tümörleri kümelemek için tıbbi görüntü analizinde de kullanılır.

T-SNE ve Diğer Teknikler

t-SNE'yi diğer boyut azaltma yöntemlerinden ayırmak önemlidir.

  • Temel Bileşen Analizi (PCA): PCA, verilerdeki maksimum varyansı korumaya odaklanan doğrusal bir tekniktir ve bu da büyük ölçekli, global yapıyı korumaya karşılık gelir. Buna karşılık, t-SNE, yerel yapıyı (yani, bireysel veri noktalarının nasıl gruplandığını) ortaya çıkarmada mükemmel olan doğrusal olmayan bir yöntemdir. PCA daha hızlı ve deterministik olsa da, doğrusal yapısı t-SNE'nin yakalayabileceği karmaşık ilişkileri yakalamayabilir. Hesaplama yükünü ve gürültüyü azaltmak için t-SNE uygulamadan önce bir veri kümesini önce PCA kullanarak ara bir boyut sayısına (örneğin, 30-50) indirmek yaygın bir uygulamadır.
  • Otomatik Kodlayıcılar (Autoencoders): Otomatik kodlayıcılar, güçlü, doğrusal olmayan veri temsillerini öğrenebilen bir sinir ağı türüdür. PCA ve t-SNE'den daha esnek olmalarına rağmen, genellikle daha az yorumlanabilir ve eğitilmesi daha hesaplama maliyetlidir. Öncelikle doğrudan görselleştirmeden ziyade özellik çıkarımı için kullanılırlar.

Değerlendirmeler ve Sınırlamalar

Güçlü olmasına rağmen, t-SNE'nin kullanıcıların dikkate alması gereken bazı sınırlamaları vardır.

  • Hesaplama Maliyeti: Algoritma, veri noktalarının sayısında ikinci dereceden bir zaman ve alan karmaşıklığına sahiptir, bu da onu yüz binlerce örnek içeren veri kümeleri için yavaşlatır. Barnes-Hut t-SNE gibi teknikler önemli performans iyileştirmeleri sunar.
  • Hiperparametre Hassasiyeti (Hyperparameter Sensitivity): Sonuçlar, özellikle her noktanın kaç komşusu olduğuna dair bir tahmin olan "şaşkınlık (perplexity)" gibi hiperparametrelerinden önemli ölçüde etkilenebilir. Evrensel olarak en iyi şaşkınlık değeri diye bir şey yoktur. Bu etkileri anlamak için mükemmel bir kaynak, Distill'in "How to Use t-SNE Effectively" makalesidir.
  • Global Yapı Yorumlama: t-SNE görselleştirmeleri dikkatle yorumlanmalıdır. Son çizimde kümelerin göreli boyutları ve aralarındaki mesafeler, orijinal yüksek boyutlu uzaydaki gerçek ayrımı yansıtmayabilir. Algoritmanın odak noktası, global geometriyi değil, yerel komşulukları korumaktır. TensorFlow Projector gibi araçlar, sezgi oluşturmaya yardımcı olabilecek etkileşimli keşfe olanak tanır. Bu tür analizlerin yönetimi ve görselleştirilmesi, Ultralytics HUB gibi platformlar kullanılarak kolaylaştırılabilir.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın
Bağlantı panoya kopyalandı