t-distributed Stochastic Neighbor Embedding (t-SNE)

t-SNE'nin yüksek boyutlu verileri nasıl görselleştirdiğini keşfet. Ultralytics YOLO26 için bilgisayarlı görü özelliklerindeki kümeleri ortaya çıkarmayı ve makine öğrenimi modellerini optimize etmeyi öğren.

t-distributed Stochastic Neighbor Embedding (t-SNE), her veri noktasına iki veya üç boyutlu bir haritada bir konum vererek yüksek boyutlu verileri görselleştirmek için kullanılan istatistiksel bir yöntemdir. Doğrusal olmayan bir boyut indirgeme biçimi olan bu teknik, makine öğreniminde yüzlerce veya binlerce öznitelik içeren veri kümelerini keşfetmek için yaygın olarak kullanılır. Küresel yapıları korumaya odaklanan doğrusal yöntemlerin aksine, t-SNE benzer örnekleri birbirine yakın tutma konusunda başarılıdır ve aksi takdirde gizli kalabilecek yerel kümeleri ve manifoldları ortaya çıkarır. Bu durum onu, genomik araştırmalardan derin sinir ağlarının iç mantığını anlamaya kadar her şey için paha biçilmez bir araç haline getirir.

Link to this sectiont-SNE Nasıl Çalışır#

t-SNE'nin temel fikri, veri noktaları arasındaki benzerlikleri ortak olasılıklara dönüştürmeyi içerir. Orijinal yüksek boyutlu uzayda algoritma, noktalar arasındaki benzerliği bir Gauss dağılımı kullanarak ölçer. İki nokta birbirine yakınsa, "komşu" olma olasılıkları yüksektir. Algoritma daha sonra bu noktaları, bu olasılıkları korurken daha düşük boyutlu bir uzaya (genellikle 2D veya 3D) eşlemeye çalışır.

To achieve this, it defines a similar probability distribution in the lower-dimensional map using a Student's t-distribution. This specific distribution has heavier tails than a normal Gaussian distribution, which helps address the "crowding problem"—a phenomenon where points in high-dimensional space tend to collapse on top of each other when projected down. By pushing dissimilar points farther apart in the visualization, t-SNE creates distinct, readable clusters that reveal the underlying structure of the training data. The algorithm effectively learns the best map representation through unsupervised learning by minimizing the divergence between the high-dimensional and low-dimensional probability distributions.

Link to this sectionYapay Zekada Gerçek Dünya Uygulamaları#

t-SNE, keşifsel veri analizi (EDA) ve model tanılamaları için standart bir araçtır. Mühendislerin bir modelin ne öğrendiğini "görmesini" sağlar.

Bilgisayarlı Görü Özniteliklerini Doğrulama: YOLO26 gibi modelleri kullanan nesne algılama iş akışlarında, geliştiricilerin ağın görsel olarak benzer sınıfları ayırt edip edemeyeceğini kontrol etmeleri gerekebilir. Öznitelik haritalarını ağın son katmanlarından çıkarıp t-SNE ile yansıtarak, mühendisler "kediler"e ait görüntülerin "köpekler"den ayrı kümelenip kümelenmediğini görselleştirebilirler. Kümeler iç içeyse, bu durum modelin öznitelik çıkarımı yeteneklerinin geliştirilmesi gerektiğini gösterir.
Doğal Dil İşleme (NLP): t-SNE, kelime gömülülerini görselleştirmek için yoğun bir şekilde kullanılır. Yüksek boyutlu kelime vektörleri (genellikle 300+ boyut) 2D'ye yansıtıldığında, benzer anlamsal anlamlara sahip kelimeler doğal olarak bir araya gelir. Örneğin, bir t-SNE grafiği "kral", "kraliçe", "prens" ve "hükümdar" içeren bir küme göstererek Doğal Dil İşleme (NLP) modelinin krallık kavramını anladığını ortaya koyabilir.
Genomik ve Biyoinformatik: Araştırmacılar, tek hücreli RNA dizileme verilerini görselleştirmek için t-SNE kullanırlar. Binlerce gen ifadesi değerini 2D bir grafiğe indirgeyerek, bilim insanları farklı hücre tiplerini tanımlayabilir ve gelişimsel yörüngeleri takip edebilir, bu da yeni biyolojik içgörülerin ve hastalık belirteçlerinin keşfedilmesine yardımcı olur.

Link to this sectionPCA ile Karşılaştırma#

t-SNE'yi bir başka yaygın indirgeme tekniği olan Temel Bileşen Analizi'nden (PCA) ayırt etmek önemlidir.

PCA, verinin genel varyansını korumaya odaklanan doğrusal bir tekniktir. Belirlenimci ve hesaplama açısından verimlidir, bu da onu ilk veri sıkıştırma veya gürültü azaltma için mükemmel kılar.
t-SNE, yerel komşulukları korumaya odaklanan doğrusal olmayan bir tekniktir. Olasılıksaldır (stokastik) ve hesaplama açısından daha ağırdır, ancak karmaşık ve doğrusal olmayan manifoldlar için çok daha iyi görselleştirmeler üretir.

Veri ön işlemede yaygın bir en iyi uygulama, önce veriyi yönetilebilir bir boyuta (örneğin 50 boyut) indirmek için PCA kullanmak ve ardından nihai görselleştirme için t-SNE uygulamaktır. Bu hibrit yaklaşım, hesaplama yükünü azaltır ve t-SNE sonucunu bozabilecek gürültüyü filtreler.

Link to this sectionPython Örneği: Öznitelikleri Görselleştirme#

Aşağıdaki örnek, sentetik bir veri kümesine t-SNE uygulamak için scikit-learn kullanımını göstermektedir. Bu iş akışı, derin öğrenme modelinden çıkarılan özniteliklerin nasıl görselleştirilebileceğini yansıtır.

import matplotlib.pyplot as plt
from sklearn.datasets import make_blobs
from sklearn.manifold import TSNE

# Generate synthetic high-dimensional data (100 samples, 50 features, 3 centers)
X, y = make_blobs(n_samples=100, n_features=50, centers=3, random_state=42)

# Apply t-SNE to reduce dimensions from 50 to 2
# 'perplexity' balances local vs global aspects of the data
tsne = TSNE(n_components=2, perplexity=30, random_state=42)
X_embedded = tsne.fit_transform(X)

# Plot the result to visualize the 3 distinct clusters
plt.scatter(X_embedded[:, 0], X_embedded[:, 1], c=y)
plt.title("t-SNE Projection of High-Dimensional Data")
plt.show()

Link to this sectionTemel Hususlar#

Güçlü olmasına rağmen, t-SNE dikkatli bir hiperparametre ayarı gerektirir. "Perplexity" parametresi kritiktir; temel olarak her noktanın kaç yakın komşusu olduğunu tahmin eder. Çok düşük veya çok yüksek ayarlanması, yanıltıcı görselleştirmelere yol açabilir. Ayrıca, t-SNE küresel mesafeleri iyi korumaz; yani grafikteki iki farklı küme arasındaki mesafe, orijinal uzaydaki fiziksel mesafelerini yansıtmayabilir. Bu nüanslara rağmen, bilgisayarlı görü (CV) mimarilerini doğrulamak ve karmaşık veri kümelerini anlamak için temel bir teknik olmaya devam etmektedir. Büyük ölçekli veri kümelerini yöneten kullanıcılar, bu tür derinlemesine analizleri gerçekleştirmeden önce verilerini düzenlemek için sıklıkla Ultralytics Platform'dan yararlanırlar.

Explore solutions

Defect Detection

YOLO-based vision AI detects defects in steel, PCBs, fabric, solar panels, and welds, with peer-reviewed accuracy up to 99.4% and up to 94.5% lower inspection cost.

t-distributed Stochastic Neighbor Embedding (t-SNE)

Link to this sectiont-SNE Nasıl Çalışır#

Link to this sectionYapay Zekada Gerçek Dünya Uygulamaları#

Link to this sectionPCA ile Karşılaştırma#

Link to this sectionPython Örneği: Öznitelikleri Görselleştirme#

Link to this sectionTemel Hususlar#

Explore solutions

Defect Detection

Robotikte AI

Lojistikte Yapay Zeka

Perakendede AI

Sağlıkta Yapay Zeka

Üretimde Yapay Zeka

Otomotivde yapay zeka

Tarımda yapay zeka

Defect Detection

Robotikte AI

Lojistikte Yapay Zeka

Perakendede AI

Sağlıkta Yapay Zeka

Üretimde Yapay Zeka

Otomotivde yapay zeka

Tarımda yapay zeka

Defect Detection

Robotikte AI

Lojistikte Yapay Zeka

Perakendede AI

Sağlıkta Yapay Zeka

Üretimde Yapay Zeka

Otomotivde yapay zeka

Tarımda yapay zeka

Yapay zekanın geleceğini birlikte inşa edelim!