Triff YOLO26: Vision-KI der nächsten Generation.
Ultralytics
Zurück zum Ultralytics Glossar

t-distributed Stochastic Neighbor Embedding (t-SNE)

Erkunde, wie t-SNE hochdimensionale Daten visualisiert. Lerne, Cluster in Computer-Vision-Merkmalen für Ultralytics YOLO26 aufzudecken und Modelle für maschinelles Lernen zu optimieren.

t-distributed Stochastic Neighbor Embedding (t-SNE) ist eine statistische Methode zur Visualisierung hochdimensionaler Daten, indem jedem Datenpunkt ein Ort in einer zwei- oder dreidimensionalen Karte zugewiesen wird. Diese Technik, eine Form der nicht-linearen Dimensionsreduktion, wird im Machine Learning häufig verwendet, um Datensätze mit Hunderten oder Tausenden von Merkmalen zu untersuchen. Im Gegensatz zu linearen Methoden, die sich auf die Bewahrung globaler Strukturen konzentrieren, zeichnet sich t-SNE dadurch aus, dass ähnliche Instanzen nah beieinander gehalten werden, wodurch lokale Cluster und Mannigfaltigkeiten sichtbar werden, die sonst verborgen bleiben könnten. Dies macht es zu einem wertvollen Werkzeug für alles, von der Genomforschung bis hin zum Verständnis der internen Logik tiefer neuronaler Netze.

Link to this sectionWie t-SNE funktioniert#

Die Grundidee hinter t-SNE besteht darin, die Ähnlichkeiten zwischen Datenpunkten in gemeinsame Wahrscheinlichkeiten umzuwandeln. Im ursprünglichen hochdimensionalen Raum misst der Algorithmus die Ähnlichkeit zwischen Punkten unter Verwendung einer Gauß-Verteilung. Wenn zwei Punkte nahe beieinander liegen, haben sie eine hohe Wahrscheinlichkeit, "Nachbarn" zu sein. Der Algorithmus versucht dann, diese Punkte in einen niedrigdimensionalen Raum (normalerweise 2D oder 3D) abzubilden, während diese Wahrscheinlichkeiten beibehalten werden.

Um dies zu erreichen, definiert er eine ähnliche Wahrscheinlichkeitsverteilung in der niedrigdimensionalen Karte unter Verwendung einer Student-t-Verteilung. Diese spezifische Verteilung hat schwerere Enden als eine normale Gauß-Verteilung, was hilft, das "Crowding-Problem" zu adressieren – ein Phänomen, bei dem Punkte im hochdimensionalen Raum dazu neigen, bei der Projektion in sich zusammenzufallen. Indem unähnliche Punkte in der Visualisierung weiter auseinander geschoben werden, erzeugt t-SNE deutliche, lesbare Cluster, die die zugrunde liegende Struktur der Trainingsdaten offenbaren. Der Algorithmus lernt effektiv die beste Kartenrepräsentation durch unüberwachtes Lernen, indem er die Divergenz zwischen den hochdimensionalen und niedrigdimensionalen Wahrscheinlichkeitsverteilungen minimiert.

Link to this sectionReale Anwendungen in der KI#

t-SNE ist ein Standardwerkzeug für die explorative Datenanalyse (EDA) und Modelldiagnose. Es erlaubt Entwicklern zu "sehen", was ein Modell lernt.

  • Überprüfung von Computer-Vision-Merkmalen: In Workflows zur Objekterkennung mit Modellen wie YOLO26 müssen Entwickler oft prüfen, ob das Netzwerk zwischen visuell ähnlichen Klassen unterscheiden kann. Durch das Extrahieren der Merkmalskarten aus den letzten Schichten des Netzwerks und deren Projektion mit t-SNE können Entwickler visualisieren, ob Bilder von "Katzen" getrennt von "Hunden" geclustert werden. Wenn die Cluster vermischt sind, deutet dies darauf hin, dass die Fähigkeiten der Merkmalsextraktion des Modells verbessert werden müssen.
  • Natural Language Processing (NLP): t-SNE wird intensiv zur Visualisierung von Wort-Einbettungen genutzt. Wenn hochdimensionale Wortvektoren (oft 300+ Dimensionen) in 2D projiziert werden, gruppieren sich Wörter mit ähnlicher semantischer Bedeutung auf natürliche Weise. Ein t-SNE-Plot könnte zum Beispiel einen Cluster zeigen, der "König", "Königin", "Prinz" und "Monarch" enthält, was zeigt, dass das Natural Language Processing (NLP)-Modell das Konzept von Königtum erfasst.
  • Genomik und Bioinformatik: Forscher verwenden t-SNE, um Einzelzell-RNA-Sequenzierungsdaten zu visualisieren. Durch die Reduzierung von Tausenden von Genexpressionswerten in einen 2D-Plot können Wissenschaftler unterschiedliche Zelltypen identifizieren und Entwicklungsverläufe nachverfolgen, was bei der Entdeckung neuer biologischer Erkenntnisse und Krankheitsmarker hilft.

Link to this sectionVergleich mit PCA#

Es ist wichtig, t-SNE von der Hauptkomponentenanalyse (PCA) zu unterscheiden, einer weiteren gängigen Reduktionstechnik.

  • PCA ist eine lineare Technik, die sich auf die Bewahrung der globalen Varianz der Daten konzentriert. Sie ist deterministisch und rechnerisch effizient, was sie hervorragend für die initiale Datenkompression oder Rauschunterdrückung macht.
  • t-SNE ist eine nicht-lineare Technik, die sich auf die Bewahrung lokaler Nachbarschaften konzentriert. Sie ist probabilistisch (stochastisch) und rechenintensiver, erzeugt aber weitaus bessere Visualisierungen für komplexe, nicht-lineare Mannigfaltigkeiten.

Eine gängige Best Practice bei der Datenvorverarbeitung ist es, zuerst PCA zu verwenden, um die Daten auf eine handhabbare Größe zu reduzieren (z. B. 50 Dimensionen), und dann t-SNE für die finale Visualisierung anzuwenden. Dieser hybride Ansatz reduziert die Rechenlast und filtert Rauschen heraus, das das t-SNE-Ergebnis beeinträchtigen könnte.

Link to this sectionPython-Beispiel: Merkmale visualisieren#

Das folgende Beispiel zeigt, wie man scikit-learn verwendet, um t-SNE auf einen synthetischen Datensatz anzuwenden. Dieser Workflow spiegelt wider, wie man Merkmale visualisieren könnte, die aus einem Deep-Learning-Modell extrahiert wurden.

import matplotlib.pyplot as plt
from sklearn.datasets import make_blobs
from sklearn.manifold import TSNE

# Generate synthetic high-dimensional data (100 samples, 50 features, 3 centers)
X, y = make_blobs(n_samples=100, n_features=50, centers=3, random_state=42)

# Apply t-SNE to reduce dimensions from 50 to 2
# 'perplexity' balances local vs global aspects of the data
tsne = TSNE(n_components=2, perplexity=30, random_state=42)
X_embedded = tsne.fit_transform(X)

# Plot the result to visualize the 3 distinct clusters
plt.scatter(X_embedded[:, 0], X_embedded[:, 1], c=y)
plt.title("t-SNE Projection of High-Dimensional Data")
plt.show()

Link to this sectionWichtige Überlegungen#

Obwohl t-SNE leistungsstark ist, erfordert es eine sorgfältige Hyperparameter-Optimierung. Der Parameter "Perplexity" ist entscheidend; er schätzt im Wesentlichen, wie viele nahe Nachbarn jeder Punkt hat. Ihn zu niedrig oder zu hoch einzustellen, kann zu irreführenden Visualisierungen führen. Darüber hinaus bewahrt t-SNE globale Abstände nicht gut – das bedeutet, der Abstand zwischen zwei verschiedenen Clustern auf dem Plot spiegelt nicht unbedingt ihre physische Distanz im ursprünglichen Raum wider. Trotz dieser Nuancen bleibt es eine grundlegende Technik zur Validierung von Computer-Vision (CV)-Architekturen und zum Verständnis komplexer Datensätze. Nutzer, die große Datensätze verwalten, nutzen häufig die Ultralytics Platform, um ihre Daten zu organisieren, bevor sie solch tiefgreifende Analysen durchführen.

Explore solutions

Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.

Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.

Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.

Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.

Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.

Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.

Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.

Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.

Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.

Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Erfahre mehr

Lass uns gemeinsam die Zukunft der KI bauen!

Beginne deine Reise mit der Zukunft des maschinellen Lernens