Glossar

t-verteilte stochastische Nachbarschaftseinbettung (t-SNE)

Lernen Sie t-SNE kennen, eine leistungsstarke Technik zur Visualisierung hochdimensionaler Daten. Erfahren Sie mehr über seine Einsatzmöglichkeiten, Vorteile und Anwendungen in KI und ML.

t-distributed Stochastic Neighbor Embedding (t-SNE) ist eine leistungsstarke, nichtlineare Dimensionalitätsreduzierungstechnik, die hauptsächlich für die Datenvisualisierung verwendet wird. Sie ermöglicht es Forschern und Praktikern im Bereich des maschinellen Lernens (ML), hochdimensionale Datensätze in einem niedrigdimensionalen Raum zu visualisieren, in der Regel in einer 2D- oder 3D-Darstellung. Sie wurde von Laurens van der Maaten und Geoffrey Hinton entwickelt und zeichnet sich vor allem durch ihre bemerkenswerte Fähigkeit aus, die zugrunde liegende lokale Struktur von Daten, wie z. B. Cluster und Mannigfaltigkeiten, aufzudecken, die anderen Techniken möglicherweise entgehen. Implementierungen sind in Bibliotheken wie Scikit-learn und Frameworks wie PyTorch weithin verfügbar.

Die Kernidee von t-SNE besteht darin, ähnliche Datenpunkte nahe beieinander und unähnliche Punkte weit voneinander entfernt in einer niedrigdimensionalen Karte zu platzieren. Dies wird erreicht, indem hochdimensionale euklidische Abstände zwischen Datenpunkten in bedingte Wahrscheinlichkeiten umgewandelt werden, die Ähnlichkeiten darstellen. Es verwendet dann eine ähnliche Wahrscheinlichkeitsverteilung in der niedrigdimensionalen Karte und minimiert die Divergenz zwischen diesen beiden Verteilungen.

Anwendungen in KI und Ml

t-SNE wird häufig für die visuelle Exploration in verschiedenen Bereichen der Künstlichen Intelligenz (KI) verwendet.

  • Visualisierung von Merkmalen neuronaler Netze: In der Computer Vision (CV) ist t-SNE von unschätzbarem Wert, um zu verstehen, was ein Deep Learning-Modell gelernt hat. Sie können zum Beispiel die Merkmalseinbettungen aus einer Zwischenschicht eines Convolutional Neural Network (CNN), das für die Bildklassifizierung trainiert wurde, nehmen und t-SNE verwenden, um sie darzustellen. Wenn das Modell, z. B. ein Ultralytics YOLO-Modell, auf einem Datensatz wie CIFAR-10 gut trainiert ist, zeigt die resultierende Darstellung deutliche Cluster, die den verschiedenen Bildkategorien entsprechen (z. B. "Katzen", "Hunde", "Autos"). Dies ist eine visuelle Bestätigung für die Unterscheidungskraft des Modells.
  • Textdaten erforschen: In der natürlichen Sprachverarbeitung (NLP) kann t-SNE hochdimensionale Worteinbettungen wie Word2Vec oder GloVe visualisieren. Dies hilft dabei, semantische Beziehungen zwischen Wörtern zu verstehen; zum Beispiel werden Wörter wie "König", "Königin", "Prinz" und "Prinzessin" zusammen geclustert. Solche Visualisierungen sind nützlich für die Untersuchung von Textkorpora und die Fehlersuche in Sprachmodellen, die bei Aufgaben wie der Dokumentenklassifizierung verwendet werden.
  • Bioinformatik und medizinische Bildgebung: Forscher verwenden t-SNE zur Visualisierung komplexer biologischer Daten, wie z. B. Genexpressionsmuster aus Microarrays, um Zellpopulationen oder Krankheitssubtypen zu identifizieren. Es wird auch in der medizinischen Bildanalyse verwendet, um verschiedene Gewebetypen oder Tumore zu gruppieren, wie im Gehirntumor-Datensatz.

T-SNE im Vergleich. Andere Techniken

Es ist wichtig, t-SNE von anderen Dimensionalitätsreduktionsmethoden zu unterscheiden.

  • Hauptkomponentenanalyse (PCA): PCA ist eine lineare Technik, die sich darauf konzentriert, die maximale Varianz in den Daten zu erhalten, was der Erhaltung der großräumigen, globalen Struktur entspricht. Im Gegensatz dazu ist t-SNE eine nicht-lineare Methode, die sich durch die Aufdeckung der lokalen Struktur auszeichnet (d. h. wie sich einzelne Datenpunkte gruppieren). PCA ist zwar schneller und deterministisch, kann aber aufgrund ihrer linearen Natur nicht die komplexen Beziehungen erfassen, die t-SNE erfassen kann. Es ist gängige Praxis, einen Datensatz zunächst mit PCA auf eine mittlere Anzahl von Dimensionen (z. B. 30-50) zu reduzieren, bevor t-SNE angewendet wird, um die Rechenlast und das Rauschen zu reduzieren.
  • Autoencoder: Autoencoder sind eine Art neuronales Netz, das leistungsstarke, nicht lineare Datendarstellungen erlernen kann. Sie sind zwar flexibler als PCA und t-SNE, aber oft weniger interpretierbar und in der Ausbildung rechenintensiver. Sie werden hauptsächlich zur Merkmalsextraktion und nicht zur direkten Visualisierung verwendet.

Überlegungen und Beschränkungen

Obwohl t-SNE sehr leistungsfähig ist, gibt es einige Einschränkungen, die die Benutzer berücksichtigen müssen.

  • Berechnungsaufwand: Der Algorithmus hat eine quadratische Zeit- und Raumkomplexität in Abhängigkeit von der Anzahl der Datenpunkte, was ihn für Datensätze mit Hunderttausenden von Stichproben langsam macht. Techniken wie Barnes-Hut t-SNE bieten erhebliche Leistungsverbesserungen.
  • Empfindlichkeit der Hyperparameter: Die Ergebnisse können erheblich von den Hyperparametern beeinflusst werden, insbesondere von der "Perplexität", die eine Schätzung der Anzahl der nahen Nachbarn jedes Punktes darstellt. Es gibt keinen einzigen, universell besten Perplexitätswert. Eine ausgezeichnete Quelle für das Verständnis dieser Effekte ist der Distill-Artikel"How to Use t-SNE Effectively".
  • Interpretation der globalen Struktur: t-SNE-Visualisierungen sollten mit Vorsicht interpretiert werden. Die relativen Größen von Clustern und die Abstände zwischen ihnen in der endgültigen Darstellung spiegeln nicht unbedingt die tatsächliche Trennung im hochdimensionalen Originalraum wider. Der Schwerpunkt des Algorithmus liegt auf der Erhaltung lokaler Nachbarschaften, nicht auf der globalen Geometrie. Werkzeuge wie der TensorFlow Projector ermöglichen eine interaktive Erkundung, die dazu beitragen kann, eine Intuition zu entwickeln. Die Verwaltung und Visualisierung solcher Analysen kann mit Plattformen wie Ultralytics HUB rationalisiert werden.

Werden Sie Mitglied der Ultralytics-Gemeinschaft

Beteiligen Sie sich an der Zukunft der KI. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten
Link in die Zwischenablage kopiert