Встречай YOLO26: ИИ компьютерного зрения нового поколения.
Ultralytics
Назад к глоссарию Ultralytics

t-distributed Stochastic Neighbor Embedding (t-SNE)

Исследуй, как t-SNE визуализирует многомерные данные. Научись выявлять кластеры в признаках компьютерного зрения для Ultralytics YOLO26 и оптимизировать модели машинного обучения.

t-распределенное стохастическое вложение соседей (t-SNE) — это статистический метод визуализации многомерных данных, при котором каждой точке данных присваивается местоположение на двух- или трехмерной карте. Этот метод, являющийся разновидностью нелинейного снижения размерности, широко используется в машинном обучении для исследования наборов данных, содержащих сотни или тысячи признаков. В отличие от линейных методов, фокусирующихся на сохранении глобальных структур, t-SNE отлично справляется с задачей удерживания схожих экземпляров рядом, выявляя локальные кластеры и многообразия, которые иначе могли бы остаться скрытыми. Это делает его бесценным инструментом для всего: от геномных исследований до понимания внутренней логики глубоких нейронных сетей.

Link to this sectionКак работает t-SNE#

Основная идея t-SNE заключается в преобразовании сходств между точками данных в совместные вероятности. В исходном многомерном пространстве алгоритм измеряет сходство между точками с помощью распределения Гаусса. Если две точки находятся близко друг к другу, у них высокая вероятность быть «соседями». Затем алгоритм пытается отобразить эти точки в пространство меньшей размерности (обычно 2D или 3D), сохраняя эти вероятности.

Для этого он определяет схожее распределение вероятностей на карте меньшей размерности, используя t-распределение Стьюдента. Это конкретное распределение имеет более «тяжелые» хвосты, чем нормальное распределение Гаусса, что помогает решить «проблему скученности» — явление, при котором точки в многомерном пространстве имеют тенденцию накладываться друг на друга при проецировании. Раздвигая несхожие точки дальше друг от друга на визуализации, t-SNE создает четкие, читаемые кластеры, которые раскрывают внутреннюю структуру обучающих данных. Алгоритм эффективно изучает наилучшее представление карты с помощью обучения без учителя, минимизируя расхождение между многомерным и низкоразмерным распределениями вероятностей.

Link to this sectionРеальные применения в ИИ#

t-SNE — это стандартный инструмент для разведочного анализа данных (EDA) и диагностики моделей. Он позволяет инженерам «увидеть», чему учится модель.

  • Верификация функций компьютерного зрения: В рабочих процессах обнаружения объектов с использованием таких моделей, как YOLO26, разработчикам часто нужно проверить, может ли сеть различать визуально похожие классы. Извлекая карты признаков из последних слоев сети и проецируя их с помощью t-SNE, инженеры могут визуализировать, группируются ли изображения «кошек» отдельно от «собак». Если кластеры перемешаны, это говорит о том, что возможности извлечения признаков модели требуют улучшения.
  • Обработка естественного языка (NLP): t-SNE активно используется для визуализации эмбеддингов слов. Когда многомерные векторные представления слов (часто 300+ измерений) проецируются в 2D, слова со схожими семантическими значениями естественным образом группируются. Например, график t-SNE может показать кластер, содержащий «король», «королева», «принц» и «монарх», демонстрируя, что модель обработки естественного языка (NLP) понимает концепцию королевской власти.
  • Геномика и биоинформатика: Исследователи используют t-SNE для визуализации данных секвенирования РНК одиночных клеток. Сокращая тысячи значений экспрессии генов до 2D-графика, ученые могут идентифицировать различные типы клеток и прослеживать траектории развития, помогая в открытии новых биологических данных и маркеров заболеваний.

Link to this sectionСравнение с PCA#

Важно отличать t-SNE от метода главных компонент (PCA), еще одного распространенного метода снижения размерности.

  • PCA — это линейный метод, который фокусируется на сохранении глобальной дисперсии данных. Он детерминирован и вычислительно эффективен, что делает его отличным выбором для начального сжатия данных или шумоподавления.
  • t-SNE — это нелинейный метод, ориентированный на сохранение локальных окрестностей. Он является вероятностным (стохастическим) и более ресурсоемким, но он создает гораздо лучшие визуализации для сложных нелинейных многообразий.

Распространенная передовая практика предварительной обработки данных заключается в использовании PCA сначала для уменьшения данных до управляемого размера (например, 50 измерений), а затем в применении t-SNE для финальной визуализации. Этот гибридный подход снижает вычислительную нагрузку и отфильтровывает шум, который может ухудшить результат t-SNE.

Link to this sectionПример на Python: визуализация признаков#

Следующий пример демонстрирует, как использовать scikit-learn для применения t-SNE к синтетическому набору данных. Этот рабочий процесс отражает то, как можно визуализировать признаки, извлеченные из модели глубокого обучения.

import matplotlib.pyplot as plt
from sklearn.datasets import make_blobs
from sklearn.manifold import TSNE

# Generate synthetic high-dimensional data (100 samples, 50 features, 3 centers)
X, y = make_blobs(n_samples=100, n_features=50, centers=3, random_state=42)

# Apply t-SNE to reduce dimensions from 50 to 2
# 'perplexity' balances local vs global aspects of the data
tsne = TSNE(n_components=2, perplexity=30, random_state=42)
X_embedded = tsne.fit_transform(X)

# Plot the result to visualize the 3 distinct clusters
plt.scatter(X_embedded[:, 0], X_embedded[:, 1], c=y)
plt.title("t-SNE Projection of High-Dimensional Data")
plt.show()

Link to this sectionКлючевые соображения#

Несмотря на свою мощь, t-SNE требует тщательной настройки гиперпараметров. Параметр «perplexity» критически важен; по сути, он угадывает, сколько близких соседей есть у каждой точки. Слишком низкое или слишком высокое значение может привести к вводящим в заблуждение визуализациям. Кроме того, t-SNE не очень хорошо сохраняет глобальные расстояния — это означает, что расстояние между двумя отдельными кластерами на графике не обязательно отражает их физическое расстояние в исходном пространстве. Несмотря на эти нюансы, он остается краеугольным методом для проверки архитектур компьютерного зрения (CV) и понимания сложных наборов данных. Пользователи, работающие с крупномасштабными наборами данных, часто используют платформу Ultralytics для организации своих данных перед проведением столь глубокого анализа.

Explore solutions

Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше

Давай строить будущее ИИ вместе!

Начни свой путь в будущее машинного обучения