遇见 YOLO26: 下一代视觉 AI。
Ultralytics
返回 Ultralytics 词汇表

t-distributed Stochastic Neighbor Embedding (t-SNE)

探索 t-SNE 如何可视化高维数据。学习为 Ultralytics YOLO26 揭示计算机视觉特征中的聚类,并优化机器学习模型。

t-分布随机邻域嵌入 (t-SNE) 是一种用于可视化高维数据的统计方法,它通过为每个数据点在二维或三维地图中分配一个位置来实现。这种技术是一种非线性 降维 形式,广泛应用于机器学习中,用于探索包含成百上千个特征的数据集。与侧重于保留全局结构的线性方法不同,t-SNE 擅长将相似的实例保持在一起,从而揭示原本可能隐藏的局部簇和流形。这使其成为从基因组研究到理解深度神经网络内部逻辑等各个领域中不可或缺的工具。

Link to this sectiont-SNE 的工作原理#

t-SNE 的核心思想是将数据点之间的相似度转换为联合概率。在原始的高维空间中,算法使用高斯分布来衡量点之间的相似度。如果两个点彼此靠近,它们成为“邻居”的概率就很高。然后,算法会尝试在保持这些概率的同时,将这些点映射到低维空间(通常是 2D 或 3D)。

为实现这一目标,它使用学生 t-分布在低维地图中定义了一个相似的概率分布。这种特定分布的尾部比普通高斯分布更重,这有助于解决“拥挤问题”——即高维空间中的点在投影到低维时倾向于堆叠在一起的现象。通过在可视化中将不相似的点推得更远,t-SNE 创建了清晰、易读的 聚类,从而揭示了 训练数据 的底层结构。该算法通过 无监督学习 最小化高维和低维概率分布之间的散度,有效地学习到最佳的地图表示。

Link to this section人工智能的实际应用#

t-SNE 是 探索性数据分析 (EDA) 和模型诊断的标准工具。它允许工程师“看到”模型正在学习什么。

  • 验证计算机视觉特征: 在使用 YOLO26 等模型的物体检测工作流程中,开发人员通常需要检查网络是否能区分视觉上相似的类别。通过提取网络最终层的 特征图 并使用 t-SNE 进行投影,工程师可以直观地查看“猫”的图像是否与“狗”的图像分离开来。如果聚类混合在一起,则说明模型的 特征提取 能力需要改进。
  • 自然语言处理 (NLP): t-SNE 被大量用于可视化词 嵌入。当高维词向量(通常为 300 维以上)被投影到 2D 时,具有相似语义的词会自然地聚集在一起。例如,一个 t-SNE 图可能会显示一个包含“国王”、“王后”、“王子”和“君主”的簇,这表明 自然语言处理 (NLP) 模型掌握了皇室的概念。
  • 基因组学与生物信息学: 研究人员使用 t-SNE 来可视化单细胞 RNA 测序数据。通过将数以千计的基因表达值降维到 2D 图中,科学家可以识别不同的细胞类型并追踪发育轨迹,从而有助于发现新的生物学见解和疾病标志物。

Link to this section与 PCA 的比较#

区分 t-SNE 与 主成分分析 (PCA)(另一种常见的降维技术)非常重要。

  • PCA 是一种线性技术,侧重于保留数据的全局方差。它是确定性的且计算效率高,非常适合初始数据压缩或降噪。
  • t-SNE 是一种侧重于保留局部邻域的非线性技术。它是概率性(随机)的,计算量更大,但能为复杂的非线性流形产生更好的可视化效果。

数据预处理 中的一个常见最佳实践是先使用 PCA 将数据降维到可管理的尺寸(例如 50 维),然后再应用 t-SNE 进行最终可视化。这种混合方法既降低了计算负载,又过滤掉了可能损害 t-SNE 结果的噪声。

Link to this sectionPython 示例:可视化特征#

以下示例演示了如何使用 scikit-learn 将 t-SNE 应用于合成数据集。此工作流程反映了人们如何可视化从深度学习模型中提取的特征。

import matplotlib.pyplot as plt
from sklearn.datasets import make_blobs
from sklearn.manifold import TSNE

# Generate synthetic high-dimensional data (100 samples, 50 features, 3 centers)
X, y = make_blobs(n_samples=100, n_features=50, centers=3, random_state=42)

# Apply t-SNE to reduce dimensions from 50 to 2
# 'perplexity' balances local vs global aspects of the data
tsne = TSNE(n_components=2, perplexity=30, random_state=42)
X_embedded = tsne.fit_transform(X)

# Plot the result to visualize the 3 distinct clusters
plt.scatter(X_embedded[:, 0], X_embedded[:, 1], c=y)
plt.title("t-SNE Projection of High-Dimensional Data")
plt.show()

Link to this section关键注意事项#

虽然功能强大,但 t-SNE 需要仔细进行 超参数调整。“困惑度”(perplexity) 参数至关重要;它本质上是猜测每个点有多少个近邻。设置得太低或太高都可能导致误导性的可视化结果。此外,t-SNE 并不能很好地保留全局距离——这意味着图上两个不同簇之间的距离并不一定反映它们在原始空间中的物理距离。尽管有这些细微差别,它仍然是验证 计算机视觉 (CV) 架构和理解复杂数据集的基石技术。管理大规模数据集的用户通常会在进行此类深度分析之前利用 Ultralytics Platform 来组织他们的数据。

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅