遇见 YOLO26: 下一代视觉 AI。
Ultralytics
返回 Ultralytics 词汇表

Dimensionality Reduction

了解降维如何优化机器学习工作流。探索 PCA 和 t-SNE 等技术,以提高 Ultralytics YOLO26 的性能和数据可视化效果。

降维是机器学习 (ML)和数据科学中的一种转换技术,用于减少数据集中的输入变量(通常称为特征或维度)数量,同时保留最关键的信息。在大数据时代,数据集往往包含成千上万个变量,从而导致一种被称为维度灾难的现象。这种现象会导致模型训练的计算成本变高、容易出现过拟合,且难以解释。通过将高维数据投影到低维空间,从业者可以提高效率、可视化效果和预测性能。

Link to this sectionAI开发中的核心优势#

减少数据复杂性是数据预处理流水线中的基础步骤。它为构建稳健的人工智能 (AI)系统提供了几个切实可行的优势:

  • 增强计算效率: 更少的特征意味着更少的数据需要处理。这加快了像YOLO26这类算法的训练时间,使其更适合实时推理以及在资源受限的边缘AI设备上进行部署。
  • Improved Data Visualization: Human intuition struggles to comprehend data beyond three dimensions. Dimensionality reduction compresses complex datasets into 2D or 3D spaces, enabling effective data visualization to spot clusters, patterns, and outliers using tools like the TensorFlow Embedding Projector.
  • 降噪: 通过关注数据中相关性最高的方差,该技术可以过滤掉噪声和冗余特征。这会产生更清晰的训练数据,帮助模型更好地泛化到未见过的示例中。
  • 存储优化: 在云端存储海量数据集(例如通过Ultralytics Platform管理的数据集)可能会很昂贵。压缩特征空间可以在不牺牲基本数据完整性的前提下显著降低存储需求。

Link to this section关键技术:线性与非线性#

降低维度的方法通常根据它们是保留数据的全局线性结构还是局部非线性流形来进行分类。

Link to this section线性方法#

最成熟的线性技术是主成分分析 (PCA)。PCA通过识别“主成分”(即捕获数据中最大方差的正交轴)来工作。它将原始数据投影到这些新轴上,从而有效丢弃贡献信息较少的维度。这是无监督学习工作流程中的一种主要方法。

Link to this section非线性方法#

对于复杂的数据结构,例如图像或文本嵌入,通常需要使用非线性方法。像t-分布随机邻域嵌入 (t-SNE)UMAP (Uniform Manifold Approximation and Projection)这样的技术在保留局部邻域方面表现出色,使其成为可视化高维聚类的理想选择。此外,自编码器是经过训练的神经网络,用于将输入压缩到潜在空间表示并对其进行重构,从而有效地学习数据的紧凑编码。

Link to this section实际应用#

降维在深度学习 (DL)的各个领域中都至关重要:

  1. 计算机视觉:YOLO26这样的现代目标检测器处理的图像包含成千上万个像素。内部层使用池化和跨步卷积等技术,逐步减少特征图的空间维度,将原始像素提炼为高级语义概念(例如“边缘”、“眼睛”、“汽车”)。

  2. 基因组学和医疗保健:医学图像分析和生物信息学中,研究人员分析具有成千上万个变量的基因表达数据。降维有助于识别疾病分类的关键生物标志物,正如关于癌症基因组学的研究中所见。

  3. 推荐系统: Netflix或Spotify等平台使用矩阵分解(一种降维技术)来预测用户偏好。通过减少用户-项目交互的稀疏矩阵,它们可以基于潜在特征高效地推荐内容。

Link to this section降维与特征选择#

将此概念与特征选择区分开来非常重要,因为它们通过不同的机制实现了相似的目标:

  • 特征选择涉及选择原始特征的一个子集(例如保留“年龄”而丢弃“姓名”)。它不会改变所选特征的值。
  • 降维(具体指特征提取)会创建新的特征,这些特征是原始特征的组合。例如,PCA可能会将“身高”和“体重”组合成一个新的单一成分,代表“体型”。

Link to this sectionPython示例:减少图像嵌入#

以下示例演示了如何获取高维输出(模拟图像嵌入向量)并使用PCA对其进行降维。在可视化YOLO26等模型如何对相似类别进行分组时,这是一个常见的工作流程。

import numpy as np
from sklearn.decomposition import PCA

# Simulate high-dimensional embeddings (e.g., 10 images, 512 features each)
# In a real workflow, these would come from a model like YOLO26n
embeddings = np.random.rand(10, 512)

# Initialize PCA to reduce from 512 dimensions to 2
pca = PCA(n_components=2)
reduced_data = pca.fit_transform(embeddings)

# Output shape is now (10, 2), ready for 2D plotting
print(f"Original shape: {embeddings.shape}")  # (10, 512)
print(f"Reduced shape: {reduced_data.shape}")  # (10, 2)

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅