词汇表

无监督学习

了解无监督学习如何利用聚类、降维和异常检测来揭示数据中隐藏的模式。

无监督学习是机器学习（ML）的一个动态分支。无监督学习是机器学习（ML）的一个动态分支。和聚类的算法。与需要 "答案密钥 "或标记输入输出对的监督方法不同对不同，无监督学习算法可以自行发现数据中隐藏的模式、底层结构和相关性。相关性。这种能力使其成为更广泛的人工智能（AI）领域的重要工具。人工智能（AI）领域的重要工具、特别是在对数据特征还不完全了解的情况下，非监督学习尤其适用于探索性数据分析。

核心技术和算法

无监督学习包含几种旨在从原始数据中提取见解的方法。这些技术通常按其特定目标进行分类：

聚类：这是最算法将具有相似特征的数据点进行分组。常见的算法包括将数据分成k 个不同群组的K-Means 算法和 DBSCAN和 DBSCAN，后者根据数据密度来确定聚类。
降维当数据集的变量数量过多（维度过高）时，就很难对其进行可视化或处理它们。可采用的技术包括 主成分分析（PCA） 和 t 分布随机邻域嵌入（t-SNE） 在保留基本信息的同时减少输入的数量，通常作为数据预处理的一个步骤。数据预处理步骤。
关联规则挖掘：这种技术能发现大型数据库中变量之间有趣的关系。之间的有趣关系。一个典型的例子是市场篮子分析，零售商用它来识别经常一起购买的商品。

实际应用

处理大量无标记数据的能力使得无监督学习能够推动各行各业的创新。行业的创新：

异常检测：通过学习通过学习 "正常 "数据的样子，无监督模型可以立即标记出偏差。在人工智能在制造业中的应用预测性维护，以在机器故障发生前识别出故障。同样，金融机构也用它来 detect 与标准消费模式不同的欺诈交易。
客户细分：企业利用聚类算法，根据客户的购买行为或人口统计学特征对客户进行分组，而无需预先定义类别。购买行为或人口统计数据进行分组，而无需预先定义类别。这使得超个性化营销策略，这是现代零售解决方案中人工智能的关键组成部分。

与其他学习范式的比较

要了解无监督学习在 ML 领域的地位，就必须将其与其他方法区分开来：

监督学习：依赖于标注的数据集来训练算法以预测结果，例如物体检测等模型 YOLO11.该模型从明确的示例中学习。
半监督学习： 一种混合方法，使用少量标记数据和大量非标记数据。这种方法通常用于在数据标注昂贵或耗时。
强化学习： 强化学习：侧重于代理通过在环境中执行操作并接受奖励或惩罚来学习决策，而不是在数据集中寻找静态模式。惩罚，而不是在数据集中寻找静态模式。

实施实例

虽然像 Ultralytics 在有监督的视觉任务中非常有名、分组数据的基本概念是通用的。下面是一个使用流行的 scikit-learn 库来执行 K-Means 聚类，根据数据点的特征对其进行分组，而不带任何标签。

import numpy as np
from sklearn.cluster import KMeans

# Create a simple dataset with two distinct groups of data points
# Group 1 is near (1, 2), Group 2 is near (10, 4)
X = np.array([[1, 2], [1, 4], [1, 0], [10, 2], [10, 4], [10, 0]])

# Initialize K-Means to find 2 clusters
kmeans = KMeans(n_clusters=2, random_state=0, n_init="auto")

# Fit the model to the data (No labels are provided here)
kmeans.fit(X)

# The model automatically assigns a label (0 or 1) to each point based on proximity
print(f"Predicted Clusters: {kmeans.labels_}")
# Output might look like: [1 1 1 0 0 0] showing the separation

无监督学习的未来

无监督学习对于促进深度学习（DL）的发展至关重要。现代技术，如 自监督学习-等现代技术正在彻底改变诸如自然语言处理（NLP）和计算机视觉（CV）等领域带来了革命性的变化。随着随着全球数据量的指数级增长，从无标签信息中学习的能力对于可扩展的数据科学工作流来说变得越来越重要。可扩展的数据科学工作流程变得越来越重要。

要深入了解技术细节，可参考以下资源 IBM 无监督学习指南和 Scikit-learn 聚类文档等资源提供了优秀的进一步阅读材料。

无监督学习

培训Ultralytics YOLO 模型，以简化各行业的工作流程

灵活的企业许可解决方案，助力您的创新

使用Ultralytics YOLO在数秒内训练人工智能模型

核心技术和算法

实际应用

与其他学习范式的比较

实施实例

无监督学习的未来

阅读更多此类别的内容

理解为何人机协同标注至关重要

什么是数据集蒸馏？快速概述

Oakley Meta AI眼镜正以视觉人工智能技术重新定义眼镜行业

加入Ultralytics 社区