深圳Yolo 视觉
深圳
立即加入
词汇表

无监督学习

了解无监督学习如何利用聚类、降维和异常检测来揭示数据中隐藏的模式。

无监督学习是机器学习(ML)的一个动态分支。 无监督学习机器学习(ML)的一个动态分支。 和聚类的算法。与需要 "答案密钥 "或标记输入输出对的监督方法不同 对不同,无监督学习算法可以自行发现数据中隐藏的模式、底层结构和相关性。 相关性。这种能力使其成为更广泛的人工智能(AI)领域的重要工具。 人工智能(AI)领域的重要工具、 特别是在对数据特征还不完全了解的情况下,非监督学习尤其适用于探索性数据分析。

核心技术和算法

无监督学习包含几种旨在从原始数据中提取见解的方法。这些技术 通常按其特定目标进行分类:

  • 聚类这是最 算法将具有相似特征的数据点进行分组。常见的算法 包括将数据分成k 个不同群组的K-Means 算法DBSCAN和 DBSCAN,后者根据数据密度来确定聚类。
  • 降维 当数据集的变量数量过多(维度过高)时,就很难对其进行可视化或 处理它们。可采用的技术包括 主成分分析(PCA)t 分布随机邻域嵌入(t-SNE) 在保留基本信息的同时减少输入的数量,通常作为数据预处理的一个步骤。 数据预处理步骤。
  • 关联规则挖掘:这种技术能发现大型数据库中变量之间有趣的关系。 之间的有趣关系。一个典型的例子是 市场篮子分析,零售商用它来 识别经常一起购买的商品。

实际应用

处理大量无标记数据的能力使得无监督学习能够推动各行各业的创新。 行业的创新:

  1. 异常检测通过学习 通过学习 "正常 "数据的样子,无监督模型可以立即标记出偏差。在 人工智能在制造业中的应用 预测性维护,以在机器故障发生前识别出故障。同样,金融机构也用它来 detect 与标准消费模式不同的欺诈交易。
  2. 客户细分:企业利用聚类算法,根据客户的购买行为或人口统计学特征对客户进行分组,而无需预先定义类别。 购买行为或人口统计数据进行分组,而无需预先定义类别。这使得超个性化营销 策略,这是现代 零售解决方案中人工智能的关键组成部分。

与其他学习范式的比较

要了解无监督学习在 ML 领域的地位,就必须将其与其他方法区分开来:

  • 监督学习依赖于 标注的数据集来训练算法以预测结果,例如 物体检测等模型 YOLO11.该模型从明确的示例中学习。
  • 半监督学习 一种混合方法,使用少量标记数据和大量非标记数据。这种方法 通常用于在 数据标注昂贵或耗时。
  • 强化学习 强化学习:侧重于代理通过在环境中执行操作并接受奖励或惩罚来学习决策,而不是在数据集中寻找静态模式。 惩罚,而不是在数据集中寻找静态模式。

实施实例

虽然像 Ultralytics 在有监督的视觉任务中非常有名、 分组数据的基本概念是通用的。下面是一个使用流行的 scikit-learn 库来执行 K-Means 聚类,根据数据点的特征对其进行分组,而不带 任何标签。

import numpy as np
from sklearn.cluster import KMeans

# Create a simple dataset with two distinct groups of data points
# Group 1 is near (1, 2), Group 2 is near (10, 4)
X = np.array([[1, 2], [1, 4], [1, 0], [10, 2], [10, 4], [10, 0]])

# Initialize K-Means to find 2 clusters
kmeans = KMeans(n_clusters=2, random_state=0, n_init="auto")

# Fit the model to the data (No labels are provided here)
kmeans.fit(X)

# The model automatically assigns a label (0 or 1) to each point based on proximity
print(f"Predicted Clusters: {kmeans.labels_}")
# Output might look like: [1 1 1 0 0 0] showing the separation

无监督学习的未来

无监督学习对于促进 深度学习(DL)的发展至关重要。现代技术,如 自监督学习-等现代技术正在彻底改变诸如 自然语言处理(NLP)计算机视觉(CV)等领域带来了革命性的变化。随着 随着全球数据量的指数级增长,从无标签信息中学习的能力对于可扩展的数据科学工作流来说变得越来越重要。 可扩展的数据科学工作流程变得越来越重要。

要深入了解技术细节,可参考以下资源 IBM 无监督学习指南Scikit-learn 聚类文档等资源提供了 优秀的进一步阅读材料。

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入