深圳尤洛视觉
深圳
立即加入
词汇表

对比学习

探索对比学习的力量,这是一种自监督技术,可以用最少的标记数据实现强大的数据表示。

对比学习是一种 机器学习 技术,它训练模型来区分相似和不相似的事物。模型不是学习从单个数据点预测标签,而是通过比较成对的示例进行学习。其核心思想是教导模型在特征空间中将相似(正)对的表示拉得更近,同时将不相似(负)对的表示推得更远。这种方法对于从大型未标记数据集中学习有意义的表示非常有效,使其成为 自监督学习 这一更广泛类别中的一种强大方法。

它是如何工作的?

对比学习的过程围绕创建正样本和负样本展开。对于给定的数据点(称为“锚点”),模型的训练方式如下:

  1. 正样本对: 正样本对由锚点和在语义上与其相似的数据点组成。在计算机视觉 (CV)中,通常通过对锚点图像应用强数据增强(如随机裁剪、旋转或颜色抖动)来创建正样本。锚点和增强版本都被认为是正样本对,因为它们源自同一源图像。
  2. 负样本对:负样本对由锚点和一个不相似的数据点组成。在典型的设置中,训练批次中的所有其他图像都被视为负样本。
  3. 训练目标:该模型(通常是卷积神经网络 (CNN))处理这些对,并使用对比损失函数(例如 InfoNCE 或 Triplet Loss)进行优化。当负对太接近或正对在嵌入空间中相距太远时,此损失函数会惩罚模型。像 SimCLRMoCo 这样的具有里程碑意义的研究论文极大地推动了这些技术。

实际应用

对比学习擅长预训练模型,以学习强大的特征表示,然后可以针对特定任务进行微调。

  • 视觉搜索和图像检索:在电子商务中,用户可能希望找到在视觉上与他们上传的图像相似的产品。使用对比学习预训练的模型可以将图像映射到向量空间,其中相似的项目聚集在一起。这允许高效的语义搜索和推荐系统,这对于改善零售业人工智能中的客户体验至关重要。
  • 下游任务的预训练: 像 Ultralytics YOLO11 这样的模型可以受益于使用对比方法在大型未标记数据集上进行的预训练。 这有助于模型在微调到较小的标记数据集上以执行对象检测实例分割等任务之前,学习强大的视觉特征。 这种方法通常会带来更好的性能和更快的收敛速度,尤其是在标记数据稀缺时,这种概念被称为小样本学习

对比学习与其他范例的比较

区分对比学习和相关范式有助于理解其独特之处:

  • 监督学习:完全依赖于精心标记的数据,例如带有边界框的图像,用于目标检测任务。相比之下,对比学习从数据本身生成其自身的监督信号,从而大大减少了手动数据标注的需求。
  • 无监督学习: 这是一个广泛的类别,旨在发现未标记数据中的隐藏模式。虽然对比学习使用像传统无监督方法(例如,k-means 聚类)一样的未标记数据,但它与众不同,因为它创建了一个类似监督的目标(比较对的预训练任务)来指导学习过程。
  • 自监督学习 (SSL):对比学习是一种突出的 SSL 类型。SSL 是一种范例,其中监督是从数据本身生成的。对比学习是实现此目的的一种方式,但也存在其他非对比 SSL 方法,例如基于预测图像的掩蔽部分的方法。

益处与挑战

益处:

  • 减少标签依赖性: 利用大量未标记的数据,减少对昂贵且耗时的 数据标注 的需求。
  • 稳健的表征:通常学习对干扰变化更不变的特征,与纯粹的监督方法相比。
  • 有效预训练: 为在特定下游任务上进行微调提供了出色的起点,通常可以带来更好的性能,尤其是在标记数据有限的情况下。您可以探索预训练模型在训练自定义模型中的使用方式。

挑战:

  • 负样本选择:性能可能对负样本的数量和质量敏感。选择信息量大的负样本至关重要,但也具有挑战性。
  • 增强策略: 数据增强技术的选择在很大程度上影响了模型学习到的不变性。
  • 计算成本: 通常需要大的批量大小和大量的计算资源 (GPU) 才能进行有效的训练,尽管目前正在进行研究以缓解这种情况。诸如 Ultralytics HUB 之类的平台可以促进管理和训练这些模型PyTorch官方网站)和 TensorFlow官方网站)等框架提供了用于实施对比学习方法的工具。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入
链接已复制到剪贴板