深圳Yolo 视觉
深圳
立即加入
词汇表

迁移学习

探索迁移学习,用更少数据训练高精度人工智能。了解如何利用Ultralytics 预训练Ultralytics 权重,加速您的计算机视觉项目。

迁移学习是机器学习(ML)中一种强大的技术,它将为特定任务开发出的模型作为起点,复用于第二个相关任务的建模。开发者无需从零开始训练神经网络——这需要海量数据集和强大计算能力——而是利用人工智能已有的知识储备。 这种方法模拟了人类的学习过程:例如,掌握钢琴演奏技巧后,学习管风琴会轻松许多,因为音乐理论基础和手指灵活性等能力得以迁移。在深度学习领域,这意味着模型只需更少数据和时间投入,就能在新问题上实现高精度。

迁移学习的工作原理

迁移学习的有效性在于特征提取的分层特性。深度学习模型——尤其是计算机视觉领域所用的模型——通过分层方式学习识别模式。骨干网络的前几层detect 普遍的特征,如边缘、曲线和纹理。这些低级特征几乎适用于任何视觉任务。

该过程通常包含两个主要阶段:

  1. 预训练:模型在大型基准数据集上进行训练,例如 ImageNet,以学习通用视觉表征。由此获得的模型权重集已具备理解视觉结构的能力。
  2. 适应:预训练模型随后被适应于特定的利基任务。这通常通过 "冻结"早期层(保持其权重固定)并仅在较小规模的定制数据集上 重新训练末端层或检测头来实现。

实际应用

迁移学习通过允许在不依赖大型科技公司资源的情况下构建专业化解决方案,使人工智能得以普及化。

  • 医疗领域的人工智能 为每种特定疾病收集数百万张标注过的医学影像实属不易。 但研究人员可将预先训练于日常物体的模型 应用于医学影像分析。该模型 通过转移其detect 异常的能力, 能以高精度在X光或核磁共振扫描中 检测出肿瘤。
  • 制造业中的人工智能在工业环境中,视觉检测系统必须快速适应新产品线。通用缺陷检测模型可快速更新,以识别特定新组件(如微芯片)中的瑕疵,并利用智能制造工作流最大限度减少停机时间。

与其他概念的关系

区分迁移学习与相关术语很有帮助:

  • 微调微调是迁移学习的一种具体实现方法 迁移学习是复用知识的总体概念,而微调则指机械地解冻模型部分组件,并以较低学习率在新的数据上进行训练的过程。
  • 与零样本学习对比: 迁移学习需要一个训练阶段,该阶段需为新任务准备部分标注数据。相比之下,零样本学习则试图对模型从未见过的classify ,通常依赖语义描述而非视觉示例。

实例

以下是 Python 该代码片段演示了使用 ultralytics 图书馆。我们加载 YOLO26 模型, 其预训练权重源自COCO 。当我们在新数据集上启动训练时, 该模型会自动将预先学习到的特征迁移至新任务。

from ultralytics import YOLO

# Load a pre-trained YOLO26 model (transferring weights from COCO)
model = YOLO("yolo26n.pt")

# Train the model on a new, smaller dataset to adapt its knowledge
# This leverages the pre-learned backbone for faster convergence
results = model.train(data="coco8.yaml", epochs=5)

在云端管理数据集并执行这些训练任务时,诸如Ultralytics 工具能简化流程,使团队能够高效协作完成数据标注和迁移学习模型的部署。

若需深入探索学术理论, 斯坦福大学CS231n课程讲义提供了极佳的概览, PyTorch 学习教程 则为具体实现提供了详尽的技术细节。

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入