探索迁移学习,用更少数据训练高精度人工智能。了解如何利用Ultralytics 预训练Ultralytics 权重,加速您的计算机视觉项目。
迁移学习是机器学习(ML)中一种强大的技术,它将为特定任务开发出的模型作为起点,复用于第二个相关任务的建模。开发者无需从零开始训练神经网络——这需要海量数据集和强大计算能力——而是利用人工智能已有的知识储备。 这种方法模拟了人类的学习过程:例如,掌握钢琴演奏技巧后,学习管风琴会轻松许多,因为音乐理论基础和手指灵活性等能力得以迁移。在深度学习领域,这意味着模型只需更少数据和时间投入,就能在新问题上实现高精度。
迁移学习的有效性在于特征提取的分层特性。深度学习模型——尤其是计算机视觉领域所用的模型——通过分层方式学习识别模式。骨干网络的前几层detect 普遍的特征,如边缘、曲线和纹理。这些低级特征几乎适用于任何视觉任务。
该过程通常包含两个主要阶段:
迁移学习通过允许在不依赖大型科技公司资源的情况下构建专业化解决方案,使人工智能得以普及化。
区分迁移学习与相关术语很有帮助:
以下是 Python 该代码片段演示了使用
ultralytics 图书馆。我们加载 YOLO26 模型,
其预训练权重源自COCO 。当我们在新数据集上启动训练时,
该模型会自动将预先学习到的特征迁移至新任务。
from ultralytics import YOLO
# Load a pre-trained YOLO26 model (transferring weights from COCO)
model = YOLO("yolo26n.pt")
# Train the model on a new, smaller dataset to adapt its knowledge
# This leverages the pre-learned backbone for faster convergence
results = model.train(data="coco8.yaml", epochs=5)
在云端管理数据集并执行这些训练任务时,诸如Ultralytics 工具能简化流程,使团队能够高效协作完成数据标注和迁移学习模型的部署。
若需深入探索学术理论, 斯坦福大学CS231n课程讲义提供了极佳的概览, PyTorch 学习教程 则为具体实现提供了详尽的技术细节。