探索 AI 中基础模型的强大功能。了解如何使用 Ultralytics Platform 将 Ultralytics YOLO26 等大规模模型应用于自定义任务。
基础模型代表了人工智能 (AI) 领域的一个重大范式转变。它是一个在海量数据(通常包含数十亿参数)上训练的大规模机器学习模型,可以适应广泛的下游任务。与通常为特定单一目的(例如 classify 特定类型的花朵)而构建的传统机器学习 (ML) 模型不同,基础模型在资源密集型预训练阶段学习广泛的模式、结构和关系。这种广泛的知识库使开发人员能够通过迁移学习将模型应用于新问题,从而显著减少实现最先进成果所需的时间和数据。
基础模型的强大之处在于其两阶段开发过程:预训练和微调。在预训练阶段,模型会接触到海量数据集,例如互联网的大部分内容、多样化的图像库或大量的代码库。此阶段常利用自监督学习,这是一种模型从数据结构本身生成自身标签的技术,从而消除了手动数据标注的瓶颈。例如,语言模型可能学习预测句子中的下一个词,而视觉模型则学习理解边缘、纹理和物体恒常性。
一旦经过预训练,模型便可作为一个多功能起点。通过一个称为微调的过程,开发者可以在较小的、特定领域的数据集上调整模型的权重。这一能力是AI民主化的核心,因为它允许计算资源有限的组织利用强大的架构。现代工作流常利用Ultralytics Platform等工具来简化这一适应过程,从而无需从头构建神经网络即可在自定义数据集上进行高效训练。
基础模型是各行业创新的支柱。它们的泛化能力使其适用于从自然语言处理到高级计算机视觉的各种任务。
开发者可以利用基础模型以最少的代码执行复杂任务。以下示例展示了如何加载预训练的YOLO26模型——一个为实时应用优化的视觉基础模型——并在图像上执行目标detect。
from ultralytics import YOLO
# Load a pre-trained YOLO26 foundation model
# 'n' stands for nano, the smallest and fastest version
model = YOLO("yolo26n.pt")
# Perform inference on an image to detect objects
# The model uses its pre-trained knowledge to identify common objects
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results
results[0].show()
区分“基础模型”与AI领域中的相关概念有助于理解它们各自的具体作用:
基础模型的演进正迈向多模态AI,其中单个系统可以同时处理和关联来自文本、图像、音频和传感器数据的信息。像斯坦福大学以人为本AI研究院 (HAI)这样的机构的研究强调了这些系统像人类一样推理世界的潜力。随着这些模型变得更高效,在边缘计算设备上的部署变得越来越可行,将强大的AI能力直接带到智能手机、无人机和物联网传感器。

开启您的机器学习未来之旅