深圳Yolo 视觉
深圳
立即加入
词汇表

基础模型

探索 AI 中基础模型的强大功能。了解如何使用 Ultralytics Platform 将 Ultralytics YOLO26 等大规模模型应用于自定义任务。

基础模型代表了人工智能 (AI) 领域的一个重大范式转变。它是一个在海量数据(通常包含数十亿参数)上训练的大规模机器学习模型,可以适应广泛的下游任务。与通常为特定单一目的(例如 classify 特定类型的花朵)而构建的传统机器学习 (ML) 模型不同,基础模型在资源密集型预训练阶段学习广泛的模式、结构和关系。这种广泛的知识库使开发人员能够通过迁移学习将模型应用于新问题,从而显著减少实现最先进成果所需的时间和数据。

核心机制:预训练与适应

基础模型的强大之处在于其两阶段开发过程:预训练和微调。在预训练阶段,模型会接触到海量数据集,例如互联网的大部分内容、多样化的图像库或大量的代码库。此阶段常利用自监督学习,这是一种模型从数据结构本身生成自身标签的技术,从而消除了手动数据标注的瓶颈。例如,语言模型可能学习预测句子中的下一个词,而视觉模型则学习理解边缘、纹理和物体恒常性。

一旦经过预训练,模型便可作为一个多功能起点。通过一个称为微调的过程,开发者可以在较小的、特定领域的数据集上调整模型的权重。这一能力是AI民主化的核心,因为它允许计算资源有限的组织利用强大的架构。现代工作流常利用Ultralytics Platform等工具来简化这一适应过程,从而无需从头构建神经网络即可在自定义数据集上进行高效训练。

实际应用

基础模型是各行业创新的支柱。它们的泛化能力使其适用于从自然语言处理到高级计算机视觉的各种任务。

  • 计算机视觉在医疗保健领域的应用: 专门的视觉基础模型可以进行微调,以辅助医学图像分析。最初在通用图像上训练的模型可以调整为detect MRI扫描中的肿瘤或识别扣带骨折在X射线中。这种应用展示了通用视觉理解如何转化为挽救生命的诊断工具。
  • 工业自动化:在制造业中,像Ultralytics YOLO26这样的视觉模型作为目标检测的基础架构。工厂使用这些模型来自动化质量检测,以高速度和准确性 detect 装配线上的缺陷。模型预先存在的物体边界知识加速了这些智能制造解决方案的部署。

技术实现示例

开发者可以利用基础模型以最少的代码执行复杂任务。以下示例展示了如何加载预训练的YOLO26模型——一个为实时应用优化的视觉基础模型——并在图像上执行目标detect。

from ultralytics import YOLO

# Load a pre-trained YOLO26 foundation model
# 'n' stands for nano, the smallest and fastest version
model = YOLO("yolo26n.pt")

# Perform inference on an image to detect objects
# The model uses its pre-trained knowledge to identify common objects
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results
results[0].show()

区分关键术语

区分“基础模型”与AI领域中的相关概念有助于理解它们各自的具体作用:

  • 大语言模型 (LLM): LLM是一种专门设计用于处理和生成文本的基础模型。尽管所有LLM都是基础模型,但并非所有基础模型都是LLM;该类别还包括像SAM (Segment Anything Model)这样的视觉模型和多模态系统。
  • 迁移学习这是将基础模型应用于新任务的技术。基础模型是工件(已保存的神经网络),而迁移学习是更新该工件知识以适应特定用例(例如农业病虫害防治)的过程。
  • 生成式AI: 这指的是可以创建新内容(文本、图像、代码)的系统。许多基础模型为生成式AI应用提供支持,但它们也可以用于分类或目标 track等判别任务,这些任务并非严格意义上的“生成式”。

未来方向与影响

基础模型的演进正迈向多模态AI,其中单个系统可以同时处理和关联来自文本、图像、音频和传感器数据的信息。像斯坦福大学以人为本AI研究院 (HAI)这样的机构的研究强调了这些系统像人类一样推理世界的潜力。随着这些模型变得更高效,在边缘计算设备上的部署变得越来越可行,将强大的AI能力直接带到智能手机、无人机和物联网传感器。

让我们一起共建AI的未来!

开启您的机器学习未来之旅