Ultralytics YOLO

如何使用 Ultralytics YOLO 文档的“参考”部分

了解如何使用 Ultralytics YOLO 文档的“参考”部分，来理解 Ultralytics Python 包的底层逻辑。

ABAbirami Vina4 min readApril 9, 2025

如今，人工智能（AI）变得比以往任何时候都更加触手可及，任何人都可以深入探索并快速开始使用各种 AI 模型来完成不同的尖端任务。

例如，计算机视觉是 AI 的一个分支，它使计算机能够解读和理解来自图像和视频的视觉信息，而像 Ultralytics YOLO11 这样的计算机视觉模型上手非常容易。

YOLO11 支持目标检测、实例分割和图像分类等任务，并可用于自动驾驶、安全监控和零售分析等应用场景。

YOLO11 检测各类物体

图 1. YOLO11 可用于检测各种对象。

具体而言，Ultralytics Python 软件包提供了用户友好的工具，可快速训练、自定义和部署这些 AI 模型，让各种技能水平的用户都能轻松构建先进的计算机视觉应用。

但是，如果你有兴趣深入了解其工作原理或进行自定义开发，Ultralytics 文档的参考部分是一个极好的资源。它涵盖了 Ultralytics Python 软件包的内部工作机制，包括数据处理方式、模型训练过程以及如何可视化预测结果。

在本文中，我们将仔细了解 Ultralytics 文档的参考部分，以及在从事计算机视觉项目时如何使用它。让我们开始吧！

Link to this section深入了解 Ultralytics YOLO 模型的工作原理#

使用 Ultralytics Python 软件包简单直接。你只需几行代码即可训练 YOLO 模型或在图像中检测对象。

然而，当你熟悉了计算机视觉模型的工作流程后，Ultralytics 文档的参考部分将帮助你更深入地了解代码是如何运作的以及该软件包支持哪些功能。它还包含易于理解的解释、可配置选项以及指向 Ultralytics GitHub 仓库中相关代码的链接。

它解释了 Ultralytics Python 软件包的结构，并涵盖了模型设置、数据加载、训练过程以及如何生成和返回预测结果等关键组件。

所有内容都组织在清晰的类别中，因此很容易找到你需要的信息。例如，如果你正在使用自己的数据集训练模型，可以前往参考部分中关于数据的内容，它会让你更清楚地了解数据将如何被用于模型训练。

如果你前往 Ultralytics YOLO 文档中的参考部分，你会发现在页面左侧有一个菜单，其中包含不同的参考类别。每个类别代表 Ultralytics 代码库的特定部分，例如模型、数据处理或训练功能。

点击某个类别将带你进入一个提供更多详细信息的页面。

页面左侧不同的 Reference 分类菜单

图 2. 在左侧，你会找到不同参考类别的菜单。

同样，在页面右侧，你会找到目录，它将每个参考页面分解为关键组件，如函数（可重用的代码块）、类（创建对象的蓝图）和方法（定义在类内部的函数）。这让你能够轻松直接地跳转到你寻找的内容。

Reference 页面右侧的目录

图 3。在右侧，你会找到当前查看的特定参考页面的目录。

Ultralytics GitHub 仓库基于 Ultralytics 软件包的不同部分（如模型、训练和数据）组织成子目录或子包。文档中的参考部分遵循相同的结构，这使得理解各部分如何组合在一起变得更加容易。

以下是你将在 Ultralytics GitHub 仓库和 Ultralytics 文档参考部分中看到的一些主要子目录或类别：

Models（模型）：本部分侧重于不同的模型及其模式，例如进行预测、验证性能和导出已训练的模型。
Engine（引擎）：它包含用于训练、验证、预测、导出和评估模型的核心逻辑。
Data（数据）：它管理数据集的加载、处理和增强方式。这包括用于创建数据加载器（将数据批量输入模型的工具）、应用变换（对图像进行的调整，如调整大小或翻转，以帮助模型更好地学习）以及为训练准备数据（整理和格式化图像与标签）的功能。
Utils（工具）：本部分提供在代码库中使用的各种辅助函数，如可视化工具、文件处理和指标计算。
HUB：它连接到 Ultralytics HUB，这是一个无代码计算机视觉平台，通过 API 启用云端功能，例如登录、上传模型和管理数据集。
Trackers（追踪器）：它为涉及视频或逐帧图像序列的应用实现了对象追踪逻辑。

GitHub 仓库中的每个子目录在文档中都有相应的对应部分。这种结构是有意为之的，旨在让用户更容易在阅读文档和探索源代码之间进行切换。

事实上，在许多参考页面中，实际的源代码也会显示出来，因此你无需离开文档即可准确查看函数和类是如何实现的。

Reference 页面中包含的源代码

图 4. 参考页面中也包含了源代码。

既然我们已经了解了参考部分是如何组织的，那么让我们仔细看看 Ultralytics 软件包的三个关键部分：模型、引擎和数据。

Models 子目录包含定义每种类型模型如何工作的代码。它根据模型类型（如 YOLO、FastSAM 或 RT-DETR）和任务（如检测、分割或分类）进行组织。在这些目录中，你会找到处理特定操作的文件或模块——例如模型如何进行预测、如何训练，或者如何评估其性能。

同时，Engine 子目录在后台运行，管理整个流程。虽然 Models 子目录侧重于每个模型应该做什么，但 Engine 子目录侧重于如何以一致且高效的方式执行这些任务。

此外，Data 子目录负责加载和准备数据集。这部分代码库确保你的训练数据干净、结构化且多样化，从而帮助模型更好地学习并提升泛化能力。

这种清晰的划分使得代码更易于维护，同时也为用户提供了自定义的灵活性。

你可能想知道，为什么了解 Ultralytics 代码库的不同部分很重要？如果你知道哪部分代码处理什么功能，就更容易找到所需的信息、进行修改或解决问题。

以下是如何使用文档参考部分的一些示例：

如果你在问：“模型如何进行预测？”，你可以前往参考部分的 Models 类别，选择一种模型类型（如 YOLO），选择一个任务（如 detect），然后打开 Predict 页面查看详情。
如果你想了解数据增强是如何应用的，可以浏览 Data 类别下的 Augment 页面。它列出了用于提高模型性能和训练数据多样性的内置增强技术。