如何使用 Ultralytics YOLO 文档中的“参考”部分
了解如何使用 Ultralytics YOLO 文档中的“参考”部分,以深入理解 Ultralytics Python 软件包的底层原理。

如今,人工智能 (AI) 比以往任何时候都更容易获取,这使得任何人都可以轻松上手,并快速开始使用各种 AI 模型来执行各类前沿任务。
例如,计算机视觉是 AI 的一个分支,它使计算机能够解读和理解来自图像和视频的视觉信息,而像 Ultralytics YOLO11 这样的计算机视觉模型则非常容易上手。
YOLO11 支持目标检测、实例分割和图像分类等任务,并可用于自动驾驶、安全监控和零售分析等应用。

图 1. YOLO11 可用于检测各种对象。
具体来说,Ultralytics Python 软件包 提供了简单易用的工具,可以快速训练、自定义和部署这些 AI 模型,让各种技术水平的用户都能轻松构建先进的计算机视觉应用。
然而,如果你想深入了解其工作原理或进行自定义开发,Ultralytics 文档的 参考部分 是一个绝佳资源。它涵盖了 Ultralytics Python 软件包的内部工作机制,包括数据处理方式、模型训练流程以及如何实现预测可视化。
在本文中,我们将仔细了解 Ultralytics 文档的“参考”部分,以及在从事计算机视觉项目时如何使用它。让我们开始吧!
Link to this section深入了解 Ultralytics YOLO 模型的工作方式#
使用 Ultralytics Python 软件包既简单又直接。你只需几行代码即可训练 YOLO 模型或检测图像中的对象。
但是,一旦你熟悉了计算机视觉模型,Ultralytics 文档中的“参考”部分将帮助你深入研究代码的工作原理以及该软件包支持的功能。它还包括易于理解的解释、可配置选项,以及指向 Ultralytics GitHub 存储库中相关代码的链接。
它解释了 Ultralytics Python 软件包的结构,并涵盖了模型设置、数据加载、训练过程,以及预测是如何生成和返回的关键组件。
所有内容都按类别清晰组织,因此很容易找到所需的信息。例如,如果你正在使用自己的数据集训练模型,可以转到“参考”部分中关于数据的板块,它会让你更清楚地了解数据将如何用于模型训练。
Link to this section如何开始使用“参考”部分#
如果你进入 Ultralytics YOLO 文档中的“参考”部分,会发现页面左侧有一个包含不同参考类别的菜单。每个类别代表 Ultralytics 代码库的特定部分,例如模型、数据处理或训练函数。
点击某个类别,你将进入一个提供更多详细信息的页面。

图 2. 在左侧,你会找到一个包含不同参考类别的菜单。
同样,在页面右侧,你会找到目录,它将每个参考页面拆分为关键组件,如函数(可重用的代码块)、类(用于创建对象的蓝图)和方法(类中定义的函数)。这使你能轻松直接跳到想要查看的内容。

图 3。在右侧,你会找到当前所查看参考页面的目录。
Link to this sectionUltralytics GitHub 存储库的结构#
Ultralytics GitHub 存储库是根据 Ultralytics 软件包的不同部分(如模型、训练和数据)组织成子目录或子软件包的。文档中的“参考”部分遵循相同的结构,这使得理解各部分如何协同工作变得更加容易。
以下是你在 Ultralytics GitHub 存储库和 Ultralytics 文档的“参考”部分中都会看到的一些主要子目录或类别:
- Models(模型):本节重点介绍不同的模型及其模式,例如进行预测、验证性能和导出训练好的模型。
- Engine(引擎):它包含用于训练、验证、预测、导出和评估模型的核心逻辑。
- Data(数据):它管理数据集如何加载、处理和增强。这包括用于创建数据加载器(将数据分批喂入模型的工具)、应用转换(如调整大小或翻转以帮助模型更好地学习的图像修改)以及为训练准备数据(整理和格式化图像与标签)的函数。
- Utils(工具):本节提供了代码库中广泛使用的各种辅助函数,例如可视化工具、文件处理和指标计算。
- HUB:它连接到 Ultralytics HUB(一个无代码计算机视觉平台),通过 API 实现云端功能,例如登录、上传模型和管理数据集。
- Trackers(跟踪器):它为涉及视频或逐帧图像序列的应用实现了目标跟踪逻辑。
GitHub 存储库中的每个子目录在文档中都有对应的部分。这种结构是刻意镜像设计的,使得在阅读文档和探索源代码之间切换变得更加容易。
事实上,在许多参考页面中,还会显示实际的源代码,因此你无需离开文档即可准确查看函数和类的实现方式。

图 4. 参考页面中也包含了源代码。
Link to this section了解模型、引擎和数据组件#
既然我们已经了解了“参考”部分的组织方式,现在让我们仔细看看 Ultralytics 软件包的三个关键部分:模型、引擎和数据。
models 子目录包含定义每种模型如何工作的代码。它按模型类型(如 YOLO、FastSAM 或 RT-DETR)和任务(如检测、分割或分类)进行组织。在每一个子目录中,你会找到处理特定操作的文件或模块——例如,模型如何进行预测、如何进行训练,或者如何评估其性能。
与此同时,engine 子目录在幕后工作以管理整个流程。虽然 models 子目录侧重于每个模型应该做什么,但 engine 子目录侧重于如何以一致且高效的方式运行这些任务。
此外,data 子目录负责加载和准备数据集。代码库的这一部分确保你的训练数据干净、结构化且多样,从而帮助模型更好地学习并实现更有效的泛化。
这种清晰的划分使得代码更易于维护,并赋予了用户进行自定义的灵活性。
Link to this section使用“参考”部分的示例#
你可能想问,理解 Ultralytics 代码库的不同部分为什么很重要?如果你知道代码的哪一部分处理什么内容,那么找到所需信息、进行修改或排查问题就会变得容易得多。
以下是如何使用文档中“参考”部分的一些示例:
- 如果你想问“模型是如何进行预测的?”,你可以转到“参考”部分的 Models 类别,选择一种模型类型(如 YOLO),挑选一个任务(如检测),然后打开“预测”(Predict)页面查看详情。
- 如果你想了解数据增强是如何应用的,可以浏览 Data 类别下的 Augment 页面。它列出了用于提高模型性能和训练数据多样性的内置增强技术。
Link to this section通过“参考”部分探索结果#
当你试图理解模型返回的输出时,“参考”部分也很有帮助。在使用 YOLO11 等模型对图像进行推理后,它会返回一组结果,描述所检测到的内容。
例如,在摄像机源中,它可能会检测到一个人,并使用边界框高亮显示其位置,同时附带一个置信度分数——一个介于 0 到 1 之间的值,表示模型对该检测结果的确信程度。
如果你正试图了解如何在你的项目中使用该输出,“参考”部分可以为你提供指导。它包含一个针对 Results 模块 的页面,详细说明了其中包含的内容以及如何在代码中进行访问。其中有关于如何查看检测框、检查置信度分数、显示结果或保存结果的详细信息。

图 5. YOLO11 返回结果的可视化示例。
Link to this section关键要点#
Ultralytics 文档可帮助你了解如何有效使用 YOLO 模型。它解释了诸如训练模型、准备数据和处理结果等关键流程。每个页面都有清晰的解释和示例代码片段,帮助你快速上手。
如果你对幕后发生的事情感到好奇,文档中的“参考”部分也会进行逐步拆解。它展示了代码的结构、每一部分的作用以及它们是如何协同工作的。这让你能更轻松地学习、自定义并充满信心地构建自己的计算机视觉项目。
加入我们活跃的社区,探索 GitHub 存储库以了解更多关于 AI 构建的知识。准备好实现你的计算机视觉想法了吗?访问我们的许可选项以开始使用。通过访问我们的解决方案页面,查看汽车视觉 AI 和 医疗保健 AI 是如何产生影响的。






