遇见 YOLO26: 下一代视觉 AI。
Ultralytics
返回 Ultralytics 词汇表

Mixed Precision

了解混合精度如何加速如 Ultralytics YOLO26 等模型的训练并降低内存占用。探索 FP16 和 FP32 在更快获得 AI 见解方面的优势。

混合精度是一种关键的模型优化技术,用于加速深度学习模型的训练并减少内存消耗。通过策略性地结合不同的数值格式(通常是 16 位和 32 位浮点类型),该方法允许机器学习算法在不牺牲模型最终准确性的前提下更快地执行计算。它已成为现代 AI 开发中的标准做法,特别是对于在海量数据集上训练 YOLO26 架构等资源密集型任务而言。

Link to this section混合精度的工作原理#

在传统的深度学习工作流程中,模型通常使用单精度浮点格式 (FP32) 执行计算。FP32 中的每个数字都需要 32 位的内存。虽然精度很高,但这种格式可能会带来高昂的计算成本并占用大量内存。

混合精度引入了半精度 (FP16),仅使用 16 位。然而,仅使用 FP16 可能会因动态范围较小而导致数值不稳定。为了解决这个问题,混合精度方法在保持 FP32 的模型权重“主副本”以确保稳定性的同时,将 FP16 用于卷积和矩阵乘法等数学运算的繁重工作。

该过程通常涉及三个关键步骤:

  1. 类型转换 (Casting): 将模型的输入和激活值转换为 FP16,以加速在兼容硬件(如 NVIDIA Tensor Cores)上的执行速度。

  2. 损失缩放 (Loss Scaling): 放大损失函数值以防止“下溢”,即在 FP16 中微小的梯度更新变为零的情况。

  3. 累加 (Accumulation): 在 FP16 中执行算术运算,但在 FP32 中累加结果,以便在更新主权重之前保留必要的信息。

Link to this sectionAI 训练的优势#

采用混合精度为有效利用计算资源的开发者和研究人员提供了显著的优势:

  • 更快的训练速度: FP16 中的运算所需的内存带宽更少,且能被现代 GPUs 更快地处理。这可以大幅缩短单个轮次 (epoch) 所需的时间。
  • 减少内存使用: 由于 FP16 张量占用的内存仅为 FP32 的一半,开发者基本上可以将批量大小 (batch size) 加倍。更大的批量大小通常会带来更稳定的梯度估计和更快的收敛速度。
  • 能源效率: 减少的计算负载意味着更低的能耗,这对于大规模云训练操作至关重要。

Link to this section实际应用#

混合精度被广泛应用于各行各业,以高效地处理复杂模型和大型数据集。

Link to this section自动驾驶#

自动驾驶汽车的开发过程中,工程师必须在数百万帧高分辨率视频上训练目标检测模型。使用混合精度使他们能够高效地训练像 YOLO26 这样最先进的模型。减少的内存占用使其能够处理更高分辨率的输入,这对于检测远处交通标志或行人等小目标至关重要。

Link to this section医学图像分析#

医学图像分析通常涉及来自 MRI 或 CT 扫描的 3D 体积数据,这些数据对内存的需求极大。以完整的 FP32 精度对此类数据进行分割 (segmentation) 模型训练往往会导致“内存不足”(OOM) 错误。混合精度使研究人员能够将这些沉重的模型放入 GPU 内存中,从而促进了能够辅助医生早期诊断疾病的 AI 的开发。

Link to this section利用 Ultralytics 实现混合精度#

PyTorch 这样的现代框架通常会通过一种称为自动混合精度 (AMP) 的功能自动处理混合精度的复杂性。ultralytics 包在训练过程中默认启用 AMP,以确保实现最佳性能。

以下是一个关于如何使用 YOLO26 开始训练的简明示例,其中混合精度默认处于活动状态(可通过 amp 参数进行控制):

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset
# amp=True is the default setting for mixed precision training
results = model.train(data="coco8.yaml", epochs=5, imgsz=640, amp=True)

Link to this section混合精度与相关概念的对比#

为了避免混淆,将混合精度与术语表中的类似术语区分开来很有帮助:

  • 模型量化 (Model Quantization) 虽然混合精度在[训练期间]使用较低精度的浮点数 (FP16),但量化通常在[训练后]将权重转换为整数(如 INT8)以进行部署。量化主要关注边缘设备上的推理延迟,而混合精度则专注于训练速度和稳定性。
  • 半精度 (Half Precision) 这特指 FP16 数据格式本身。混合精度是同时使用 FP16 和 FP32 的[技术]。如果不使用“混合”的 FP32 主副本而仅使用纯半精度,通常会导致模型因数值错误而无法收敛。

Link to this section结论#

混合精度彻底改变了神经网络的训练方式,成为我们今天所见的大规模基础模型和视觉系统的关键推动力。通过平衡数学精度需求与硬件速度和内存限制,它使开发者能够更快地迭代并构建功能更强大的 AI 解决方案。

对于那些希望无缝管理数据集并训练优化模型的人来说,Ultralytics Platform 提供了一个全面的环境,可以自动利用这些现代优化技术。

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅