词汇表

FLOPs (每秒浮点运算次数)

了解机器学习中的 FLOPs！了解它如何衡量模型复杂性、影响效率并帮助硬件选择。

FLOP，即浮点运算，是量化机器学习模型计算复杂度的基本指标。机器学习模型计算复杂度的基本指标，特别是在深度学习领域。该指标计算的是数学运算的总数，如涉及十进制数的加法、减法、乘法和除法、十进制数的加减乘除等数学运算的总数。神经网络所需的数学运算总数。通过确定 FLOPs 数、工程师就能估算出执行一个模型所需的处理能力，从而使其成为硬件选择和优化的一个重要统计指标。选择和优化的重要数据。虽然 FLOPs 有别于文件大小或参数数量，但它提供了一个理论基线，以确定模型有多 "重"，这直接关系到能耗和在处理器上的执行速度。如 CPU或 GPU.

FLOP 在人工智能开发中的重要性

了解模型的计算成本对于高效的人工智能开发至关重要。FLOPs 通常表示模型生成预测所需的计算量较少，这对于资源有限的环境至关重要。这对于资源有限的环境至关重要。

硬件选择：知道了 FLOPs，开发人员就能根据特定硬件（如 NVIDIA Jetson 系列）的性能来匹配模型。特定硬件（如NVIDIA ®）Jetson系列或标准嵌入式微控制器。
模型效率：在比较架构时，如检查 YOLO11 性能指标时，FLOP 提供了一种与硬件无关的方法来衡量效率和准确性。
能耗：在电池供电的设备中，减少 FLOPs 可直接延长电池寿命。电池寿命，因为处理器每帧执行的工作更少。

实际应用

当模型从研究转向生产环境时，FLOP 的实际影响最为明显，因为在生产环境中，延迟和功耗都受到限制。和功率受到限制时，FLOP 的实际影响最为明显。

智能手机物体检测：对于执行实时推理的移动应用，设备必须即时处理视频帧视频帧，而不会过热或耗尽电池。开发人员可能会选择轻量级模型，如纳米版本的 YOLO11这样的轻量级模型，因为它的 FLOPs 数量少可确保在移动处理器（如高通 Snapdragon或苹果 Silicon 等移动处理器上运行流畅。
无人机自主导航：用于精准农业中使用的无人机依靠机载计算机来detect 障碍物和绘制地图。由于这些设备有严格的重量限制，限制了电池的因此，工程师需要优化低 FLOP，以最大限度地延长飞行时间，同时保持必要的物体探测能力。物体探测能力。

用Python计算 FLOPs

您可以使用内置的分析工具确定Ultralytics 模型的计算复杂度。下面的下面的代码段加载了一个模型，并计算了特定输入大小所需的 FLOP。

from ultralytics import YOLO

# Load the YOLO11 nano model
model = YOLO("yolo11n.pt")

# Profile the model to see FLOPs, parameters, and speed
# The 'imgsz' argument defines the input resolution (e.g., 640x640)
model.profile(imgsz=640)

该方法会输出一个汇总表，包括参数数、梯度和 GFLOPs（GigaFLOPs，或亿次运算），帮助您评估模型是否符合您的部署限制。

FLOPs vs. 相关指标

必须将 FLOPs 与其他描述模型大小和速度的指标区分开来，因为它们衡量的是性能的不同方面。性能的不同方面。

参数与 FLOP：模型权重模型权重或参数定义了存储模型需要多少内存（RAM）。存储模型所需的内存（RAM）。相比之下，FLOP 衡量的是运行模型所需的计算工作量。A 模型的存储空间可能很小，但如果它经常重复使用参数，计算成本就会很高。递归神经网络 (RNN)。
MACs 与 FLOPs：硬件规格通常是指乘加运算 (MAC)。一个 MAC 通常包括一个乘法运算和一个加法运算，算作两个浮点运算。因此，1 GigaMAC 大致相当于 2 GFLOP。
延迟与 FLOP：FLOP 代表理论上的工作量、推理延迟是指处理输入所需的实际时间（以毫秒为单位毫秒）。延迟受 FLOPs 的影响，但也受内存带宽、软件优化库（如 TensorRT和硬件架构。

度量标准的局限性

虽然 FLOPs 提供了一个有用的基线，但并不能说明模型性能的全部。它们没有考虑内存访问成本（将数据移动到处理器所需的能量和时间），而这往往是现代深度学习系统的瓶颈。此外，像激活函数激活函数（如ReLU）或归一化层等操作的 FLOP 数较低，但仍会消耗时间。因此，FLOP 应与目标系统的实际基准测试结合使用。与目标硬件（如 Raspberry Pi）上的实际基准测试结合使用。树莓派（Raspberry Pi）等目标硬件上的实际基准测试，以准确了解其性能。

FLOPs (每秒浮点运算次数)

培训Ultralytics YOLO 模型，以简化各行业的工作流程

灵活的企业许可解决方案，助力您的创新

使用Ultralytics YOLO在数秒内训练人工智能模型

FLOP 在人工智能开发中的重要性

实际应用

用Python计算 FLOPs

FLOPs vs. 相关指标

度量标准的局限性

阅读更多此类别的内容

未来物体检测趋势：需要关注的 7 个关键问题

利用Ultralytics YOLO 模型增强车辆再识别能力

利用Ultralytics YOLO 模型改进碰撞预测

加入Ultralytics 社区