深圳Yolo 视觉
深圳
立即加入
词汇表

FLOPs (每秒浮点运算次数)

了解机器学习中的 FLOPs!了解它如何衡量模型复杂性、影响效率并帮助硬件选择。

FLOP,即浮点运算,是量化机器学习模型计算复杂度的基本指标。 机器学习模型计算复杂度的基本指标,特别是在 深度学习领域。该指标计算的是数学运算的总数,如涉及十进制数的加法、减法、乘法和除法、 十进制数的加减乘除等数学运算的总数。 神经网络所需的数学运算总数。通过确定 FLOPs 数、 工程师就能估算出执行一个模型所需的处理能力,从而使其成为硬件选择和优化的一个重要统计指标。 选择和优化的重要数据。虽然 FLOPs 有别于文件大小或参数数量,但它提供了一个理论基线,以确定 模型有多 "重",这直接关系到能耗和在处理器上的执行速度。 如 CPUGPU.

FLOP 在人工智能开发中的重要性

了解模型的计算成本对于高效的 人工智能开发至关重要。FLOPs 通常表示模型生成预测所需的计算量较少,这对于资源有限的环境至关重要。 这对于资源有限的环境至关重要。

  • 硬件选择:知道了 FLOPs,开发人员就能根据特定硬件(如 NVIDIA Jetson 系列)的性能来匹配模型。 特定硬件(如NVIDIA ®Jetson系列 或标准嵌入式微控制器。
  • 模型效率:在比较架构时,如检查 YOLO11 性能指标时,FLOP 提供了一种与硬件无关的方法来衡量效率和准确性。
  • 能耗:在电池供电的设备中,减少 FLOPs 可直接延长电池寿命。 电池寿命,因为处理器每帧执行的工作更少。

实际应用

当模型从研究转向生产环境时,FLOP 的实际影响最为明显,因为在生产环境中,延迟和功耗都受到限制。 和功率受到限制时,FLOP 的实际影响最为明显。

  1. 智能手机物体检测:对于执行 实时推理的移动应用,设备必须即时处理视频帧 视频帧,而不会过热或耗尽电池。开发人员可能会选择轻量级模型,如 纳米版本的 YOLO11这样的轻量级模型,因为它的 FLOPs 数量少 可确保在移动处理器(如 高通 Snapdragon或苹果 Silicon 等移动处理器上运行流畅。
  2. 无人机自主导航:用于 精准农业中使用的无人机依靠机载 计算机来detect 障碍物和绘制地图。由于这些设备有严格的重量限制,限制了电池的 因此,工程师需要优化低 FLOP,以最大限度地延长飞行时间,同时保持必要的物体探测能力。 物体探测能力。

用Python计算 FLOPs

您可以使用内置的分析工具确定Ultralytics 模型的计算复杂度。下面的 下面的代码段加载了一个模型,并计算了特定输入大小所需的 FLOP。

from ultralytics import YOLO

# Load the YOLO11 nano model
model = YOLO("yolo11n.pt")

# Profile the model to see FLOPs, parameters, and speed
# The 'imgsz' argument defines the input resolution (e.g., 640x640)
model.profile(imgsz=640)

该方法会输出一个汇总表,包括参数数、梯度和 GFLOPs(GigaFLOPs,或 亿次运算),帮助您评估模型是否符合您的 部署限制

FLOPs vs. 相关指标

必须将 FLOPs 与其他描述模型大小和速度的指标区分开来,因为它们衡量的是性能的不同方面。 性能的不同方面。

  • 参数与 FLOP:模型权重 模型权重或参数定义了存储模型需要多少内存(RAM)。 存储模型所需的内存(RAM)。相比之下,FLOP 衡量的是运行模型所需的计算工作量。A 模型的存储空间可能很小,但如果它经常重复使用参数,计算成本就会很高。 递归神经网络 (RNN)
  • MACs 与 FLOPs:硬件规格通常是指 乘加运算 (MAC)。一个 MAC 通常包括一个乘法运算和一个加法运算,算作两个浮点运算。 因此,1 GigaMAC 大致相当于 2 GFLOP。
  • 延迟与 FLOP:FLOP 代表理论上的工作量、 推理延迟是指处理输入所需的实际时间(以毫秒为单位 毫秒)。延迟受 FLOPs 的影响,但也受内存带宽、软件 优化库(如 TensorRT和硬件 架构。

度量标准的局限性

虽然 FLOPs 提供了一个有用的基线,但并不能说明模型性能的全部。它们没有考虑 内存访问成本(将数据移动到处理器所需的能量和时间),而这往往是现代 深度学习系统的瓶颈。此外,像激活函数 激活函数(如ReLU) 或归一化层等操作的 FLOP 数较低,但仍会消耗时间。因此,FLOP 应与目标系统的实际基准测试结合使用。 与目标硬件(如 Raspberry Pi)上的实际基准测试结合使用。 树莓派(Raspberry Pi)等目标硬件上的实际基准测试,以准确了解其 性能。

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入