深圳Yolo 视觉
深圳
立即加入
词汇表

病灶损失

探索焦点损失如何解决深度学习中的类别不平衡问题。学习如何通过Ultralytics 实现该方法,聚焦于困难样本并提升模型准确率。

焦点损失是一种专门的优化目标函数,主要用于解决深度学习中严重的类别不平衡问题。在许多计算机视觉任务(如目标检测)中,背景样本(负样本)数量远超目标物体(正样本)。标准方法(如广泛使用的交叉熵损失)会将所有错误视为等权重,这常导致模型被大量易分类的背景数据淹没。焦点损失通过修改标准损失计算,使错误权重更均衡。 交叉熵损失,会平等对待所有错误,这常导致模型被海量classify 数据淹没。焦点损失通过修改标准损失计算方式,降低这些简单样本的权重,迫使优化算法将学习能力集中于"硬"样本——即稀有且classify 这些classify 对模型性能至关重要。

聚焦机制

焦点损失的核心创新在于其能够根据模型的置信度动态调整每个样本的惩罚值。在典型的监督学习场景中,检测器可能评估图像中数千个候选位置。由于其中多数位置不包含目标,标准损失函数会从这些易判定的负样本中累积大量微小误差信号,从而淹没来自少数正样本的有效信号。

焦点损失引入了一个调制因子,该因子会随着对正确类别置信度的提升而衰减损失贡献。这意味着当模型已99%确定某个背景区域确实属于背景时,该区域的损失值将降至近乎为零。因此,模型权重的更新主要基于误分类样本或模型存在不确定性的样本。 这种定向策略对训练 高性能 单阶段目标检测器(如 YOLO26)至关重要,使其无需复杂采样阶段即可实现高精度。

实际应用

处理不平衡训练数据对于在安全和精度至关重要的环境中部署稳健的人工智能系统至关重要。

  • 医疗健康领域的人工智能医学影像分析等领域,识别病变往往如同大海捞针。例如在寻找微小病灶的核磁共振扫描中,健康组织可能占据超过99%的像素。 标准模型可能通过将所有区域预测为"健康"来最大化简单准确率,从而错失关键诊断。焦点损失机制使系统能够抑制大量健康组织的信号,优先学习异常的细微特征,从而提高挽救生命的检测召回率
  • 自动驾驶汽车 自动驾驶汽车的感知系统必须detect 建筑物、道路和天空构成的复杂背景detect 行人或骑行者detect 道路使用者。虽然背景易于学习,但小型或远距离障碍物的姿势估计 重大姿势估计 。 通过采用焦点损失机制, 汽车应用中的AI可确保感知系统 不会忽略这些detect ,即使危险物仅占据视野极小部分时, 仍能维持安全标准。

利用Ultralytics实施

"(《世界人权宣言》) ultralytics 该库包含针对先进损失函数的优化实现,以支持前沿模型。虽然 Ultralytics 平台 自动配置这些超参数以实现最佳训练效果,开发者也可直接访问这些组件进行定制化研究。

以下示例演示了如何使用 ultralytics 实用程序包,并 计算一组预测值的误差。

import torch
from ultralytics.utils.loss import FocalLoss

# Initialize Focal Loss.
# The 'gamma' parameter controls the focusing strength (higher = more focus on hard examples).
criterion = FocalLoss(gamma=1.5)

# Example: Model predictions (logits) and binary Ground Truth labels
# requires_grad=True simulates model outputs that need backpropagation
predictions = torch.tensor([[0.8], [-1.5], [0.1]], requires_grad=True)
targets = torch.tensor([[1.0], [0.0], [1.0]])

# Calculate the loss value
loss = criterion(predictions, targets)
print(f"Computed Focal Loss: {loss.item():.4f}")

与相关概念的区别

理解焦点损耗在更广泛的误差测量框架中的定位,有助于为特定计算机视觉任务选择正确的策略。

  • 焦点损失与交叉熵损失: 交叉熵是分类的基础指标,它基于对数误差对预测结果进行惩罚。 焦点损失本质上是交叉熵的扩展;当聚焦参数设为零时,其数学表达式将回归为标准交叉熵。核心差异在于焦点损失能自动降低易判负样本的权重,使其在处理COCO等不平衡数据集时表现更优。 COCO等数据集。
  • 焦点损失与IoU : 焦点损失专为分类任务设计(确定物体类别),IoU 用于定位任务(确定物体位置)。现代检测器采用复合损失函数,将焦点损失用于计算类别概率,同时结合IoU指标进行边界框回归。
  • 焦点损失与Dice损失: Dice损失是处理数据不平衡的另一种技术,主要应用于图像分割任务。焦点损失基于置信度对单个像素或样本进行操作,而Dice损失则全局优化预测区域与真实区域之间的重叠度。在复杂的分割工作流中,常将这两种损失函数结合使用。

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入