深圳Yolo 视觉
深圳
立即加入
词汇表

置信度

探索置信度分数在 AI 中的作用。了解如何过滤预测、优化精确率-召回率权衡,并实现 Ultralytics YOLO26 以提高准确性。

在人工智能和机器学习领域,置信度分数是量化模型对特定预测确定性水平的指标。该值通常介于 0 到 1 之间(或 0% 到 100%),表示算法输出与真实值一致的估计概率。例如,在对象detect任务中,如果系统以 0.92 的置信度将图像的某个区域识别为“自行车”,则表明分类正确的估计可能性为 92%。这些分数源自神经网络的最后一层,通常通过激活函数(例如用于多类分类的Softmax或用于二元决策的Sigmoid 函数)进行处理。

信心在推理中的作用

置信度分数是推理引擎工作流程的基本组成部分,充当过滤器,将高质量预测与背景噪声区分开来。这种过滤过程(称为阈值处理)使开发人员能够调整应用程序的灵敏度。通过设置最小置信度阈值,您可以管理关键的精确率-召回率权衡。较低的阈值可能会detect更多对象,但会增加误报的风险,而较高的阈值会提高精确率,但可能会导致遗漏细微的实例。

Ultralytics YOLO26 等先进架构中,置信度分数对于 非极大值抑制 (NMS) 等后处理技术至关重要。NMS 利用这些分数来移除显著重叠的冗余边界框,只保留概率最高的 detect。这一步确保了最终输出清晰,并为下游任务(如 目标计数 或 track)做好了准备。

以下 python 示例演示了如何使用置信度过滤预测 ultralytics 包装

from ultralytics import YOLO

# Load the latest YOLO26n model
model = YOLO("yolo26n.pt")

# Run inference with a confidence threshold of 0.5 (50%)
# Only detections with a score above this value are returned
results = model.predict("https://ultralytics.com/images/bus.jpg", conf=0.5)

# Inspect the confidence scores of the detected objects
for box in results[0].boxes:
    print(f"Class: {box.cls}, Confidence: {box.conf.item():.2f}")

实际应用

置信度分数提供了一层可解释性,这在应用 计算机视觉 (CV) 的各个行业中都不可或缺。它们帮助自动化系统确定何时自主进行,以及何时触发警报以供人工审查。

  • 自动驾驶:汽车 AI 领域,自动驾驶汽车依赖置信度指标来确保乘客安全。如果感知系统以低置信度 detect 到障碍物,它可能会将此数据与 LiDAR 传感器 或雷达进行交叉参照,以在执行紧急操作之前验证物体的存在。这种冗余有助于防止由阴影或眩光引起的“幽灵刹车”。
  • 医疗诊断:医疗AI领域,模型通过标记影像数据中的潜在异常来辅助医疗专业人员。用于肿瘤检测的系统可能会高亮显示高置信度区域以供即时诊断,而较低置信度的预测则被记录下来以进行二次分析。这种人机协作工作流程确保AI增强临床决策,而非取代专家判断。
  • 工业自动化:智能制造中,机械臂使用置信度分数与装配线上的物体进行交互。配备视觉AI的机器人可能只在 detect 置信度超过 90% 时才尝试抓取部件,从而降低因错位而损坏精密部件的风险。

区分自信与相关术语

将置信度与其他用于 模型评估 的统计指标区分开来至关重要。

  • 置信度与准确率:准确率是一个全局指标,描述模型在整个数据集上正确的频率(例如,“该模型准确率为92%”)。相比之下,置信度是一个局部的、特定于预测的值(例如,“模型有92%的把握认为这张特定图像包含一只猫”)。模型可能具有较高的总体准确率,但在 边缘情况下仍可能产生低置信度。
  • 置信度与概率校准:原始置信度分数并不总是与真实 正确概率一致。如果以0.8置信度做出的预测大约80%的时间是正确的,那么模型就是“良好校准”的。 普拉特缩放 (Platt scaling)等渗回归 (Isotonic Regression) 等技术常被采用,以使分数与经验概率对齐。
  • 置信度与精确率: 精确率衡量实际正确的阳性识别的比例。虽然提高置信度阈值通常会提高精确率,但这往往是以牺牲 召回率为代价的。开发者必须根据其应用是优先考虑少漏检目标还是最小化误报来调整此阈值。

提高模型信心

如果模型对有效目标持续输出低置信度,这通常表明 训练数据 与部署环境之间存在差异。缓解这种情况的策略包括 数据增强,即通过改变光照、旋转和噪声来人工扩展数据集。此外,使用 Ultralytics Platform 实施 主动学习 流程,允许开发人员轻松识别低置信度样本,对其进行标注,并重新训练模型。这种迭代循环对于创建能够在动态真实世界环境中可靠运行的强大 AI 代理 至关重要。

让我们一起共建AI的未来!

开启您的机器学习未来之旅