深圳Yolo 视觉
深圳
立即加入
词汇表

置信度

定义 AI 置信度评分。了解模型如何评估预测的确定性,设置可靠性阈值,以及区分置信度和准确性。

机器学习和人工智能领域 在机器学习和人工智能领域,置信度是一个数值,表示模型做出的特定预测 模型预测正确的可能性。通常用 0 到 1 之间的概率(或 0% 到 100% 之间的百分比)来表示,这个分数可以量化模型预测的确定性。 分数量化了 神经网络对其输出的确定性。例如 例如,在物体检测任务中,系统 可能会以 0.95 的置信度预测 "猫 "的存在,这表明系统坚信该标签的准确性。 该标签的准确性。这些分数通常来自模型的最后一层,使用 激活函数(如 多类问题的softmax 函数或二进制问题的 sigmoid 函数用于二元分类。

信心在推理中的作用

置信度分数是推理引擎工作流程的基本组成部分。 推理引擎工作流程的基本组成部分。它们允许开发人员 根据所需的确定性水平对预测进行过滤,这一过程被称为阈值化。通过设置特定的 置信度阈值,就可以有效地管理识别每个可能对象(高召回率) 和确保已识别对象的正确性(高精度)之间的权衡。

在实际模型部署中,原始预测 通常包含噪声或低概率检测。像 非最大抑制(NMS)等技术利用 置信度分数来消除多余的重叠框,只保留概率最高的检测结果。 这就确保了呈现给用户的最终输出是干净的、可操作的。

下面的示例演示了如何在推理过程中应用置信度阈值,使用 Ultralytics YOLO11:

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# Run inference on an image with a confidence threshold of 0.6 (60%)
# This filters out any detections with a confidence score lower than 0.6
results = model.predict("https://ultralytics.com/images/bus.jpg", conf=0.6)

# Display the count of objects detected above the threshold
print(f"Detected {len(results[0].boxes)} objects with high confidence.")

实际应用

置信度分数的用途几乎遍及所有部署计算机视觉和人工智能解决方案的行业。 计算机视觉和人工智能解决方案。

  • 自主系统:在开发 在开发自动驾驶汽车的过程中,安全至关重要。 感知系统使用置信度分数来融合来自摄像头和激光雷达的数据。如果视觉模型检测到的障碍物 如果视觉模型检测到的障碍物可信度较低,系统可能会在触发紧急制动之前将其与雷达数据进行交叉参考。这种 分层方法对汽车领域的人工智能至关重要、 这种分层方法对汽车领域的人工智能至关重要,有助于防止因 假阳性
  • 医疗诊断:在 在医学图像分析中,人工智能工具可帮助医生 在医学图像分析中,人工智能工具通过标记 X 射线或核磁共振成像中潜在的异常现象来协助医生。为 医疗保健领域的人工智能系统可根据可信度自动分流病例。 根据置信度自动分流病例。高置信度的病理检测会被优先处理,以便放射科医生立即进行复查。 放射科医生进行审查,而低置信度区域可能会被突出显示 而置信度低的区域可能会被突出显示,以便 "再看一遍",确保人工智能充当的是辅助助手,而不是明确的决策者。 决策者。

置信度与准确度和精确度

实践者必须将 "置信度 "与用于基准测试的标准评估指标区分开来。 评估指标 模型的标准评估指标。

  • 置信度与准确度: 准确度衡量模型在整个数据集中的整体正确性 整个数据集的整体正确性(例如,"该模型的准确率为 90%")。相比之下,置信度是一个 预测的特定值(例如,"我有 90% 的把握这张特定图片是一只狗")。一个模型可以 一般来说是准确的,但在困难的例子中仍然会输出低置信度。
  • 置信度与精确度: 精确度计算的是 实际正确预测的百分比。虽然两者相关,但如果出现以下情况,高置信度得分并不能保证高精度 如果模型存在过度拟合或校准不当的问题 校准。
  • 校准:如果模型的置信度分数反映了正确性的真实概率,则该模型被认为是 "校准良好 "的。 正确性的真实概率。例如 在所有置信度为 0.8 的预测中,大约 80% 应该是实际的正匹配。

提高模型信心

如果一个模型对有效对象的置信度一直很低,则可能表明训练数据有问题。 训练数据的问题。改进策略包括 扩充数据,让模型接触到更多的 不同的光照和方向,或采用 主动学习,对模型在特定的 "边缘情况 "下进行注释和再训练。 对模型目前不确定的特定 "边缘情况 "进行注释和再训练。确保多样化和高质量的数据集是 对于建立用户可以信赖的强大系统至关重要。

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入