定义 AI 置信度评分。了解模型如何评估预测的确定性,设置可靠性阈值,以及区分置信度和准确性。
在机器学习和人工智能领域 在机器学习和人工智能领域,置信度是一个数值,表示模型做出的特定预测 模型预测正确的可能性。通常用 0 到 1 之间的概率(或 0% 到 100% 之间的百分比)来表示,这个分数可以量化模型预测的确定性。 分数量化了 神经网络对其输出的确定性。例如 例如,在物体检测任务中,系统 可能会以 0.95 的置信度预测 "猫 "的存在,这表明系统坚信该标签的准确性。 该标签的准确性。这些分数通常来自模型的最后一层,使用 激活函数(如 多类问题的softmax 函数或二进制问题的 sigmoid 函数用于二元分类。
置信度分数是推理引擎工作流程的基本组成部分。 推理引擎工作流程的基本组成部分。它们允许开发人员 根据所需的确定性水平对预测进行过滤,这一过程被称为阈值化。通过设置特定的 置信度阈值,就可以有效地管理识别每个可能对象(高召回率) 和确保已识别对象的正确性(高精度)之间的权衡。
在实际模型部署中,原始预测 通常包含噪声或低概率检测。像 非最大抑制(NMS)等技术利用 置信度分数来消除多余的重叠框,只保留概率最高的检测结果。 这就确保了呈现给用户的最终输出是干净的、可操作的。
下面的示例演示了如何在推理过程中应用置信度阈值,使用 Ultralytics YOLO11:
from ultralytics import YOLO
# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")
# Run inference on an image with a confidence threshold of 0.6 (60%)
# This filters out any detections with a confidence score lower than 0.6
results = model.predict("https://ultralytics.com/images/bus.jpg", conf=0.6)
# Display the count of objects detected above the threshold
print(f"Detected {len(results[0].boxes)} objects with high confidence.")
置信度分数的用途几乎遍及所有部署计算机视觉和人工智能解决方案的行业。 计算机视觉和人工智能解决方案。
实践者必须将 "置信度 "与用于基准测试的标准评估指标区分开来。 评估指标 模型的标准评估指标。
如果一个模型对有效对象的置信度一直很低,则可能表明训练数据有问题。 训练数据的问题。改进策略包括 扩充数据,让模型接触到更多的 不同的光照和方向,或采用 主动学习,对模型在特定的 "边缘情况 "下进行注释和再训练。 对模型目前不确定的特定 "边缘情况 "进行注释和再训练。确保多样化和高质量的数据集是 对于建立用户可以信赖的强大系统至关重要。