Confidence
探索置信度分数在 AI 中的作用。学习如何过滤预测结果、优化精确率-召回率权衡,并实现 Ultralytics YOLO26 以提高准确性。
In the realm of artificial intelligence and machine learning, a confidence score is a metric that quantifies the level of certainty a model has regarding a specific prediction. This value typically ranges from 0 to 1 (or 0% to 100%) and represents the estimated probability that the algorithm's output aligns with the ground truth. For instance, in an object detection task, if a system identifies a region of an image as a "bicycle" with a confidence of 0.92, it suggests a 92% estimated likelihood that the classification is correct. These scores are derived from the final layer of a neural network, often processed through an activation function such as Softmax for multi-class categorization or the Sigmoid function for binary decisions.
Link to this section置信度在推理中的作用#
置信度分数是 inference engine 工作流程的基础组成部分,充当区分高质量预测与背景噪声的过滤器。这种过滤过程称为阈值处理,能让你调整应用程序的灵敏度。通过设定最低置信度阈值,你可以管理关键的 precision-recall trade-off。较低的阈值可能会检测到更多对象,但会增加 false positives 的风险;而较高的阈值可以提高精度,但可能会导致遗漏细微的实例。
在像 Ultralytics YOLO26 这样的先进架构中,置信度分数对于 Non-Maximum Suppression (NMS) 等后处理技术至关重要。NMS 利用这些分数来移除重叠显著的冗余边界框,只保留概率最高的检测结果。此步骤确保最终输出清晰,并为 object counting 或跟踪等后续任务做好准备。
以下 Python 示例演示了如何使用 ultralytics 包按置信度过滤预测结果:
from ultralytics import YOLO
# Load the latest YOLO26n model
model = YOLO("yolo26n.pt")
# Run inference with a confidence threshold of 0.5 (50%)
# Only detections with a score above this value are returned
results = model.predict("https://ultralytics.com/images/bus.jpg", conf=0.5)
# Inspect the confidence scores of the detected objects
for box in results[0].boxes:
print(f"Class: {box.cls}, Confidence: {box.conf.item():.2f}")Link to this section实际应用#
置信度分数提供了一种可解释性层,这在应用了 computer vision (CV) 的各行各业中都不可或缺。它们有助于自动化系统确定何时进行自主处理,以及何时触发警报以供人工审查。
- 自动驾驶: 在 AI in automotive 领域,自动驾驶车辆依靠置信度指标来确保乘客安全。如果感知系统以低置信度检测到障碍物,它可能会将此数据与 LiDAR sensors 或雷达进行交叉比对,以便在执行紧急操作前验证该物体的存在。这种冗余有助于防止由阴影或强光引起的“幽灵刹车”。
- 医学诊断: 在利用 AI in healthcare 时,模型通过标记影像数据中的潜在异常来辅助医疗专业人员。为 tumor detection 构建的系统可能会高亮显示具有高置信度的区域以进行即时诊断,而将低置信度的预测记录下来以供二次分析。这种 human-in-the-loop 工作流程确保 AI 在不取代专家判断的情况下增强临床决策能力。
- 工业自动化: 在 smart manufacturing 中,机械臂使用置信度分数与装配线上的物体进行交互。配备 vision AI 的机器人可能只有在检测置信度超过 90% 时才会尝试抓取组件,从而降低因错位而损坏精密部件的风险。
Link to this section区分置信度与其他相关术语#
将置信度与 model evaluation 中使用的其他统计指标区分开来至关重要。
- 置信度 vs. 准确率: Accuracy 是一个全局指标,描述模型在整个数据集上的正确率(例如:“该模型准确率为 92%”)。相比之下,置信度是一个局部的、针对特定预测的数值(例如:“模型有 92% 的把握确定这张特定图片包含一只猫”)。模型可能具有较高的整体准确率,但在 edge cases 上仍会产生较低的置信度。
- 置信度 vs. 概率校准: 原始置信度分数并不总是与真实的 probability of correctness 一致。如果以 0.8 置信度做出的预测在 80% 的情况下是正确的,则称该模型是“良好校准的”。Platt scaling 或 Isotonic Regression 等技术通常被用于使分数与经验概率保持一致。
- 置信度 vs. 精度: Precision 衡量的是实际正确的阳性识别比例。虽然提高置信度阈值通常会提升精度,但往往是以牺牲 recall 为代价的。开发者必须根据其应用程序是优先考虑减少漏检还是尽量减少误报来调整此阈值。
Link to this section提高模型置信度#
如果模型对有效对象持续输出较低的置信度,通常说明 training data 与部署环境之间存在差异。缓解此问题的策略包括 data augmentation,它通过改变光照、旋转和添加噪声来人为扩展数据集。此外,使用 Ultralytics Platform 实施 active learning 流水线,允许开发者轻松识别低置信度样本、对其进行标注并重新训练模型。这种迭代周期对于创建能够在动态真实场景中可靠运行的稳健 AI agents 至关重要。






