AIの信頼度スコアを定義します。モデルが予測の確実性をどのように評価し、信頼性の閾値を設定し、信頼度と精度を区別するかを学びます。
人工知能と機械学習の領域において、信頼度スコアとはモデルが特定の予測に対して持つ確信の度合いを定量化する指標である。この値は通常0から1(または0%から100%)の範囲で、アルゴリズムの出力が真の値と一致する推定確率を表す。例えば物体検出タスクにおいて、システムが 画像領域を「自転車」と識別し、その確信度が0.92である場合、分類が正しいと推定される可能性が92%であることを示唆します。これらのスコアはニューラルネットワークの最終層から導出され、多クラス分類ではSoftmax、二値判定ではシグモイド関数などの 活性化関数を通じて処理されることが一般的です。
信頼度スコアは推論エンジンのワークフローにおける基本要素であり、 背景ノイズから高品質な予測を区別するフィルターとして機能します。 このフィルタリング処理(閾値設定)により、開発者はアプリケーションの感度を調整できます。 最小信頼度閾値を設定することで、 精度と再現率の重要なトレードオフを管理可能です。 閾値を低く設定するとdetect オブジェクトをdetect が、 偽陽性のリスクが高まる。一方、閾値を高く設定すると精度が向上するが、 微妙な事例を見逃す可能性がある。
Ultralytics 先進的なアーキテクチャでは、 信頼度スコアはノン・マキシマム・サプレッション(NMS)などの後処理技術に不可欠です。NMS これらのスコアを活用し、重複が著しい冗長な境界ボックスを除去し、最も高い確率を持つ検出結果のみを保持します。このステップにより、最終出力はクリーンな状態が保証され、 物体計数や追跡などの下流タスクに即座に活用可能となります。
Python 、信頼度を用いて予測をフィルタリングする方法を示しています。
ultralytics パッケージで提供される:
from ultralytics import YOLO
# Load the latest YOLO26n model
model = YOLO("yolo26n.pt")
# Run inference with a confidence threshold of 0.5 (50%)
# Only detections with a score above this value are returned
results = model.predict("https://ultralytics.com/images/bus.jpg", conf=0.5)
# Inspect the confidence scores of the detected objects
for box in results[0].boxes:
print(f"Class: {box.cls}, Confidence: {box.conf.item():.2f}")
信頼度スコアは、コンピュータビジョン(CV)が応用されるあらゆる産業において不可欠な解釈可能性の層を提供する。これらは自動化システムが自律的に処理を進めるべき時と、人間のレビューを促すアラートを発動すべき時を判断するのに役立つ。
モデル評価において使用される他の統計的指標と信頼度を区別することは極めて重要である。
モデルが有効なオブジェクトに対して一貫して低い信頼度を出力する場合、これは多くの場合、 トレーニングデータとデプロイ環境の間に不一致があることを示しています。 この問題を軽減する戦略として、 データ拡張が挙げられる。これは照明、回転、ノイズを変化させることで データセットを人工的に拡大する手法である。さらに、 Ultralytics 能動学習パイプラインの実装により、開発者は 信頼度の低いサンプルを容易に特定し、アノテーションを付与してモデルを再学習できる。この反復サイクルは、 動的で現実的な環境において確実に動作する 堅牢なAIエージェントを構築するために不可欠である。