AIの信頼度スコアを定義します。モデルが予測の確実性をどのように評価し、信頼性の閾値を設定し、信頼度と精度を区別するかを学びます。
機械学習や人工知能の分野では 信頼スコアは、モデルによる特定の予測が正しい可能性を表す数値である。 が正しい可能性を表す数値である。通常、0から1の間の確率(または0%から100%の間のパーセンテージ)として表現され、このスコアは、予測結果の確実性を定量化します。 スコアは、その出力に関する ニューラルネットワークの出力に関する確実性を定量化します。例えば 例えば、物体検出タスクにおいて、システムは は「猫」の存在を0.95の確信度で予測することができる。 これは、そのラベルの精度を強く信じていることを示す。これらのスコアは通常、モデルの最終層で 活性化関数 などの活性化関数を用いてモデルの最終層から導出される。 のような活性化関数を用いて最終層から導出される。
信頼度スコアは推論エンジンのワークフローの基本要素である。 推論エンジンのワークフローの基本要素である。これにより開発者は 閾値処理として知られるプロセスである。特定の 信頼度のしきい値を設定することで、可能性のあるすべてのオブジェクトを識別すること(高いリコール)と、識別されたオブジェクトが正しいこと(高いリコール)の間のトレードオフを効果的に管理することができます。 と、識別されたオブジェクトが正しいことを保証すること(高精度)のトレードオフを効果的に管理することができます。
実用的なモデルの展開では、生の予測 はノイズや確率の低い検出を含むことが多い。そのため 非最大抑制(NMS)のような技術は 信頼度スコアを利用して冗長なオーバーラップ・ボックスを排除し、最も高い確率を持つ検出だけを残します。 これにより、ユーザに提示される最終出力がクリーンで実用的であることが保証されます。
次の例は、推論中に信頼しきい値を適用する方法を示している。 Ultralytics YOLO11:
from ultralytics import YOLO
# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")
# Run inference on an image with a confidence threshold of 0.6 (60%)
# This filters out any detections with a confidence score lower than 0.6
results = model.predict("https://ultralytics.com/images/bus.jpg", conf=0.6)
# Display the count of objects detected above the threshold
print(f"Detected {len(results[0].boxes)} objects with high confidence.")
信頼度スコアの有用性は、コンピュータ・ビジョンやAIソリューションを展開するほぼすべての業界に及んでいる。 コンピュータ・ビジョンとAIソリューションを展開する事実上すべての業界に広がっています。
実務家にとって、「信頼性」を標準的な評価指標と区別することは極めて重要である。 評価指標と区別することが重要である。 を区別することが重要である。
有効なオブジェクトに対する信頼度が一貫して低いモデルは、学習データに問題がある可能性がある。 を示す可能性がある。これを改善する戦略には以下が含まれる。 モデルをより多くの モデルをより多様な照明や方位にさらす、あるいは アクティブ・ラーニングを採用し、アノテーションと再学習を行う。 特定の「エッジケース」において、モデルが現在不確実である。多様で高品質なデータセットを確保することは ユーザーが信頼できる強固なシステムを構築するために不可欠である。


