Yolo 深圳
深セン
今すぐ参加
用語集

信頼度

AIの信頼度スコアを定義します。モデルが予測の確実性をどのように評価し、信頼性の閾値を設定し、信頼度と精度を区別するかを学びます。

人工知能と機械学習の領域において、信頼度スコアとはモデルが特定の予測に対して持つ確信の度合いを定量化する指標である。この値は通常0から1(または0%から100%)の範囲で、アルゴリズムの出力が真の値と一致する推定確率を表す。例えば物体検出タスクにおいて、システムが 画像領域を「自転車」と識別し、その確信度が0.92である場合、分類が正しいと推定される可能性が92%であることを示唆します。これらのスコアはニューラルネットワークの最終層から導出され、多クラス分類ではSoftmax、二値判定ではシグモイド関数などの 活性化関数を通じて処理されることが一般的です。

推論における信頼の役割

信頼度スコアは推論エンジンのワークフローにおける基本要素であり、 背景ノイズから高品質な予測を区別するフィルターとして機能します。 このフィルタリング処理(閾値設定)により、開発者はアプリケーションの感度を調整できます。 最小信頼度閾値を設定することで、 精度と再現率の重要なトレードオフを管理可能です。 閾値を低く設定するとdetect オブジェクトをdetect が、 偽陽性のリスクが高まる。一方、閾値を高く設定すると精度が向上するが、 微妙な事例を見逃す可能性がある。

Ultralytics 先進的なアーキテクチャでは、 信頼度スコアはノン・マキシマム・サプレッション(NMS)などの後処理技術に不可欠です。NMS これらのスコアを活用し、重複が著しい冗長な境界ボックスを除去し、最も高い確率を持つ検出結果のみを保持します。このステップにより、最終出力はクリーンな状態が保証され、 物体計数や追跡などの下流タスクに即座に活用可能となります。

Python 、信頼度を用いて予測をフィルタリングする方法を示しています。 ultralytics パッケージで提供される:

from ultralytics import YOLO

# Load the latest YOLO26n model
model = YOLO("yolo26n.pt")

# Run inference with a confidence threshold of 0.5 (50%)
# Only detections with a score above this value are returned
results = model.predict("https://ultralytics.com/images/bus.jpg", conf=0.5)

# Inspect the confidence scores of the detected objects
for box in results[0].boxes:
    print(f"Class: {box.cls}, Confidence: {box.conf.item():.2f}")

実際のアプリケーション

信頼度スコアは、コンピュータビジョン(CV)が応用されるあらゆる産業において不可欠な解釈可能性の層を提供する。これらは自動化システムが自律的に処理を進めるべき時と、人間のレビューを促すアラートを発動すべき時を判断するのに役立つ。

  • 自動運転: 自動車分野におけるAIにおいて自動運転車は乗客の安全を確保するため信頼度指標に依存する。知覚システムが信頼度の低い障害物を検知した場合、緊急回避操作を実行する前に、このデータをLiDARセンサーやレーダーと照合して物体の存在を確認することがある。この冗長性により、影やグレアによる「誤作動ブレーキ」を防止できる。
  • 医療診断: 医療分野でAIを活用する場合、モデルは画像データ内の潜在的な異常を指摘することで医療専門職を支援する。腫瘍検出用に構築されたシステムは、即時診断のための高信頼度領域を強調表示し、低信頼度の予測は二次分析用に記録される。この人間が関与するワークフローにより、AIは専門家の判断に取って代わるのではなく、臨床的意思決定を補完することが保証される。
  • 産業オートメーション: スマート製造では、ロボットアームが信頼度スコアを用いて組立ライン上の物体と相互作用する。視覚AIを搭載したロボットは、検出信頼度が90%を超えた場合にのみ部品の把持を試みるため、位置ずれによる精密部品の損傷リスクを低減できる。

自信と関連用語の区別

モデル評価において使用される他の統計的指標と信頼度を区別することは極めて重要である。

  • 信頼度 vs. 正確度: 正確度は グローバルな指標であり、モデルがデータセット全体でどれだけ正確かを表す(例:「モデルの正確度は92%」)。 一方、信頼度はローカルな予測固有の値である(例:「この特定の画像に猫が含まれているとモデルは92%の確信を持っている」)。 モデルは全体的な精度が高くても、境界事例では低い信頼度を示すことがある。
  • 信頼度と確率のキャリブレーション:生の信頼度スコアは、必ずしも真の正答確率と一致するとは限らない。 モデルは、信頼度0.8で予測された結果が約80%の確率で正しい場合に「適切にキャリブレーションされている」と言える。 プラットスケーリングや アイソトニック回帰 といった手法は、スコアを経験的確率と一致させるために頻繁に用いられる。
  • 信頼度と精度: 精度は、実際に正しいと判定された陽性判定の割合を測定します。信頼度の閾値を上げると一般的に精度は向上しますが、 その代償として再現率が低下することがよくあります。開発者は、アプリケーションが「見逃す対象を少なくすること」と「誤検知を最小限に抑えること」のどちらを優先するかによって、 この閾値を調整する必要があります。

モデルの信頼性向上

モデルが有効なオブジェクトに対して一貫して低い信頼度を出力する場合、これは多くの場合、 トレーニングデータとデプロイ環境の間に不一致があることを示しています。 この問題を軽減する戦略として、 データ拡張が挙げられる。これは照明、回転、ノイズを変化させることで データセットを人工的に拡大する手法である。さらに、 Ultralytics 能動学習パイプラインの実装により、開発者は 信頼度の低いサンプルを容易に特定し、アノテーションを付与してモデルを再学習できる。この反復サイクルは、 動的で現実的な環境において確実に動作する 堅牢なAIエージェントを構築するために不可欠である。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加