YOLO Vision Shenzhen
深セン
今すぐ参加
用語集

信頼度

AIにおける信頼度スコアの役割を探ります。予測のフィルタリング、適合率-再現率のトレードオフの最適化、そして精度向上のためのUltralytics YOLO26の実装方法を学びましょう。

人工知能と機械学習の領域において、信頼度スコアとはモデルが特定の予測に対して持つ確信の度合いを定量化する指標である。この値は通常0から1(または0%から100%)の範囲で、アルゴリズムの出力が真の値と一致する推定確率を表す。例えば物体検出タスクにおいて、システムが 画像領域を「自転車」と識別し、その確信度が0.92である場合、分類が正しいと推定される可能性が92%であることを示唆します。これらのスコアはニューラルネットワークの最終層から導出され、多クラス分類ではSoftmax、二値判定ではシグモイド関数などの 活性化関数を通じて処理されることが一般的です。

推論における信頼の役割

信頼度スコアは、高品質な予測を背景ノイズから区別するためのフィルターとして機能し、推論エンジンのワークフローにおける基本的な要素です。この閾値処理として知られるフィルタリングプロセスにより、開発者はアプリケーションの感度を調整できます。最小信頼度閾値を設定することで、重要な精度-再現率のトレードオフを管理できます。低い閾値はより多くの物体をdetectする可能性がありますが、偽陽性のリスクを高めます。一方、高い閾値は精度を向上させますが、微妙なインスタンスを見逃す可能性があります。

Ultralytics YOLO26のような高度なアーキテクチャでは、信頼度スコアはNon-Maximum Suppression (NMS)のような後処理技術に不可欠です。NMSはこれらのスコアを利用して、重複する冗長なバウンディングボックスを除去し、最も確率の高いdetectのみを保持します。このステップにより、最終出力がクリーンになり、物体カウントやtrackなどの下流タスクに備えることができます。

以下のpythonの例は、信頼度に基づいて予測をフィルタリングする方法を示しています。 ultralytics パッケージで提供される:

from ultralytics import YOLO

# Load the latest YOLO26n model
model = YOLO("yolo26n.pt")

# Run inference with a confidence threshold of 0.5 (50%)
# Only detections with a score above this value are returned
results = model.predict("https://ultralytics.com/images/bus.jpg", conf=0.5)

# Inspect the confidence scores of the detected objects
for box in results[0].boxes:
    print(f"Class: {box.cls}, Confidence: {box.conf.item():.2f}")

実際のアプリケーション

信頼度スコアは、コンピュータービジョン (CV)が適用される業界全体で不可欠な解釈可能性の層を提供します。これにより、自動化されたシステムは、自律的に進行すべきか、人間によるレビューのためにアラートをトリガーすべきかを判断できます。

  • 自動運転: 自動車におけるAIの分野では、自動運転車は乗客の安全を確保するために信頼度メトリクスに依存しています。知覚システムが低い信頼度で障害物をdetectした場合、緊急操作を実行する前に、このデータをLiDARセンサーまたはレーダーと相互参照してオブジェクトの存在を確認する可能性があります。この冗長性により、影やグレアによって引き起こされる「ファントムブレーキ」を防ぐことができます。
  • 医療診断: 医療分野でAIを活用する場合、モデルは画像データ内の潜在的な異常を指摘することで医療専門職を支援する。腫瘍検出用に構築されたシステムは、即時診断のための高信頼度領域を強調表示し、低信頼度の予測は二次分析用に記録される。この人間が関与するワークフローにより、AIは専門家の判断に取って代わるのではなく、臨床的意思決定を補完することが保証される。
  • 産業オートメーション: スマートマニュファクチャリングにおいて、ロボットアームは信頼度スコアを使用して組立ライン上のオブジェクトと相互作用します。ビジョンAIを搭載したロボットは、detect信頼度が90%を超える場合にのみコンポーネントを把持しようとする可能性があり、これにより位置ずれによるデリケートな部品の損傷リスクを低減します。

自信と関連用語の区別

モデル評価で使用される他の統計的指標と信頼度を区別することが重要です。

  • 信頼度 vs. 精度: 精度は、モデルがデータセット全体でどれだけ頻繁に正解するかを記述するグローバルな指標です(例:「モデルは92%正確である」)。対照的に、信頼度は局所的で予測固有の値です(例:「モデルはこの特定の画像に猫が含まれていると92%確信している」)。モデルは全体的に高い精度を持つことができますが、エッジケースでは低い信頼度を示すことがあります。
  • 信頼度 vs. 確率キャリブレーション: 生の信頼度スコアは、真の正解確率と常に一致するとは限りません。0.8の信頼度で行われた予測が約80%の確率で正解である場合、モデルは「適切にキャリブレーションされている」と言えます。プラットスケーリング等張回帰などの技術は、スコアを経験的確率に合わせるためによく使用されます。
  • 信頼度 vs. 適合率: 適合率は、実際に正しかった陽性識別の割合を測定します。信頼度閾値を上げると一般的に適合率は向上しますが、多くの場合、再現率を犠牲にします。開発者は、アプリケーションがオブジェクトの見逃しを減らすことを優先するか、誤警報を最小限に抑えることを優先するかに基づいて、この閾値を調整する必要があります。

モデルの信頼性向上

モデルが有効なオブジェクトに対して一貫して低い信頼度を出力する場合、それはしばしばトレーニングデータとデプロイ環境との間の不一致を示します。これを軽減する戦略には、照明、回転、ノイズを変化させることでデータセットを人工的に拡張するデータ拡張が含まれます。さらに、Ultralytics Platformを使用してアクティブラーニングパイプラインを実装することで、開発者は信頼度の低いサンプルを容易に特定し、アノテーションを付け、モデルを再トレーニングできます。この反復サイクルは、動的な実世界環境で信頼性高く動作できる堅牢なAIエージェントを作成するために不可欠です。

共にAIの未来を築きましょう!

未来の機械学習で、新たな一歩を踏み出しましょう。