Yolo 비전 선전
선전
지금 참여하기
용어집

신뢰도

AI에서 신뢰도 점수의 역할을 탐구하세요. 예측 필터링 방법, 정밀도-재현율 균형 최적화 기법, 그리고 정확도 향상을 위한 Ultralytics 구현법을 배워보세요.

인공지능 및 기계 학습 분야에서 신뢰도 점수는 모델이 특정 예측에 대해 가지는 확신 수준을 정량화하는 지표입니다. 이 값은 일반적으로 0에서 1(또는 0%에서 100%) 사이이며, 알고리즘의 출력이 실제 값과 일치할 것으로 추정되는 확률을 나타냅니다. 예를 들어, 객체 탐지 작업에서 시스템이 이미지의 특정 영역을 신뢰도 0.92로 "자전거"로 식별한다면, 해당 분류가 정확할 확률이 92%로 추정됨을 의미합니다. 이러한 점수는 신경망의 최종 레이어에서 도출되며, 다중 분류를 위한 소프트맥스(Softmax )나 이진 결정을 위한 시그모이드 함수 ( Sigmoid function )와 같은 활성화 함수를 통해 처리되는 경우가 많습니다.

추론에서 신뢰의 역할

신뢰도 점수는 추론 엔진 워크플로의 핵심 구성 요소로, 배경 잡음과 고품질 예측을 구분하는 필터 역할을 합니다. 이 필터링 과정(임계값 설정)을 통해 개발자는 애플리케이션의 민감도를 조정할 수 있습니다. 최소 신뢰도 임계값을 설정함으로써 중요한 정밀도와 재현율 간의 균형을 관리할 수 있습니다. 낮은 임계값은 detect 객체를 detect 수 있지만 오탐( false positive) 위험을 증가시키는 반면, 높은 임계값은 정밀도를 향상시키지만 미묘한 사례를 놓칠 수 있습니다.

Ultralytics 같은 고급 아키텍처에서는 신뢰도 점수가 비최대 억제(NMS)와 같은 후처리 기법에 필수적입니다. NMS 이러한 점수를 활용하여 중복되는 경계 상자를 제거하고 가장 높은 확률을 가진 탐지 결과만 보존합니다. 이 단계는 최종 출력이 깨끗하게 정리되어 객체 계수나 추적과 같은 하위 작업에 바로 활용될 수 있도록 보장합니다.

다음 Python 신뢰도를 사용하여 예측을 필터링하는 방법을 보여줍니다. ultralytics 패키지입니다:

from ultralytics import YOLO

# Load the latest YOLO26n model
model = YOLO("yolo26n.pt")

# Run inference with a confidence threshold of 0.5 (50%)
# Only detections with a score above this value are returned
results = model.predict("https://ultralytics.com/images/bus.jpg", conf=0.5)

# Inspect the confidence scores of the detected objects
for box in results[0].boxes:
    print(f"Class: {box.cls}, Confidence: {box.conf.item():.2f}")

실제 애플리케이션

신뢰도 점수는 컴퓨터 비전(CV) 이 적용되는 산업 전반에 걸쳐 필수적인 해석 가능성을 제공합니다. 이는 자동화 시스템이 자율적으로 진행할 시점과 인간 검토를 위한 경보를 발동할 시점을 판단하는 데 도움을 줍니다.

  • 자율주행: 자동차 AI 분야에서 자율주행 차량은 승객 안전을 보장하기 위해 신뢰도 지표를 활용합니다. 인지 시스템이 낮은 신뢰도로 장애물을 감지할 경우, 긴급 기동을 실행하기 전에 해당 데이터를 LiDAR 센서나 레이더와 교차 참조하여 물체의 존재 여부를 확인합니다. 이러한 중복 검증은 그림자나 눈부심으로 인한 '유령 제동'을 방지하는 데 도움이 됩니다.
  • 의료 진단: 의료 분야에서 인공지능을 활용할 때, 모델은 영상 데이터 내 잠재적 이상 징후를 표시함으로써 의료 전문가를 지원합니다. 종양 검출을위해 구축된 시스템은 즉각적인 진단을 위해 신뢰도가 높은 영역을 강조 표시할 수 있으며, 신뢰도가 낮은 예측 결과는 2차 분석을 위해 기록됩니다. 이러한 인간이 개입하는 워크플로는 인공지능이 전문가의 판단을 대체하지 않으면서 임상적 의사 결정을 보완하도록 보장합니다.
  • 산업 자동화: 스마트 제조에서 로봇 팔은 조립 라인 상의 물체와 상호작용할 때 신뢰도 점수를 활용합니다. 비전 AI를탑재한 로봇은 감지 신뢰도가 90%를 초과할 때만 부품 잡기를 시도할 수 있으며, 이로 인해 정렬 불량으로 인한 정밀 부품 손상 위험을 줄일 수 있습니다.

확신과 관련 용어의 구별

모델 평가에 사용되는 다른 통계적 지표와 자신감을 구분하는 것이 매우 중요하다.

  • 신뢰도 대 정확도: 정확도는 전체 데이터셋에서 모델이 얼마나 자주 옳은지 설명하는 글로벌 지표입니다(예: "모델의 정확도는 92%입니다"). 반면 신뢰도는 예측별 로컬 값입니다(예: "이 특정 이미지에 고양이가 포함되어 있을 확률을 모델이 92%로 확신합니다"). 모델은 전체 정확도는 높지만 경계 사례에 대해서는 낮은 신뢰도를 보일 수 있습니다.
  • 확신도 대 확률 보정: 원시 확신도 점수는 항상 실제 정답 확률과 일치하지는 않습니다. 모델은 0.8 확신도로 예측된 결과가 약 80%의 확률로 정답일 때 "잘 보정된" 상태입니다. 플랫 스케일링 ( Platt scaling )이나 등방성 회귀(Isotonic Regression) 같은 기법은 점수를 경험적 확률과 일치시키기 위해 흔히 사용됩니다.
  • 신뢰도 대 정밀도: 정밀도는 실제로 정확한 양성 판정의 비율을 측정합니다. 신뢰도 임계값을 높이면 일반적으로 정밀도가 향상되지만, 이는 종종 재현율 저하를 대가로 합니다. 개발자는 자신의 애플리케이션이 더 적은 개체 누락을 우선시하는지, 아니면 오경보를 최소화하는지를 기준으로 이 임계값을 조정해야 합니다.

모델 신뢰도 향상

모델이 유효한 객체에 대해 지속적으로 낮은 신뢰도를 출력한다면, 이는 종종 훈련 데이터와 배포 환경 간의 불일치를 시사합니다. 이를 완화하기 위한 전략으로는 조명, 회전, 노이즈를 변화시켜 데이터셋을 인위적으로 확장하는 데이터 증강이 있습니다. 또한 Ultralytics 활용해 능동 학습 파이프라인을 구현하면 개발자가 낮은 신뢰도 샘플을 쉽게 식별하고 주석을 달며 모델을 재훈련할 수 있습니다. 이러한 반복적 사이클은 동적 실제 환경에서 안정적으로 작동하는 견고한 AI 에이전트를 구축하는 데 필수적입니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기