YOLO Vision 2025를 놓치지 마세요!
2025년 9월 25일
10:00 — 18:00 BST
하이브리드 이벤트
Yolo Vision 2024
용어집

정확도

머신러닝에서 정확도의 중요성, 계산 방법, 불균형 데이터세트의 제한 사항 및 모델 성능을 개선하는 방법을 알아보세요.

정확도는 머신 러닝(ML)에서 가장 기본적이고 직관적인 평가 지표 중 하나입니다. 모델이 수행한 모든 예측 중에서 올바른 예측의 비율을 측정합니다. 단순성 때문에 정확도는 특히 분류 작업에서 AI 모델의 성능에 대한 일반적인 감각을 얻기 위해 개발자가 가장 먼저 살펴보는 지표입니다. 보다 미묘한 평가에 들어가기 전에 빠른 상태 점검 역할을 합니다.

실제 애플리케이션

정확도는 분류가 중요한 많은 분야에서 핵심 성과 지표입니다. 다음은 두 가지 예입니다.

  • 의료 진단: AI 기반 헬스케어에서 의료 영상 분석을 위해 설계된 모델은 X선 이미지를 폐렴 징후가 있는지 여부로 분류하도록 학습될 수 있습니다. 높은 정확도는 모델이 높은 비율의 사례에서 질병의 유무를 올바르게 식별하여 방사선 전문의에게 신뢰할 수 있는 지원을 제공함을 의미합니다.
  • 제조 품질 관리: 스마트 제조에서 컴퓨터 비전 시스템을 컨베이어 벨트의 제품을 검사하는 데 사용할 수 있습니다. 모델은 각 항목을 "결함" 또는 "정상"으로 분류합니다. 높은 정확도는 불량 제품이 올바르게 식별되어 제거되도록 보장하는 동시에 양호한 제품의 잘못된 플래그 지정을 최소화하여 생산 효율성 및 품질에 직접적인 영향을 미칩니다.

정확도 제한

정확도는 유용하지만, 특히 불균형 데이터 세트를 다룰 때 매우 오해의 소지가 있을 수 있습니다. 불균형 데이터 세트란 서로 다른 클래스의 예제 수가 크게 차이나는 데이터 세트를 의미합니다. 예를 들어, 사기 탐지에서 정상 거래는 사기 거래보다 훨씬 많습니다. 항상 '사기 아님'으로 예측하는 모델은 99% 이상의 정확도를 달성할 수 있지만, 본래 목적에는 전혀 쓸모가 없을 것입니다. 드물지만 중요한 케이스를 식별하지 못하기 때문입니다. 이 시나리오는 높은 정확도 점수가 모델의 효과에 대한 잘못된 인식을 심어주는 정확도 역설을 잘 보여줍니다.

정확도 vs. 기타 지표

모델 성능에 대한 완전한 그림을 얻으려면 정확도와 함께 다른 지표를 고려하는 것이 중요합니다.

  • 정밀도: 실제로 올바른 긍정적 예측의 비율을 측정합니다. 이는 "긍정적 클래스에 대해 내린 모든 예측 중에서 얼마나 옳았습니까?"라는 질문에 답합니다. 거짓 긍정의 비용이 높을 때 높은 정밀도가 중요합니다.
  • 재현율(Recall): 민감도로도 알려진 이 지표는 올바르게 식별된 실제 긍정 사례의 비율을 측정합니다. "실제 긍정 사례 중에서 내 모델이 얼마나 많이 찾았습니까?"라는 질문에 답합니다. 의료 검진과 같이 거짓 음성의 비용이 높을 때 높은 재현율이 중요합니다.
  • F1-점수(F1-Score): 이는 정밀도와 재현율의 조화 평균이며, 둘 다 균형을 맞추는 단일 점수를 제공합니다. 특히 거짓 양성과 거짓 음성이 모두 중요한 불균형 데이터 세트에서 모델을 평가하는 데 유용합니다.
  • 혼동 행렬: 참 긍정, 참 부정, 거짓 긍정 및 거짓 부정의 수를 표시하여 분류 모델의 성능을 시각화하는 표입니다. 정확도, 정밀도 및 재현율을 계산하는 데 필요한 데이터를 제공합니다.
  • 평균 정밀도 평균(mAP): 객체 감지와 같은 더 복잡한 작업의 경우 mAP가 표준 메트릭입니다. 이는 분류의 정확성뿐만 아니라 다양한 신뢰도 수준에서 예측된 바운딩 박스의 지역화 정확도도 평가합니다. 더 깊이 이해하려면 다양한 모델 비교를 탐색할 수 있습니다.

모델 정확도 향상

몇 가지 기술은 모델 정확도를 향상시키는 데 도움이 될 수 있지만 다른 지표 또는 계산 비용과의 상충 관계가 있는 경우가 많습니다.

모델 학습 팁과 같은 컨설팅 자료는 실질적인 지침을 제공할 수 있습니다. Ultralytics HUB와 같은 플랫폼을 통해 사용자는 모델을 학습하고 다른 주요 지표와 함께 정확도를 쉽게 추적할 수 있으며, 이는 종종 TensorBoard와 같은 도구를 사용하여 시각화됩니다. 해당 분야의 진행 상황은 Stanford AI Index Report와 같은 자료를 통해 확인하거나 Papers With Code에서 데이터 세트를 탐색하여 확인할 수 있습니다. PyTorchTensorFlow와 같은 프레임워크는 이러한 모델을 구축하고 학습하는 데 일반적으로 사용됩니다.

결론적으로 정확도는 AI 모델 성능을 평가하는 데 유용하고 직관적인 지표이지만 단독으로 사용해서는 안 됩니다. ML 작업의 특정 목표와 데이터의 특성, 특히 잠재적인 불균형 또는 오류의 다양한 비용을 고려하는 것이 가장 적절한 평가 지표를 선택하는 데 필수적입니다. 설명 가능한 AI(XAI)의 기술을 활용하면 단일 지표 값 이상의 더 깊은 통찰력을 얻을 수도 있습니다.

Ultralytics 커뮤니티에 참여하세요

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기
클립보드에 링크가 복사되었습니다.