머신 러닝에서 정확도의 중요성, 계산, 불균형한 데이터 세트의 한계, 모델 성능을 개선하는 방법에 대해 알아보세요.
정확도는 머신러닝(ML) 모델의 성능을 평가하는 데 사용되는 가장 기본적이고 직관적인 지표 중 하나로, 특히 인공 지능(AI) 및 컴퓨터 비전(CV) 내 분류 작업에서 중요합니다. 총 예측 수 중 AI 모델이 정확히 예측한 비율을 나타냅니다. 이해하고 계산하기는 쉽지만 정확도에만 의존하는 것은 특히 특정 유형의 데이터 세트나 특정 문제 요구 사항을 다룰 때 때때로 오해의 소지가 있을 수 있습니다.
정확도는 정확한 예측 수(정탐과 정탐 모두)를 총 예측 수로 나누어 계산합니다. 예를 들어, 모델이 100개의 이미지 중 90개를 올바르게 식별하면 정확도는 90%입니다. 이러한 단순성 때문에 모델 성능을 평가하는 데 널리 사용되는 시작점입니다.
정확도는 모델이 전반적으로 얼마나 자주 정확한지를 간단하게 측정할 수 있는 지표입니다. 모델 개발 및 모델 학습의 초기 단계에서 일반적인 성능을 파악하기 위해 널리 사용됩니다. 높은 정확도는 종종 많은 애플리케이션의 주요 목표이며, 이는 모델이 보이지 않는 새로운 데이터에 대해 잘 일반화한다는 것을 나타냅니다. 다음과 같은 많은 최신 모델은 다음과 같습니다. Ultralytics YOLO 와 같은 많은 최신 모델은 속도와 같은 다른 요소와 균형을 맞추면서 높은 정확도를 위해 노력합니다. 정확도 벤치마크를 강조하는 YOLO11 대 YOLOv8 같은 비교를 볼 수 있습니다.
직관성에도 불구하고 정확도에는 상당한 한계가 있습니다:
정확도의 한계로 인해, 특히 불균형한 데이터나 다양한 오류 비용으로 인해 다른 지표가 선호되거나 함께 사용되는 경우가 많습니다:
이러한 다양한 YOLO 성과 지표를 이해하면 특정 요구 사항에 맞는 모델 성능을 보다 미묘하게 평가할 수 있습니다.
여러 가지 기술이 모델 정확도를 개선하는 데 도움이 될 수 있지만, 다른 지표나 계산 비용과의 절충이 필요한 경우가 많습니다:
모델 트레이닝 팁과 같은 컨설팅 리소스는 실질적인 지침을 제공할 수 있습니다. Ultralytics HUB와 같은 플랫폼을 통해 사용자는 모델을 훈련하고 다른 주요 메트릭과 함께 정확도를 쉽게 추적할 수 있으며, 종종 TensorBoard와 같은 도구를 사용하여 시각화할 수 있습니다. 스탠포드 AI 인덱스 보고서와 같은 리소스를 통해 해당 분야의 진행 상황을 추적하거나 Papers With Code에서 데이터 세트를 검색할 수 있습니다. 다음과 같은 프레임워크 PyTorch ( 공식 사이트 참조) 및 TensorFlow ( 공식 사이트 참조)와 같은 프레임워크가 이러한 모델을 구축하고 훈련하는 데 일반적으로 사용됩니다.
결론적으로 정확도는 AI 모델 성능을 평가하는 데 유용하고 직관적인 지표이기는 하지만, 정확도만 단독으로 사용해서는 안 됩니다. ML 작업의 구체적인 목표와 데이터의 특성, 특히 잠재적인 불균형이나 다양한 오류 비용을 고려해야 정확도, 리콜, F1 점수 또는 mAP와 같은 가장 적절한 평가 지표를 선택할 수 있습니다. 설명 가능한 AI(XAI) 의 기술을 활용하면 단일 메트릭 값 이상의 심층적인 인사이트를 얻을 수도 있습니다.