YOLO Vision 2025를 놓치지 마세요!
2025년 9월 25일
10:00 — 18:00 BST
하이브리드 이벤트
Yolo Vision 2024
용어집

모델 모니터링

AI 정확성을 보장하고, 데이터 드리프트를 감지하고, 역동적인 실제 환경에서 안정성을 유지하기 위해 모델 모니터링이 갖는 중요성을 알아보세요.

모델 모니터링은 머신 러닝(ML) 모델이 프로덕션 환경에 배포된 후 성능을 지속적으로 추적하고 평가하는 프로세스입니다. 여기에는 모델 정확도, 운영 상태 및 데이터 특성과 관련된 주요 지표를 관찰하여 모델이 시간이 지남에 따라 예상대로 작동하는지 확인하는 것이 포함됩니다. 이 방법은 MLOps(Machine Learning Operations) 라이프사이클의 중요한 부분으로, 배포된 인공 지능(AI) 시스템이 실제 환경에서 안정적이고 효과적이며 신뢰할 수 있도록 보장합니다. 모니터링이 없으면 모델 성능이 눈에 띄지 않게 저하되어 잘못된 예측 및 부정적인 비즈니스 결과로 이어질 수 있습니다.

모델 모니터링이 중요한 이유는 무엇인가요?

ML 모델은 과거 데이터를 기반으로 학습되지만 실제 세계는 역동적입니다. 데이터 패턴, 사용자 행동 또는 환경의 변화로 인해 배포 후 모델 성능이 저하될 수 있습니다. 모니터링의 주요 이유는 다음과 같습니다.

  • 성능 저하 감지: 모델은 시간이 지남에 따라 정확도가 떨어질 수 있습니다. 모니터링은 정밀도(precision), 재현율(recall) 또는 F1-점수(F1-score)와 같은 성능 지표의 하락을 식별하는 데 도움이 됩니다. YOLO 성능 지표에 대한 자세한 내용은 가이드에서 확인할 수 있습니다.
  • Identifying Data Drift(데이터 드리프트 식별): 입력 데이터의 통계적 속성이 변경될 수 있는데, 이는 데이터 드리프트라고 알려진 현상입니다. 이는 모델이 프로덕션에서 보는 데이터가 학습 데이터와 크게 다를 때 발생할 수 있습니다.
  • 개념 변화(Concept Drift) 감지: 입력 특징과 목표 변수 간의 관계는 시간이 지남에 따라 변할 수 있습니다. 예를 들어, 고객 선호도가 변화하여 기존 예측 패턴이 쓸모없게 될 수 있습니다. 이를 개념 변화라고 하며, 모델 재학습이 필요한 경우가 많습니다.
  • 운영 건전성 보장: 모니터링은 추론 지연 시간, 처리량 및 오류율과 같은 운영 메트릭을 추적하여 모델 제공 인프라가 원활하게 실행되도록 합니다.
  • 공정성 및 윤리 유지: 모니터링은 다양한 인구 통계 그룹의 성과를 추적하여 AI 편향을 감지하고 완화하는 데 도움이 되어 AI 윤리를 촉진합니다.

어떤 측면이 모니터링됩니까?

효과적인 모델 모니터링은 일반적으로 다음과 같은 여러 범주의 메트릭 추적을 포함합니다.

  • 예측 성능: 정확도, 평균 정밀도(mAP), AUC 및 오류율과 같은 메트릭은 종종 유효성 검사 중에 설정된 벤치마크와 비교됩니다.
  • 데이터 품질 및 무결성: 입력 데이터에서 누락된 값, 데이터 유형 불일치 및 범위 위반을 추적합니다.
  • 입력 데이터 드리프트(Input Data Drift): 프로덕션 입력 특징의 분포를 학습 데이터 분포와 비교하기 위한 통계적 측정(예: 모집단 안정성 지수, Kolmogorov-Smirnov 검정).
  • 예측/출력 드리프트: 시간 경과에 따른 중요한 변화를 감지하기 위해 모델 예측의 분포를 모니터링합니다.
  • 운영 메트릭: CPU/GPU 사용률, 메모리 사용량, 요청 지연 시간 및 처리량과 같은 시스템 수준 메트릭. Prometheus와 같은 플랫폼이 종종 사용됩니다.
  • 공정성 및 편향 메트릭: 인구 통계적 패리티 또는 동등화된 오즈와 같은 메트릭을 사용하여 민감한 속성(예: 연령, 성별)에 따른 모델 성능 차이를 평가합니다.

모델 모니터링 vs. 관련 개념

모델 모니터링을 유사한 용어와 구별하는 것이 중요합니다.

  • 관찰성(Observability): 모니터링은 알려진 실패 모드를 평가하기 위해 미리 정의된 메트릭을 추적하는 데 중점을 두는 반면, 관찰성은 알 수 없는 시스템 상태를 탐색하고 이해하기 위한 도구(로그, 메트릭, 추적)를 제공합니다. 관찰성은 모니터링에서 이상 징후를 감지했을 때 더 심층적인 조사를 가능하게 합니다.
  • MLOps: MLOps는 전체 ML 라이프사이클을 포괄하는 광범위한 사례 집합입니다. 모델 모니터링은 MLOps 프레임워크 내에서 중요한 구성 요소이며, 특히 배포 후 모델의 상태에 중점을 둡니다.
  • 모델 평가: 평가는 일반적으로 모델 품질을 평가하기 위해 정적 유효성 검사 데이터 또는 테스트 데이터를 사용하여 배포 에 수행됩니다. 모니터링은 배포 에 라이브 프로덕션 데이터에서 수행되는 지속적인 프로세스입니다. 여기에서 모델 평가 및 미세 조정에 대한 통찰력을 찾아보세요.

실제 애플리케이션

  1. E-커머스 추천 시스템: E-커머스 플랫폼은 추천 시스템을 위해 ML 모델을 사용합니다. 모델 모니터링은 클릭률(CTR)과 전환율을 추적합니다. 모니터링에서 CTR의 갑작스러운 감소(성능 저하) 또는 구매되는 제품 유형의 변화(개념 변화)를 감지하면 경고가 발생하여 조사 및 잠재적인 모델 재학습을 유발할 수 있습니다. Amazon Personalize와 같은 서비스에는 추천 효과를 모니터링하는 기능이 포함되어 있습니다.
  2. 자율 주행 차량 인식: 자율 주행 자동차객체 탐지를 위해 Ultralytics YOLO와 같은 컴퓨터 비전 모델에 의존합니다. 모델 모니터링은 보행자 및 다른 차량과 같은 객체에 대한 탐지 정확도와 신뢰도 점수를 지속적으로 추적합니다. 또한 입력 이미지의 데이터 드리프트(예: 밝기 또는 날씨 변화)를 모니터링합니다. 폭우와 같은 특정 조건에서 성능이 저하되면 시스템은 데이터 증강을 사용하여 생성되었을 수 있는 더 다양한 데이터로 학습된 모델 업데이트의 필요성을 알릴 수 있습니다. Waymo와 같은 회사는 인식 시스템 모니터링에 막대한 투자를 하고 있습니다.

도구 및 구현

모델 모니터링 구현에는 특수 도구 및 플랫폼 사용이 포함됩니다. 옵션은 Evidently AINannyML과 같은 오픈 소스 라이브러리부터 AWS SageMaker Model Monitor, Google Vertex AI Model MonitoringAzure Machine Learning과 같은 클라우드 제공업체의 관리형 서비스에 이르기까지 다양합니다. Arize AI 또는 WhyLabs와 같은 전용 MLOps 플랫폼도 광범위한 모니터링 기능을 제공합니다. Ultralytics HUB와 같은 플랫폼은 모델 배포 및 관리를 지원하며, 이러한 모니터링 솔루션과 통합되어 MLOps 주기를 완료합니다. 효과적인 모델 유지 관리 전략은 강력한 모니터링에 크게 의존합니다.

Ultralytics 커뮤니티에 참여하세요

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기
클립보드에 링크가 복사되었습니다.