Yolo 비전 선전
선전
지금 참여하기
용어집

모델 모니터링

역동적인 실제 환경에서 AI 정확도를 보장하고, 데이터 드리프트를 detect , 안정성을 유지하기 위한 모델 모니터링의 중요성에 대해 알아보세요.

모델 모니터링은 머신 러닝 모델의 성능을 추적하고 평가하는 지속적인 프로세스입니다. 머신 러닝(ML) 모델이 프로덕션 환경에 배포된 후 성능을 추적하고 평가하는 지속적인 프로세스입니다. 시스템 가동 시간과 응답 시간에 중점을 두는 소프트웨어 모니터링과는 달리, 모델 모니터링은 특히 예측의 품질과 처리되는 데이터의 통계적 속성을 면밀히 조사합니다. 처리되는 데이터의 통계적 속성. 이 관행은 다음과 같은 중요한 구성 요소입니다. 지능형 시스템이 동적인 실제 데이터와 상호 작용할 때 신뢰성, 정확성, 공정성을 유지하도록 보장하는 머신 러닝 운영(MLOps)의 중요한 구성 요소입니다. 데이터. 능동적 모니터링이 없으면 모델은 종종 '조용한 실패'를 겪게 됩니다. 오류 없이 예측을 생성하지만 정확도가 현저히 저하됩니다.

프로덕션에서 모니터링의 필요성

모니터링 전략을 구현하는 가장 큰 이유는 실제 환경이 정적인 경우가 드물기 때문입니다. 과거 데이터로 학습된 모델 으로 훈련된 모델은 결국 데이터 드리프트(시간이 지남에 따라 입력 데이터의 통계적 통계적 분포가 시간이 지남에 따라 변하는 현상입니다. 예를 들어, 조명이 밝은 공장의 이미지로 학습된 시각적 검사 모델이 조명이 밝은 공장 현장의 이미지로 학습된 시각 검사 모델은 카메라 하드웨어가 동일하게 유지되더라도 조명 조건이 변경되면 실패할 수 있습니다.

마찬가지로 개념 드리프트는 입력 데이터와 목표 변수 간의 관계가 관계가 변화할 때 개념 이탈이 발생합니다. 이는 부정 행위자가 탐지 로직을 회피하기 위해 끊임없이 전략을 수정하는 탐지 로직을 회피하기 위해 끊임없이 전략을 조정합니다. 효과적인 모니터링은 엔지니어에게 이러한 변화를 알려주므로 다음과 같은 조치를 취할 수 있습니다. 모델 재학습을 트리거하거나 비즈니스 지표가 부정확해지기 전에 비즈니스 지표가 부정적인 영향을 받기 전에 영향을 미치기 전에

추적해야 할 주요 지표

강력한 모니터링 프레임워크는 일반적으로 세 가지 범주의 메트릭을 관찰합니다:

  1. 모델 품질 지표: 모델의 예측력을 track . 실측 데이터 레이블은 종종 프로덕션에서 지연되지만, 팀은 프록시 메트릭을 모니터링하거나 휴먼 인 더 루프 샘플링을 통해 정확도 리콜F1 점수.
  2. 데이터 품질 및 드리프트: 여기에는 입력 특징의 분포를 추적하는 것이 포함됩니다. 통계 테스트와 같은 콜모고로프-스미르노프 테스트 와 같은 통계 테스트는 생산 데이터와 검증 중에 설정된 기준선 사이의 거리를 정량화할 수 있습니다. 유효성 검사.
  3. 운영 효율성: 시스템이 서비스 수준 계약을 충족하는지 확인하기 위해 엔지니어는 다음을 track . 추론 지연 시간, 처리량 및 하드웨어 리소스 소비를 추적합니다. GPU 메모리 사용량 등 하드웨어 리소스 소비를 추적합니다.

모델 모니터링과 관측 가능성 비교

밀접한 관련이 있지만, 모델 모니터링과 관찰 가능성은 서로 다른 용도로 사용됩니다. 모니터링은 사전 정의된 메트릭과 경고에 초점을 맞춘 사후 대응적인 경우가 많으며, 무언가 잘못되었다는 것을 알려줍니다(예 "정확도가 90% 미만으로 떨어짐"). 이와는 대조적으로 통합 가시성은 다음과 같은 도구와 세분화된 데이터를 제공합니다. 고차원 로그 및 추적과 같은 세분화된 데이터를 제공합니다. 필요한 도구와 세분화된 데이터를 제공합니다. 통합 가시성을 통해 데이터 과학자는 다음과 같은 복잡한 동작을 디버깅할 수 있습니다. 예측의 특정 하위 집합이 왜 편향성을 보이는지 이해 편향성을 보이는지 이해하는 것과 같은 복잡한 동작을 디버깅할 수 있습니다.

실제 애플리케이션

모니터링의 실제 적용은 다음과 같은 가치를 보호합니다. 인공 지능(AI) 투자 보호합니다:

  • 스마트 제조: In 제조 분야의 AI, 물체 감지를 이용한 결함 감지 물체 감지를 사용하는 시스템은 예측의 평균 신뢰도 점수를 모니터링할 수 있습니다. 신뢰도가 갑자기 떨어지면 카메라 렌즈가 더럽거나 또는 조립 라인에 새로운 제품 변형이 도입되어 유지보수가 필요하다는 신호일 수 있습니다.
  • 소매 재고 관리: 시스템 배포 진열대의 재고를 계산하는 소매업의 AI는 계절성을 모니터링해야 합니다. 모니터링해야 합니다. 명절 포장이 바뀌면 제품의 시각적 외관이 바뀌는데, 이는 일종의 드리프트 역할을 합니다. 모니터링을 통해 이러한 미적 변화에도 불구하고 재고 계산이 정확하게 유지되도록 할 수 있습니다.

구현 예시

모니터링을 위한 데이터 수집은 종종 추론 단계에서 시작됩니다. 다음 Python 스니펫은 다음과 같은 방법을 보여줍니다. 성능 데이터(특히 추론 속도와 신뢰도)를 추출하고 기록하는 방법을 보여줍니다. ultralytics 패키지입니다.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Perform inference on an image source
results = model("https://ultralytics.com/images/bus.jpg")

# Extract metrics for monitoring logs
for result in results:
    # Log operational metric: Inference speed in milliseconds
    print(f"Inference Latency: {result.speed['inference']:.2f}ms")

    # Log model quality proxy: Average confidence of detections
    if result.boxes:
        avg_conf = result.boxes.conf.mean().item()
        print(f"Average Confidence: {avg_conf:.4f}")

이러한 시계열 메트릭을 집계하는 데 Prometheus와 같은 도구가 자주 사용됩니다, Grafana와 같은 시각화 대시보드를 사용하면 팀에서 실시간으로 추세와 이상 징후를 실시간으로 파악할 수 있습니다. 이러한 관행을 통합함으로써 조직은 컴퓨터 비전 솔루션이 초기 배포 후에도 가치를 제공할 수 있습니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기