Yolo 비전 선전
선전
지금 참여하기
용어집

실험 추적

ML 실험 추적: 재현 가능한 모델 훈련을 위해 하이퍼파라미터, 데이터셋, 메트릭 및 아티팩트를 기록하세요.YOLO11 실행을 체계화하는 방법을 알아보세요.

실험 추적은 머신러닝 모델 훈련 과정에서 생성되는 변수, 지표 및 산출물을 체계적으로 기록, 정리 및 분석하는 과정입니다. 과학자의 실험실 노트와 마찬가지로, 이 관행은 테스트된 모든 가설에 대한 포괄적인 디지털 기록을 생성하여 연구 개발 단계가 엄격하고 투명하며 재현 가능하도록 보장합니다. 하이퍼파라미터 및 데이터셋 버전과 같은 입력값과 성능 그래프, 훈련된 가중치와 같은 출력값을 함께 포착함으로써 실험 추적은 모델 훈련의 반복적이고 혼란스러운 특성을 구조화된 데이터 중심 워크플로로 전환합니다. 이러한 체계화는 견고한 인공지능(AI) 시스템을 효율적으로 구축하려는 팀에게 매우 중요하며, 어떤 구성이 최상의 결과를 도출하는지 정확히 파악할 수 있게 합니다.

실험 추적의 핵심 구성 요소

컴퓨터 비전 프로젝트의 라이프사이클을 효과적으로 관리하기 위해, 견고한 추적 시스템은 일반적으로 세 가지 별개의 정보 범주를 기록합니다. 이러한 구성 요소를 체계화함으로써 개발자는 서로 다른 반복 작업을 비교하고 특정 사용 사례에 최적화된 구성을 식별할 수 있습니다.

  • 매개변수 및 구성: 이는 훈련 시작 전에 설정되는 변수들입니다. 여기에는 학습률, 최적화기 선택(예: Adam ), 배치 크기, 그리고 최신 YOLOv26과 같은 특정 모델 아키텍처가 포함됩니다. 이를 추적함으로써 성공적인 실행을 정확히 재현할 수 있습니다.
  • 성능 지표: 훈련 중 성공을 평가하기 위해 기록되는 정량적 측정값입니다. 일반적인 지표로는 오류를 측정하는 손실 함수, 분류 작업의 정확도, 물체 탐지를 위한 평균 정밀도(mAP) 등이 있습니다.
  • 아티팩트 및 산출물: 아티팩트는 실행 과정에서 생성된 유형의 파일을 의미하며, 훈련된 모델 가중치, 혼동 행렬과 같은 시각화 플롯, 환경 로그 등이 포함됩니다.

실제 적용에서의 관련성

정밀성과 안전성이 최우선인 산업 분야에서는 실험 추적의 엄격한 적용이 필수적입니다. 이를 통해 엔지니어링 팀은 과거 데이터를 검토하여 모델이 특정 방식으로 동작하는 원인을 파악할 수 있습니다.

의료 영상 및 진단

의료 분야에서 연구자들은 의사가 질환을 진단하는 데 도움을 주기 위해 의료 영상 분석을 활용합니다. 예를 들어, 뇌종양 탐지 모델을 훈련할 때 엔지니어들은 데이터 증강 기법을 다양하게 적용한 수백 건의 실험을 수행할 수 있습니다. 실험 추적 기능을 통해 어떤 전처리 단계의 특정 조합이 가장 높은 민감도를 보였는지 분리할 수 있어, 배포된 AI 에이전트가 중대한 진단 시나리오에서 위음성 결과를 최소화하도록 보장합니다.

자율주행차 안전

자율주행 차량 개발에는 detect , 표지판, 장애물을 detect 위해 방대한 양의 센서 데이터를 처리해야 합니다. 자율주행차 물체 감지 작업을 수행하는 팀은 정확도와 추론 지연 시간 모두를 최적화해야 합니다. 실험 추적을 통해 모델 규모와 속도 간의 상충 관계를 분석함으로써, 최종 시스템이 미국국도교통안전청(NHTSA)과 같은 기관이 정한 안전 기준을 저해하지 않으면서 실시간으로 반응하도록 보장할 수 있습니다.

관련 개념 차별화

실험 추적은 MLOps(머신러닝 운영)의 핵심 요소이지만, 종종 유사한 용어들과 혼동됩니다. 구분을 이해하는 것은 올바른 워크플로우 구현에 중요합니다.

  • 실험 추적 vs 모델 모니터링: 실험 추적은 개발 및 훈련 단계("오프라인")에서 수행됩니다. 반면 모델 모니터링은 모델이 프로덕션 환경에 배포된 후("온라인") 진행됩니다. 모니터링은 실제 데이터에서 데이터 드리프트나 성능 저하 같은 문제 탐지에 중점을 두는 반면, 추적은 모델이 사용자에게 도달하기 전에 최적화하는 데 초점을 맞춥니다.
  • 실험 추적 대 버전 관리: Git과 같은 도구는 소스 코드에 대한 버전 관리를 제공하여 시간 경과에 따른 텍스트 파일 변경 사항을 추적합니다. 실험 추적은 한 단계 더 나아가 해당 코드의 특정 버전을 훈련 실행의 특정 데이터, 매개변수 및 결과와 연결합니다. 버전 관리가 "코드가 어떻게 변경되었는가?"라는 질문에 답하는 반면, 실험 추적은 "어떤 매개변수가 최상의 모델을 생성했는가?"라는 질문에 답합니다.

Ultralytics YOLO 사용한 구현

현대 AI 프레임워크는 개발자가 실행 결과를 로컬 디렉터리나 원격 서버에 쉽게 기록할 수 있도록 하여 실험 추적을 간소화합니다. Ultralytics 사용할 경우, 프로젝트 및 실행 이름을 정의함으로써 추적을 효과적으로 구성할 수 있습니다. 이러한 구조는 서로 다른 실험적 가설을 분리하는 디렉터리 계층 구조를 생성합니다.

다음 예시는 속도와 정확도 측면에서 최신 표준인 YOLO26 모델을훈련하는 방법을 보여줍니다. 이때 프로젝트와 실험 실행을 명시적으로 명명함으로써 향후 비교를 위해 메트릭, 로그 및 가중치가 체계적으로 저장되도록 보장합니다.

from ultralytics import YOLO

# Load the latest YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model, specifying 'project' and 'name' for organized tracking
# Results will be saved to 'runs/detect/experiment_tracking_demo'
results = model.train(data="coco8.yaml", epochs=5, project="runs/detect", name="experiment_tracking_demo")

인기 있는 도구 및 통합 기능

개발자들은 기록된 데이터를 시각화하고 관리하기 위해 전문 소프트웨어에 의존합니다. 이러한 도구들은 종종 훈련 곡선과 메트릭 테이블을 나란히 비교할 수 있는 대시보드를 제공합니다.

  • MLflow: 실험, 재현성, 배포를 포함한 머신러닝 라이프사이클을 관리하는 오픈소스 플랫폼입니다. Ultralytics 통합을 통해 YOLO 중 메트릭을 원활하게 로깅할 수 있습니다.
  • TensorBoard: 원래 TensorFlow를 위해 개발되었지만, PyTorch를 포함한 다양한 프레임워크에서 널리 사용됩니다. PyTorch를 포함한 다양한 프레임워크에서 손실 곡선과 시각화를 확인하는 데 널리 사용됩니다. TensorBoard 통합을 통해 훈련 메트릭을 쉽게 시각화할 수 있습니다.
  • DVC(데이터 버전 관리): DVC는 추적 개념을 데이터셋과 모델로 확장하여 Git이 처리할 수 없는 대용량 파일을 다룹니다. DVC 통합을 사용하면 모든 실험에 사용된 데이터의 엄격한 버전 관리를 유지하는 데 도움이 됩니다.
  • Weights & Biases: 머신러닝 운영(MLOps)을 위한 개발자 중심 플랫폼으로, 팀이 track 모델 버전을 track 결과를 시각화할 track 있도록 지원합니다. Weights & Biases 복잡한 훈련 실행을 분석하기 위한 풍부하고 상호작용 가능한 차트를 제공합니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기