YOLO Vision 2025를 놓치지 마세요!
2025년 9월 25일
10:00 — 18:00 BST
하이브리드 이벤트
Yolo Vision 2024
용어집

벤치마크 데이터 세트

벤치마크 데이터 세트가 공정한 모델 평가, 재현성 및 머신 러닝의 발전을 가능하게 함으로써 AI 혁신을 주도하는 방법을 알아보십시오.

벤치마크 데이터 세트는 머신러닝(ML)에서 다양한 알고리즘과 모델의 성능을 공정하고 재현 가능한 방식으로 평가하고 비교하는 데 사용되는 표준화된 고품질 데이터 세트입니다. 이러한 데이터 세트는 신중하게 선별되고 연구 커뮤니티에서 널리 인정받고 있으며 객체 탐지 또는 이미지 분류와 같은 특정 작업의 발전을 측정하기 위한 공통 기반 역할을 합니다. 연구원과 개발자는 동일한 데이터 및 평가 지표에 대해 모델을 테스트함으로써 어떤 접근 방식이 더 효과적인지, 더 빠른지 또는 더 효율적인지 객관적으로 판단할 수 있습니다. 벤치마크를 사용하는 것은 인공 지능(AI)의 최첨단 기술을 발전시키는 데 기본적입니다.

벤치마킹의 중요성

빠르게 진화하는 컴퓨터 비전(CV) 분야에서 벤치마크 데이터 세트는 필수 불가결합니다. 이는 모델 개선 및 혁신을 평가하기 위한 안정적인 기준선을 제공합니다. 벤치마크 데이터 세트가 없으면 새로운 모델 아키텍처 또는 훈련 기술이 진정으로 발전을 나타내는지, 아니면 성능이 단순히 다른 잠재적으로 더 쉬운 데이터 세트에서 테스트되었기 때문인지 알기가 어렵습니다. ImageNet Large Scale Visual Recognition Challenge(ILSVRC)와 같은 챌린지와 관련된 공개 리더보드는 이러한 데이터 세트를 사용하여 건전한 경쟁을 촉진하고 진행 상황을 투명하게 추적합니다. 이 프로세스는 보다 강력하고 일반화 가능한 모델 개발을 장려하며, 이는 실제 모델 배포에 매우 중요합니다.

실제 사례

  1. 객체 탐지 모델 비교: Ultralytics에서 YOLO11과 같은 새로운 모델을 개발할 때, 해당 모델의 성능은 COCO와 같은 표준 벤치마크 데이터 세트에서 엄격하게 테스트됩니다. 평균 정밀도 (mAP)와 같은 지표로 측정된 결과는 이전 버전(YOLOv8, YOLOv10) 및 다른 최첨단 모델과 비교됩니다. 이러한 모델 비교는 사용자가 자신의 필요에 가장 적합한 모델을 선택하는 데 도움이 됩니다. Ultralytics HUB와 같은 플랫폼을 통해 사용자는 모델을 훈련하고 사용자 지정 데이터에서 벤치마킹할 수 있습니다.
  2. 자율 주행 발전(Advancing Autonomous Driving): 자율 주행 차량 기술을 개발하는 회사는 Argoverse 또는 nuScenes와 같은 벤치마크에 크게 의존합니다. 이러한 데이터 세트에는 자동차, 보행자 및 자전거 운전자에 대한 자세한 주석이 포함된 복잡한 도시 주행 시나리오가 포함되어 있습니다. 이러한 벤치마크에서 인식 모델을 평가함으로써 기업은 감지 정확도, 추적 신뢰성 및 전체 시스템 견고성의 개선을 측정할 수 있으며, 이는 자율 주행 자동차용 AI의 안전을 보장하는 데 매우 중요합니다.

벤치마크 vs. 기타 데이터 세트

벤치마크 데이터 세트를 ML 라이프사이클에 사용되는 다른 데이터 분할과 구별하는 것이 중요합니다.

  • 학습 데이터: 입력 예제와 해당 레이블을 기반으로 파라미터를 조정하여 모델을 학습시키는 데 사용됩니다. 일반적으로 데이터의 가장 큰 부분을 차지합니다. 데이터 증강과 같은 기술이 종종 여기에 적용됩니다.
  • 검증 데이터: 모델 하이퍼파라미터(예: 학습률 또는 아키텍처 선택)을 조정하고 모델 기술에 대한 편향되지 않은 추정치를 제공하기 위해 학습 중에 사용됩니다. 학습 데이터에 대한 과적합을 방지하는 데 도움이 됩니다.
  • 테스트 데이터: 모델이 완전히 학습된 후에 보이지 않는 데이터에 대한 성능에 대한 최종적이고 편향되지 않은 평가를 제공하는 데 사용됩니다.

벤치마크 데이터 세트는 종종 표준화된 테스트 세트 역할을 하지만 주요 목적은 더 광범위합니다. 즉, 전체 연구 커뮤니티에서 비교를 위한 공통 표준을 제공하는 것입니다. 많은 벤치마크 데이터 세트가 다양한 ML 작업에 대한 리더보드를 호스팅하는 Papers with Code와 같은 플랫폼에 나열되고 추적됩니다. 다른 주목할 만한 데이터 세트로는 Google의 Open Images V7과 Pascal VOC 챌린지가 있습니다. 이러한 고품질 컴퓨터 비전 데이터 세트에 대한 액세스는 신뢰할 수 있는 AI 시스템을 구축하는 모든 사람에게 필수적입니다.

Ultralytics 커뮤니티에 참여하세요

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기
클립보드에 링크가 복사되었습니다.