YOLO Vision 2025를 놓치지 마세요!
2025년 9월 25일
10:00 — 18:00 BST
하이브리드 이벤트
Yolo Vision 2024
용어집

데이터 어노테이션

데이터 어노테이션이란 무엇입니까? 정확한 AI 및 컴퓨터 비전 모델 훈련에 필수적인 바운딩 박스 또는 폴리곤으로 데이터에 레이블을 지정하는 방법을 알아보세요.

데이터 어노테이션은 머신 러닝(ML) 모델이 데이터를 이해하고 학습하는 데 도움이 되도록 원시 데이터에 레이블을 지정하거나 태그를 지정하는 프로세스입니다. 이 중요한 단계를 통해 이미지나 비디오와 같은 비정형 데이터가 알고리즘이 해석할 수 있는 정형 정보로 변환됩니다. 지도 학습의 맥락에서 이러한 어노테이션은 모델이 스스로 훈련하는 데 사용하는 "정답"인 '정답 데이터(ground truth)' 역할을 합니다. 데이터 어노테이션의 품질과 정확성은 결과 인공 지능(AI) 모델의 성능과 신뢰성에 직접적인 영향을 미칩니다. 정확한 어노테이션이 없으면 가장 발전된 모델조차도 패턴을 효과적으로 학습하지 못합니다.

컴퓨터 비전에서 어노테이션의 역할

컴퓨터 비전(CV)에서 데이터 어노테이션은 모델이 세상을 '보고' 해석하도록 가르치는 데 기본적입니다. 여기에는 인간 어노테이터가 특수 소프트웨어를 사용하여 시각적 데이터 내에서 관심 객체를 식별하고 표시하는 작업이 포함됩니다. 다양한 유형의 어노테이션이 있으며, 각각 다른 CV 작업에 적합합니다.

  • 바운딩 박스 어노테이션(Bounding Box Annotation): 이는 객체 감지에 사용되는 가장 일반적인 형태입니다. 어노테이터는 개별 객체 주위에 직사각형 상자를 그리고 클래스 레이블(예: "자동차", "사람")을 할당합니다.
  • 다각형 분할: 인스턴스 분할과 같이 더 높은 정밀도를 요구하는 작업의 경우 어노테이터는 각 객체의 정확한 윤곽선을 추적합니다. 이를 통해 모델은 객체가 겹치는 경우에도 객체의 특정 모양과 경계를 이해할 수 있습니다.
  • 시맨틱 분할: 이 방법은 이미지의 모든 단일 픽셀을 특정 범주("하늘", "도로", "건물" 등)로 분류하는 것을 포함합니다. 인스턴스 분할과 달리 동일한 객체 클래스의 여러 인스턴스를 구별하지 않습니다.
  • 키포인트 어노테이션: 자세 추정에 사용되는 이 기술은 인체 관절이나 얼굴 모서리와 같이 객체의 특정 관심 지점(키포인트)을 표시하는 것을 포함합니다.
  • 분류: 가장 간단한 형태로, 전체 이미지에 단일 레이블이 할당됩니다. 이는 이미지 분류 작업의 기본입니다.

어노테이션 방법의 선택은 CV 프로젝트의 특정 목표에 따라 다르며, 이는 프로젝트 목표 정의 가이드에 간략하게 설명되어 있습니다.

실제 애플리케이션

  1. 자율 주행 차량: 자율 주행 자동차는 광범위하게 주석이 달린 데이터로 학습된 모델에 의존합니다. 주석자는 수백만 개의 이미지와 LiDAR 포인트 클라우드에서 보행자와 자전거 타는 사람부터 신호등, 차선 표시 및 도로 표지판에 이르기까지 모든 것에 레이블을 지정합니다. 이 자세한 학습 데이터를 통해 차량의 인식 시스템은 주변 환경을 이해하고 안전한 운전 결정을 내릴 수 있습니다. Argoverse와 같은 데이터 세트는 강력한 자동차 AI 솔루션을 개발하는 데 매우 중요합니다.
  2. 의료 영상 분석: 헬스케어 AI에서 방사선 전문의와 의료 전문가는 MRI, CT 스캔 및 X-레이와 같은 의료 스캔에 주석을 달아 종양, 병변, 골절 또는 기타 이상을 강조 표시합니다. 이러한 주석이 달린 데이터 세트(예: 공개 뇌종양 데이터 세트)는 조기 진단 및 치료 계획을 지원할 수 있는 Ultralytics YOLO와 같은 모델을 학습하는 데 사용됩니다. 북미 방사선 학회(RSNA)는 연구를 위해 여러 데이터 세트를 제공합니다.

데이터 어노테이션 vs. 관련 개념

데이터 어노테이션은 다른 데이터 준비 기술과 함께 자주 논의되지만, 그 목적은 서로 다릅니다.

  • 데이터 어노테이션 vs. 데이터 레이블링: 이 두 용어는 자주 혼용되며 동일한 핵심 프로세스를 지칭합니다. "어노테이션"은 폴리곤이나 키포인트 그리기와 같은 더 복잡한 작업을 설명하기 위해 컴퓨터 비전에서 종종 선호되는 반면, "레이블링"은 분류와 같은 더 간단한 작업에 사용될 수 있습니다. 그러나 실제적인 목적에서는 이 둘은 동의어입니다. 자세한 내용은 컴퓨터 비전을 위한 데이터 레이블링에 대한 설명에서 자세히 알아볼 수 있습니다.
  • 데이터 어노테이션 vs. 데이터 증강: 어노테이션은 초기 Ground Truth(정답 데이터) 레이블을 생성하는 프로세스입니다. 반면에 데이터 증강은 어노테이션된 이미지의 수정된 버전을 생성하여 데이터 세트의 크기를 인위적으로 늘리기 위해 어노테이션 후에 사용되는 기술입니다(예: 회전, 뒤집기 또는 밝기 변경).
  • 데이터 어노테이션 vs. 데이터 클리닝: 데이터 클리닝은 데이터 세트의 전반적인 품질을 보장하기 위해 오류를 수정하고, 중복 항목을 제거하며, 누락된 값을 처리하는 것을 포함합니다. 클리닝은 어노테이션 전에 발생할 수도 있고(예: 흐릿한 이미지 제거), 후에 발생할 수도 있지만(예: 잘못된 레이블 수정), 새로운 레이블을 추가하는 행위와는 구별됩니다. 효과적인 어노테이션을 위해서는 높은 데이터 품질이 필수적입니다.

어노테이션 프로세스는 CVAT와 같은 오픈 소스 옵션에서 Scale AILabelbox와 같은 상용 플랫폼에 이르기까지 다양한 도구를 사용하여 관리할 수 있습니다. Ultralytics HUB와 같은 플랫폼은 데이터 세트를 관리하고, 모델을 학습하고, 데이터 수집 및 어노테이션에서 배포에 이르기까지 전체 워크플로를 간소화하는 통합 솔루션을 제공합니다.

Ultralytics 커뮤니티에 참여하세요

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기
클립보드에 링크가 복사되었습니다.