Yolo 비전 선전
선전
지금 참여하기
용어집

데이터 어노테이션

데이터 어노테이션이란 무엇입니까? 정확한 AI 및 컴퓨터 비전 모델 훈련에 필수적인 바운딩 박스 또는 폴리곤으로 데이터에 레이블을 지정하는 방법을 알아보세요.

데이터 주석 작업은 기계 학습(ML) 모델이 학습하는 데 필요한 맥락을 제공하기 위해 원시 데이터에 라벨링, 태깅 또는 전사 작업을 수행하는 핵심 과정입니다. 이 단계는 알고리즘이 패턴을 인식하고 예측을 수행하도록 입력-출력 쌍으로 훈련되는 방법인 지도 학습의 초석입니다. 라벨링된 정보는 모델이 재현하고자 하는 이상적인 결과를 나타내는 기준값( ground truth) 역할을 합니다. 정확하고 일관된 주석이 없다면, Ultralytics 같은 고급 아키텍처조차도 효과적으로 작동할 수 없습니다. 시스템의 정확도는 훈련 데이터의 품질에 직접적으로 의존하기 때문입니다.

컴퓨터 비전에서 흔히 사용되는 어노테이션 유형

컴퓨터 비전(CV) 분야에서 데이터 주석 작업은 이미지나 비디오 프레임 내 특정 특징을 표시하는 것을 의미합니다. 사용되는 방법은 모델이 수행하도록 구축되는 특정 작업에 크게 좌우됩니다.

  • 물체 탐지: 주석 작성자는 관심 대상(예: 차량이나 보행자) 주위에 2차원 경계 상자를 그립니다. 이를 통해 모델은 물체가 무엇이며 장면 내에서 어디에 위치하는지 학습합니다.
  • 인스턴스 분할: 이 기술은 물체의 가장자리 주변에 정밀한 다각형을 추적하는 것을 포함합니다. 단순한 상자와 달리, 분할은 정확한 형태와 윤곽을 매핑하며, 이는 로봇 그립핑과 같은 높은 정밀도가 요구되는 작업에 필수적입니다.
  • 자세 추정: 주제에 대한 특정 키포인트 (예: 인체의 관절부위인 팔꿈치, 무릎, 어깨)를 주석자가 표시합니다. 이를 통해 모델은 track 자세를 track 운동 성능까지 분석할 수 있습니다.
  • 이미지 분류: 이는 가장 단순한 형태로, 단일 범주 레이블(예: "건강한 잎" 대 "병든 잎")이 전체 이미지에 할당됩니다.

실제 애플리케이션

데이터 어노테이션은 다양한 산업 분야에서 원시 센서 데이터와 지능형 의사 결정 사이의 간극을 메웁니다.

  1. 스마트 농업: 농업 분야 인공지능에서는 방대한 작물 이미지 데이터셋에 주석을 달아 잡초, 해충 또는 영양 결핍을 식별합니다. 이 데이터로 모델을 훈련함으로써 농부들은 작물 모니터링을 자동화하고 필요한 곳에만 처방을 적용할 수 있어 낭비를 줄이고 수확량을 향상시킵니다.
  2. 자율주행: 자율주행차는 모든 차선 표시, 교통 표지판, 장애물이 라벨링된 방대한 주석 데이터 라이브러리에 의존합니다. 카메라와 라이다 센서에서 수집된 데이터는 차량의 인식 시스템을 훈련시키기 위해 처리되어 복잡한 교통 상황을 안전하게 주행할 수 있도록 합니다.

관련 개념 구분하기

데이터셋 준비 워크플로우에서 흔히 사용되는 다른 용어들과 데이터 어노테이션을 구분하는 것이 유용합니다.

  • 주석(Annotation) 대 데이터 라벨링(Data Labeling): 흔히 혼용되지만, "라벨링"은 일반적으로 단순한 분류 작업(태그 지정)을 의미하는 반면, "주석"은 복잡한 기하학적 구조 그리기나 동영상 내 타임스탬프 표시와 같은 풍부한 메타데이터 생성을 암시합니다.
  • 주석 대 데이터 증강: 주석은 초기 기준 데이터를 생성합니다. 증강은 기존 주석 처리된 이미지에 변환(회전이나 색상 변화 등)을 적용하여 모델의 견고성을 향상시키기 위해 데이터셋을 인위적으로 확장하는 후속 과정입니다.
  • 주석 대 능동적 학습: 능동적 학습은 모델이 가장 혼란스러워하는 특정 데이터 포인트를 식별하고 해당 예시에 대해서만 인간 주석을 요청함으로써 주석 과정의 시간과 비용을 최적화하는 전략입니다.

도구 및 워크플로

고품질 어노테이션 생성은 일반적으로 JSON이나 XML과 같은 표준 형식으로 데이터를 내보내는 전문 소프트웨어가 필요합니다. 현대적인 워크플로는 데이터 소싱, 자동 어노테이션, 모델 훈련을 하나의 인터페이스에서 간소화하는 Ultralytics 같은 통합 환경으로 점점 더 이동하고 있습니다.

데이터에 주석이 추가되면, 훈련을 위해 구성 파일(주로 YAML)에서 참조됩니다. 다음 예시는 기존 주석이 포함된 표준 COCO8 사용하여 YOLO26 모델을 훈련하는 방법을 보여줍니다.

from ultralytics import YOLO

# Load the latest YOLO26 model (nano version)
model = YOLO("yolo26n.pt")

# Train the model using a dataset configuration file
# The YAML file points to the annotated images and labels
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기