Data Labeling
머신러닝을 위한 데이터 라벨링의 기초를 배우십시오. 객체 탐지와 같은 주요 유형을 발견하고 Ultralytics YOLO26를 사용하여 워크플로우를 가속화하는 방법을 배우십시오.
데이터 라벨링은 이미지, 비디오 프레임, 텍스트 또는 오디오와 같은 원시 데이터를 식별하고 정보를 제공하는 태그나 메타데이터를 추가하여 컨텍스트를 부여하는 근본적인 과정입니다. 머신 러닝(ML) 영역에서 알고리즘은 물리적 세계를 본질적으로 이해할 수 없으므로 이를 안내할 "교사"가 필요합니다. 이러한 안내는 지도 학습 중에 사용되는 라벨이 지정된 데이터셋의 형태로 제공됩니다. 라벨은 모델이 예측하려고 하는 정답을 나타내는 그라운드 트루스 역할을 합니다. 간단한 분류기를 학습시키든 Ultralytics YOLO26과 같은 복잡한 아키텍처를 학습시키든, 이러한 라벨의 정확성, 일관성 및 품질은 모델 성공의 주요 결정 요인입니다.
Link to this section데이터 라벨링 vs. 데이터 어노테이션#
일상적인 대화에서는 이 용어들이 혼용되기도 하지만, 주목할 만한 미묘한 차이가 있습니다. "데이터 라벨링"은 일반적으로 데이터 조각에 카테고리나 태그를 할당하는 광범위한 행위(예: 이메일을 "스팸"으로 태그 지정)를 의미합니다. 반면, 데이터 어노테이션은 컴퓨터 비전(CV)과 더 구체적으로 관련되어 있으며, 바운딩 박스, 폴리곤 또는 키포인트를 사용하여 객체를 정밀하게 묘사하는 작업을 포함합니다. 그러나 대부분의 MLOps 워크플로우에서 두 용어 모두 고품질 학습 데이터 생성을 설명합니다.
Link to this section컴퓨터 비전의 주요 유형#
라벨링 방식은 모델이 수행해야 하는 작업에 따라 달라집니다. 일반적인 유형은 다음과 같습니다:
- 이미지 분류: 기상 조건을 "흐림" 또는 "맑음"으로 식별하는 것과 같이 전체 이미지에 단일 라벨을 할당합니다.
- 객체 탐지: 개별 객체 주위에 2D 바운딩 박스를 그려 모델에게 객체가 무엇이고 어디에 위치하는지 학습시킵니다.
- 인스턴스 세그멘테이션: 객체 주변에 픽셀 단위의 정밀한 마스크 또는 폴리곤을 생성하며, 이는 정확한 형태와 경계를 결정하는 데 필수적입니다.
- 포즈 추정: 골격 관절과 같은 피사체의 특정 키포인트를 표시하여 움직임이나 자세를 분석합니다.
Link to this section실제 애플리케이션 사례#
데이터 라벨링의 유용성은 AI를 활용하는 거의 모든 산업으로 확장됩니다.
-
자율 주행 차량: 자율 주행 자동차는 모든 차량, 보행자, 교통 표지판, 차선 표시가 꼼꼼하게 라벨링된 방대한 데이터셋에 의존합니다. 이 라벨링된 데이터는 인식 시스템이 복잡한 환경을 안전하게 탐색할 수 있도록 합니다. 자율 주행 차량 기업들은 안전 규정 준수를 보장하기 위해 픽셀 수준의 라벨링에 많은 투자를 합니다.
-
정밀 농업: 현대 농업에서 농업 분야의 AI는 작물 질병을 감지하거나 성장 단계를 모니터링하는 데 사용됩니다. 농부들은 "건강한" 잎과 "질병이 있는" 잎의 라벨링된 이미지로 학습된 모델을 사용하여 처리를 자동화함으로써 화학 물질 사용을 줄이고 수확량을 늘립니다.
Link to this section라벨링 워크플로우#
라벨링된 데이터셋을 만드는 것은 종종 AI 프로젝트에서 가장 시간이 많이 걸리는 부분입니다. 이 과정은 일반적으로 사람이 라벨을 검토하여 높은 정확도를 보장하는 "Human-in-the-Loop"(HITL) 방식을 포함합니다. 최신 워크플로우는 Ultralytics Platform과 같은 도구를 활용하여 데이터셋 관리를 간소화하고 팀이 어노테이션 작업에서 협업할 수 있도록 합니다. 모델이 데이터를 사전 라벨링하고 사람은 낮은 신뢰도의 예측만 수정하는 액티브 러닝과 같은 고급 기술을 도입하면 작업 속도를 크게 높일 수 있습니다.
다음 예제는 사전 학습된 YOLO26 모델을 사용하여 새 이미지에 대한 라벨을 자동으로 생성(자동 라벨링)하는 방법을 보여주며, 이 결과물은 사람이 직접 수정할 수 있습니다:
from ultralytics import YOLO
# Load the YOLO26n model (nano version)
model = YOLO("yolo26n.pt")
# Run inference on an image to detect objects
results = model("https://ultralytics.com/images/bus.jpg")
# Save the detection results to a text file in standard YOLO format
# This file can now be used as a starting point for data labeling
results[0].save_txt("bus_labels.txt")





