Yolo 비전 선전
선전
지금 참여하기
용어집

데이터 어노테이션

데이터 어노테이션이란 무엇입니까? 정확한 AI 및 컴퓨터 비전 모델 훈련에 필수적인 바운딩 박스 또는 폴리곤으로 데이터에 레이블을 지정하는 방법을 알아보세요.

데이터 주석은 원시 데이터에 라벨을 붙이거나 태그를 지정하거나 텍스트로 변환하여 컨텍스트를 제공하는 프로세스입니다. 이 단계는 알고리즘이 지도 학습의 기본이 되는 단계입니다. 레이블이 지정된 예제를 사용하여 패턴을 학습하고 예측하는 지도 학습의 기본입니다. 주석이 달린 데이터는 "정답"을 나타내는 근거 데이터의 역할을 합니다. 즉, 모델이 학습 중에 복제하려고 노력하는 '정답'을 나타냅니다. 정확한 주석이 없으면 다음과 같은 정교한 아키텍처도 같은 Ultralytics YOLO11 과 같은 정교한 아키텍처도 효과적으로 작동할 수 없습니다. 모델의 성능은 본질적으로 학습 데이터의 품질과 연관되어 있기 때문에 트레이닝 데이터의 품질과 연결되어 있기 때문입니다.

컴퓨터 비전에서 어노테이션의 역할

컴퓨터 비전(CV) 분야에서 데이터 주석은 이미지나 비디오 프레임 내에 특정 특징을 표시하는 작업을 포함합니다. 작업마다 고유한 주석 스타일이 필요하며, 각 주석 스타일은 시스템에 고유한 수준의 디테일을 제공합니다.

  • 개체 감지: 어노테이터 는 관심 있는 물체 주위에 2D 경계 상자를 그립니다, 2D 경계 상자를 그립니다. 이렇게 하면 모델에 객체의 종류와 위치를 알려줍니다.
  • 인스턴스 세분화: 이 기술은 오브젝트 주위에 정확한 폴리곤을 추적해야 합니다. 바운딩 박스와 달리 세그멘테이션은 엔티티의 정확한 엔티티의 모양과 윤곽을 정확하게 매핑하며, 이는 다음과 같은 애플리케이션에 매우 중요합니다. 로봇 잡기.
  • 포즈 추정: 어노테이터는 피사체의 특정 "키포인트"를 피사체에 표시합니다(예: 인체의 관절(팔꿈치, 무릎, 어깨)). 이를 통해 모델이 움직임과 자세를 track 수 있습니다.
  • 오리엔티드 바운딩 박스(OBB): 다음 용도로 사용됩니다. 위성 이미지의 선박이나 컨베이어 벨트 위의 포장물과 같이 이미지 축에 정렬되지 않은 물체에 사용됩니다. 이 상자는 물체의 방향에 맞게 회전할 수 있습니다.
  • 이미지 분류: 가장 간단한 형태의 주석인 가장 간단한 형태의 주석으로, 단일 레이블(예: "맑은", "비오는")이 전체 이미지에 할당됩니다. 전체 이미지.

주석은 일반적으로 JSON과 같은 구조화된 형식으로 저장됩니다, XML 또는 간단한 텍스트 파일(예: YOLO 형식)과 같은 구조화된 형식으로 저장된 다음 교육 소프트웨어에 의해 파싱됩니다.

실제 애플리케이션

데이터 주석은 원시 센서와 지능적인 의사 결정 사이의 간극을 메워 수많은 최신 기술을 지원합니다. 의사 결정을 지원합니다.

  1. 자율주행 차량: 자율 주행 자동차는 모든 차선 표시, 교통 표지판, 장애물에 주석이 달린 방대한 데이터 세트에 의존합니다. 데이터 에 레이블을 지정하여 차량의 인지 시스템을 훈련시켜 인식 시스템을 훈련시킵니다. 이러한 수준의 디테일은 강력한 자동차 솔루션의 강력한 AI를 개발하는 데 매우 중요합니다.
  2. 의료 진단: In 의료 분야의 AI, 방사선 전문의가 주석 달기 MRI 스캔 또는 종양과 골절을 강조하기 위해 엑스레이에 주석을 달 수 있습니다. 이러한 주석이 달린 의료 이미지를 통해 모델은 고감도로 잠재적인 이상 징후를 표시하여 고감도로 잠재적인 이상 징후를 표시하여 의사를 지원할 수 있습니다.
  3. 스마트 리테일: 자동 결제 시스템은 주석을 사용하여 제품을 인식합니다. 수천 개의 식료품에 라벨을 붙임으로써 수천 개의 식료품 품목에 라벨을 부착하여 원활한 쇼핑 환경을 조성할 수 있습니다. 자세히 보기 소매업의 AI.

관련 개념과의 비교

데이터 주석을 데이터 준비 워크플로에서 자주 사용되는 다른 용어와 구별하는 것이 도움이 됩니다.

  • 주석과 데이터 라벨링: 이 용어는 종종 같은 의미로 사용됩니다. 그러나 '라벨링'은 종종 단순한 분류 작업(카테고리 할당)과 연관되는 반면에 분류 작업(카테고리 할당)과 관련이 있는 반면, '주석'은 종종 더 복잡한 메타데이터를 의미하기도 합니다. 도형(다각형, 상자)을 그리거나 동영상에 타임스탬프를 표시하는 등 더 복잡한 메타데이터 생성을 의미합니다.
  • 주석 대 데이터 증강: 어노테이션은 데이터 집합의 초기 레이블을 만듭니다. 데이터 증강은 별도의 프로세스입니다. 기존 주석이 달린 이미지를 수정(예: 뒤집기, 회전, 밝기 변경)하여 이 데이터 세트를 확장하는 별도의 프로세스입니다. 모델 견고성을 향상시키는 별도의 프로세스입니다.
  • 주석 대 능동형 학습: 능동 학습은 모델이 가장 혼란스러워하는 데이터 포인트를 식별하고 해당 특정 예시에 대해서만 사람의 주석을 요청하여 주석 예산을 최적화하는 전략입니다.

도구 및 워크플로

고품질 주석을 만들려면 전문 도구가 필요한 경우가 많습니다. 다음과 같은 오픈 소스 옵션이 있습니다. CVAT(컴퓨터 비전 주석 도구)Label Studio는 상자 및 다각형을 그리기 위한 인터페이스를 제공합니다. 대규모 작업의 경우 대규모 작업의 경우, 팀은 곧 출시될 Ultralytics Platform과 같은 통합 환경으로 전환할 수 있습니다. 데이터 소싱에서 모델 배포에 이르는 수명 주기를 간소화합니다.

데이터에 주석을 달면 모델을 학습시키는 데 사용할 수 있습니다. 다음 예는 YOLO11 파일에 정의된 데이터 세트를 사용하여 YOLO11 모델을 훈련하는 방법은 주석이 달린 이미지와 레이블을 가리키는 YAML 파일에 정의된 데이터 집합을 사용하여 설명합니다.

from ultralytics import YOLO

# Load the YOLO11 model (nano version)
model = YOLO("yolo11n.pt")

# Train on the COCO8 dataset, which contains pre-annotated images
# The 'data' argument references a YAML file defining dataset paths and classes
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기