Ultralytics AI를 활용해 주석 작업을 자동화하고, 대규모 데이터 세트를 관리하며, 일관성을 높이고, 컴퓨터 비전 개발 속도를 높이는 방법을 확인해 보세요.
Ultralytics AI를 활용해 주석 작업을 자동화하고, 대규모 데이터 세트를 관리하며, 일관성을 높이고, 컴퓨터 비전 개발 속도를 높이는 방법을 확인해 보세요.
이미지와 동영상을 분석하는 컴퓨터 비전 솔루션은 제조업에서 의료 영상 분야에 이르기까지 다양한 산업 분야의 업무 흐름에서 필수적인 요소로 자리 잡고 있습니다. 예를 들어 제조업에서는 컨베이어 벨트를 따라 이동하는 제품의 표면 결함을 감지하는 작업이 미세한 패턴을 포착할 수 있는 컴퓨터 비전 모델에 의존하고 있습니다.
이러한 모델이 제대로 작동하려면, 각 결함이 명확하게 식별된 라벨링된 데이터로 훈련되어야 합니다. 이를 통해 모델은 무엇을 찾아야 하는지 학습하고 유사한 패턴을 인식할 수 있게 됩니다.
이러한 라벨을 생성하는 과정을 데이터 주석 처리라고 합니다. 특히, 이미지 주석 처리와 동영상 주석 처리에는 이미지나 동영상 프레임 내에서 경계 상자를 그리거나, 도형을 윤곽선으로 표시하거나, 특정 영역에 라벨을 붙이는 작업이 포함됩니다.
데이터 세트가 작을 때는 이 작업을 감당할 수 있지만, 데이터가 늘어남에 따라 처리하기가 점점 더 어려워집니다. 수천 장의 이미지에 라벨을 붙이는 작업은 지속적인 수작업이 필요하기 때문에, 주석 달기가 주요 병목 현상이 됩니다. 기존의 도구들은 대개 속도가 느리고, 분산되어 있으며, 확장하기 어렵습니다.
올인원 비전 AI 플랫폼인 Ultralytics AI 기반 주석 부착 기능을 통해 이러한 과제를 해결하는 데 도움을 줍니다. AI를 활용해 초기 라벨을 자동으로 생성하고, 이를 신속하게 검토 및 수정할 수 있게 함으로써 수작업 부담을 줄이고 효율성을 높여줍니다.
이 글에서는 Ultralytics 내에서 AI 지원 주석 기능이 어떻게 작동하는지, 그리고 이를 통해 라벨링 프로세스가 어떻게 개선되는지 살펴보겠습니다. 그럼 시작해 볼까요!
Ultralytics 플랫폼에서 AI 기반 주석 기능이 어떻게 작동하는지 자세히 알아보기 전에, 먼저 데이터 주석 작업에 대해 좀 더 자세히 살펴보겠습니다.
데이터 어노테이션(데이터 라벨링이라고도 함)은 기계 학습 모델 훈련에 활용할 수 있도록 원시 데이터에 구조화된 라벨을 부여하는 과정입니다. 컴퓨터 비전 분야에서 이러한 라벨은 이미지나 동영상 내의 대상, 영역 또는 관심 특징을 정의합니다.
훈련 과정에서 모델이나 알고리즘은 입력 데이터를 이러한 레이블에 매핑하는 방법을 학습하므로, 라벨링 품질은 모델 성능의 핵심 요소가 됩니다. 정확하고 일관성 있는 라벨링 데이터셋을 통해 모델은 올바른 패턴을 학습할 수 있는 반면, 품질이 낮거나 일관성이 없는 라벨링은 신뢰할 수 없는 예측 결과로 이어질 수 있습니다.
예를 들어, 결함 탐지 사례에서 컨베이어 벨트 위의 제품 이미지에 결함이 나타나는 위치를 표시하고 결함의 종류를 라벨링하여 주석을 달 수 있습니다. 이를 통해 모델은 결함의 특징을 학습하여 새로운 이미지에서 결함을 식별할 수 있게 됩니다.
다음으로, 컴퓨터 비전 분야에서 이미지를 주석 처리하는 일반적인 방법들을 살펴보겠습니다. 이러한 방법들은 물체 탐지, 인스턴스 분할, 이미지 분류와 같은 작업을 위해 시각 데이터를 라벨링하는 데 사용됩니다. 각 주석 처리 방법은 물체의 위치를 파악하거나, 형태를 포착하거나, 주요 구조를 식별하는 등 서로 다른 기능을 수행합니다.
바운딩 박스는 이미지 내 객체의 위치를 표시하기 위해 객체 주위에 그려지는 단순한 직사각형입니다. 이는 컴퓨터 비전 분야에서 데이터를 라벨링하는 가장 일반적인 방법 중 하나입니다.
이러한 사각형이 표시된 이미지를 통해 훈련함으로써, 물체 탐지 모델은 다양한 물체를 인식하고 이미지 내에서의 위치를 파악하는 법을 배웁니다. 이를 통해 모델은 detect 물체를 동시에 detect 각 물체가 나타나는 위치를 식별할 수 있습니다.
예를 들어, 컴퓨터 비전을 활용해 야구 경기를 분석하는 경우를 생각해 보자. 각 프레임에서 선수, 배트, 공 주위에 사각형을 그려 넣으면, 모델이 경기 내내 이러한 물체를 detect 식별할 수 있게 된다.

폴리곤(Polygons)은 세그멘테이션 마스크라고도 불리며, 픽셀 단위로 객체에 레이블을 부여함으로써 바운딩 박스보다 한 단계 더 정교합니다. 대략적인 사각형을 그리는 대신, 이미지 내 각 객체의 정확한 형태와 경계를 포착합니다. 따라서 더 세밀한 이해가 필요한 작업에 유용합니다.
예를 들어, 자율 주행 분야에서 세그멘테이션 마스크는 각 픽셀에 도로나 하늘과 같은 범주를 할당하는 ‘의미적 세그멘테이션’이나, 차량이나 보행자와 같은 개별 물체를 따로 식별하는 ‘인스턴스 세그멘테이션’과 같은 작업에 사용됩니다.
또한 사람 같은 피사체를 이미지의 나머지 부분에서 분리해야 하는 배경 제거와 같은 작업에도 사용됩니다.
키포인트는 인체의 관절이나 동물의 신체 부위와 같이 물체의 특정 지점을 표시하는 데 사용됩니다. 이러한 지점을 식별함으로써 모델은 물체의 구조와 각 부분이 서로에 대해 어떻게 배치되어 있는지 파악할 수 있습니다.
컴퓨터 비전 분야에서 이를 ‘자세 추정’이라고 부르며, 그 목적은 이러한 키포인트의 위치를 파악하고 서로 어떻게 연관되어 있는지 이해하는 데 있습니다. 시간의 흐름에 따라 이러한 점을 추적함으로써 움직임과 자세의 변화를 분석할 수 있습니다.

흔히 볼 수 있는 예로는, 사람의 움직임을 분석하기 위해 영상 속 신체 관절을 표시하는 것이 있습니다. 이러한 핵심 지점에 초점을 맞추면, 모델은 사람의 자세가 어떻게 되어 있는지, 그리고 시간이 지남에 따라 자세가 어떻게 변하는지 파악할 수 있습니다.
이미지 속의 모든 물체가 완벽하게 정렬되어 있는 것은 아닙니다. 실제 상황에서는 물체가 기울어지거나 회전되어 있거나, 다양한 각도에서 촬영된 경우가 많습니다.
이러한 경우 표준 바운딩 박스는 불필요한 배경을 포함하거나 대상과 정확히 일치하지 못하는 문제가 자주 발생합니다. 방향 기반 바운딩 박스는 대상의 방향에 맞춰 회전된 사각형을 사용함으로써 이러한 문제를 해결합니다. 그 결과, 더 정밀하고 정확한 주석이 생성됩니다.
이러한 접근 방식은 모델이 물체의 위치와 방향을 모두 식별하는 방향 기반 바운딩 박스(OBB) 탐지에 사용됩니다. 예를 들어 항공 사진의 경우, 건물, 선박, 차량과 같은 물체가 종종 다양한 각도로 나타나곤 합니다. 회전된 박스를 사용하면 장면 내에서 물체의 실제 형태와 방향을 더 쉽게 포착할 수 있습니다.
분류 라벨은 특정 물체나 영역을 표시하는 대신 이미지 전체에 단일 라벨을 할당한다는 점에서 다른 주석 처리 방식과는 다른 접근 방식을 취합니다. 이는 이미지에 무엇이 포함되어 있는지 파악하는 것이 목표이며, 그것이 어디에 나타나는지에 초점을 맞추지 않을 때 사용됩니다.
예를 들어, 이미지는 전체적인 내용을 바탕으로 “고양이”나 “개”로 분류될 수 있습니다. 따라서 이미지 분류는 이미지를 대략적으로 이해하는 것만으로도 충분한 작업에 유용합니다.
많은 기존 라벨링 도구는 여러 단계와 서로 연결되지 않은 워크플로를 필요로 합니다. AI 개발 팀은 라벨링, 저장, 검증 작업을 위해 여러 주석 처리 플랫폼을 오가야 하는 경우가 많아, 이로 인해 AI 프로젝트 진행 속도가 느려집니다.
대부분의 도구는 제한된 종류의 주석 유형과 데이터 유형만 지원하기 때문에, 팀들은 바운딩 박스, 분할, 키포인트 작업을 위해 서로 다른 도구를 사용하게 됩니다. 이러한 분산된 환경은 관리하기 어려울 수 있으며, 특히 컴퓨터 비전 분야를 처음 접하는 팀에게는 더욱 그렇습니다.
수작업 역시 또 다른 주요 과제입니다. 단일 이미지에 주석을 달는 데는 몇 분밖에 걸리지 않을 수 있지만, 대규모 데이터셋을 다룰 때는 특히 유사한 이미지들에 대해 반복적인 작업을 수행해야 할 경우 금세 시간이 많이 소요됩니다.
데이터셋이 커짐에 따라 팀은 파일을 관리하고, track 버전을 track , 주석 간 일관성을 유지해야 합니다. 이로 인해 업무 부담이 늘어나 데이터 관리에 더 많은 시간을 할애하게 되고, 모델 성능 개선에 쏟을 시간은 줄어들게 됩니다.
보다 효율적인 방법은 Ultralytics 내에서 AI 지원 라벨링 기능을 활용하는 것입니다. 이 플랫폼은 AI를 통해 라벨을 생성하고 정교화함으로써 수작업 부담을 줄이는 동시에 속도와 일관성을 높여주며, 데이터셋 관리, 라벨링, 모델 훈련, 배포 및 모니터링을 하나의 통합 환경에서 모두 수행할 수 있게 해줍니다.
Ultralytics 주석 작업을 컴퓨터 비전 워크플로우의 나머지 단계와 직접 연결함으로써 이 과정을 간소화합니다. 별도의 도구에 의존할 필요 없이, 팀은 단일 환경에서 데이터, 주석 및 모델을 함께 다룰 수 있습니다.
이 모델은 물체 탐지, 이미지 분류, 인스턴스 분할, 자세 추정, 방향 기반 바운딩 박스 탐지 등 다양한 컴퓨터 비전 작업을 지원합니다.
이러한 환경에서 라벨링 작업은 다양한 방식으로 수행할 수 있습니다. 팀은 데이터를 직접 라벨링하여 모든 과정을 직접 관리하거나, SAM 스마트 라벨링 기능을 활용해 대화형 포인트 기반 라벨링을 수행할 수 있으며, YOLO 스마트 라벨링을 적용해 자동으로 라벨을 생성한 후 이를 검토하고 수정할 수도 있습니다. 이러한 유연성 덕분에 다양한 데이터 세트와 라벨링 요구 사항에 더 쉽게 대응할 수 있습니다.

AI 지원 주석 작업과 수동 주석 작업이 데이터셋 관리 및 모델 훈련과 통합되어 있으므로, 팀은 데이터 라벨링에서 데이터셋 정리 및 모델 훈련으로 원활하게 전환할 수 있습니다. 이를 통해 워크플로우가 체계적으로 유지되며, 도구를 전환하거나 주석 형식을 다시 조정할 필요가 없어집니다.
이 플랫폼은 또한 다음과 같은 Ultralytics YOLO 지원합니다. Ultralytics YOLO11 및 Ultralytics 같은 Ultralytics YOLO 모델을 지원하여, 주석이 달린 데이터를 훈련 및 테스트에 직접 사용할 수 있게 합니다. 이를 통해 데이터 세트의 누락된 부분을 쉽게 파악하고, 주석을 개선하며, 지속적인 반복 과정을 통해 모델을 재훈련할 수 있습니다.
Ultralytics SAM 스마트 어노테이션 기능은 물체 탐지, 인스턴스 분할 및 방향 기반 바운딩 박스(OBB) 작업에 대한 어노테이션 속도를 높이기 위해 설계되었습니다.
이 플랫폼은 SAM .1 Tiny, SAM .1 Small, SAM .1 Base, SAM .1 Large, SAM 등 다양한 SAM 변형을 제공하여, 사용자가 속도와 정확도 중 원하는 옵션을 선택할 수 있도록 합니다.

Tiny 및 Small과 같은 소형 모델은 처리 속도가 빠르며 신속한 라벨링 작업에 적합하고, Large 및 SAM 같은 대형 모델은 더 복잡한 장면에서 높은 정확도를 제공합니다. 모델을 전환하면 라벨링 동작이 즉시 업데이트됩니다.
주석 편집기에서 SAM 선택하면, 인간 주석 담당자는 스마트 모드로 전환하여 라벨링을 시작할 수 있습니다. 도형을 수동으로 그리는 대신, 간단한 점 기반 입력을 통해 모델을 안내할 수 있습니다.
마우스 왼쪽 버튼을 클릭하면 해당 영역을 포함하는 양의 점을 추가하고, 오른쪽 버튼을 클릭하면 원하지 않는 영역을 제외하는 음의 점을 추가합니다. 이러한 입력을 바탕으로 모델은 실시간으로 정밀한 마스크를 생성합니다.
작업 속도를 높이기 위해 자동 적용 모드를 활성화할 수 있습니다. 이 모드가 활성화되면 클릭할 때마다 수동 확인 절차 없이 주석이 자동으로 생성 및 저장됩니다. 더 복잡한 객체의 경우, 주석 작성자는 “Shift” 키를 누른 상태로 여러 지점을 설정한 후 마스크를 적용하거나, 자동 적용 모드를 비활성화한 뒤 자유롭게 지점을 추가한 다음 “Enter” 키를 눌러 마스크를 적용할 수 있습니다.
SAM 스마트 어노테이션과 마찬가지로, Ultralytics YOLO 어노테이션은 AI를 활용하여 라벨링 프로세스의 속도를 높입니다. 클릭으로 모델을 안내하는 대신, 모델의 예측 결과를 활용해 어노테이션을 자동으로 생성합니다.
이 접근 방식은 물체 탐지, 인스턴스 분할, 방향 기반 바운딩 박스(OBB) 주석 달기 등의 작업을 지원합니다. 특히 Ultralytics 제공하는 사전 학습된 Ultralytics 사용자 지정으로 학습된 YOLO 포함한 Ultralytics YOLO 호환됩니다.
주석 편집기 내에서 주석 작성자는 스마트 모드로 전환한 후, 모델 선택기에서 YOLO 선택하고 ‘예측’을 클릭할 수 있습니다. 모델 선택기에는 현재 데이터셋 작업과 일치하는 YOLO 표시되므로, 생성된 주석이 호환되도록 보장됩니다.
이 모델은 이미지를 분석하고 예측 결과를 바탕으로 주석을 생성한 뒤, 이를 이미지에 직접 추가합니다. 예측 결과가 동일한 클래스의 기존 주석 결과와 겹치는 경우, 중복 감지 영역이 설정된 임계값을 초과하면 해당 부분은 자동으로 제외되어, 깔끔하고 일관된 라벨을 유지하는 데 도움이 됩니다.

예측 결과가 생성되면, ‘휴먼-인-더-루프(human-in-the-loop)’ 방식의 주석 담당자가 필요에 따라 이를 검토, 수정 또는 삭제할 수 있습니다. 이를 통해 모든 데이터를 수동으로 주석 처리하는 대신, 모델이 생성한 주석부터 시작하여 이를 다듬어 나감으로써 대규모 데이터셋에 대한 라벨링을 더 쉽게, 더 빠르게 수행할 수 있습니다.
시간이 지남에 따라 개선된 YOLO 재사용하여 더 정확한 예측 결과를 도출함으로써, 반복적인 자동 라벨링 워크플로를 지원할 수 있습니다.
다음으로, Ultralytics 실제 사용 사례 전반에 걸쳐 데이터 주석 작업을 어떻게 지원하는지 예시를 통해 살펴보겠습니다.
컴퓨터 비전 모델이 통합된 자율주행 차량은 주변 환경을 실시간으로 파악하기 위해 정확하게 라벨링된 시각 데이터에 의존합니다. 이러한 데이터로 학습된 모델은 segment , 보행자, 교통 표지판 및 도로 경계를 detect segment 수 있습니다.
분할 작업에는 픽셀 단위의 정밀한 경계 설정이 필요하기 때문에, 라벨링 작업은 매우 중요하면서도 시간이 많이 소요됩니다. 특히 복잡한 주행 환경에서 대량의 센서 데이터에 수동으로 라벨을 붙이는 작업은 금세 병목 현상이 될 수 있습니다.
Ultralytics SAM YOLO 모두 활용하는 AI 지원 주석 기능을 통해 이 과정을 간소화합니다. SAM 스마트 주석 기능은 정밀한 마스크를 사용하여 클릭 한 번으로 빠르게 분할할 수 있게 해주며, YOLO 활용하면 여러 이미지에 걸쳐 주석을 자동으로 생성할 수 있습니다.
이러한 접근법들을 종합하면, 물체가 겹쳐 있는 복잡한 장면을 더 쉽게 처리할 수 있습니다.
라벨링 작업은 모델 훈련과 직접적으로 연결되어 있으므로, 업데이트된 대규모 데이터셋을 즉시 활용해 모델을 재훈련하고 평가할 수 있습니다. 이를 통해 팀은 성능을 지속적으로 개선하고 새로운 주행 환경에 더 효율적으로 적응할 수 있습니다.
제조업에서 일관된 품질 관리를 유지하려면 생산 과정에서 결함을 정확하게 탐지해야 합니다. 컴퓨터 비전 모델은 문제를 실시간으로 식별하는 데 자주 사용되지만, 그 성능은 훈련 데이터가 실제 생산 환경을 얼마나 잘 반영하느냐에 달려 있습니다.
원자재, 기계 설정 또는 조명과 같은 제조 환경의 변화는 원래 훈련 데이터에 포함되지 않았던 새롭고 드문 결함 유형을 유발할 수 있습니다. 이로 인해 모델이 학습한 내용과 생산 라인에서 실제로 나타나는 현상 사이에 차이가 발생합니다.
데이터 세트의 정확성을 유지하려면 고품질의 내부 주석 정보를 바탕으로 정기적으로 업데이트해야 합니다. Ultralytics 사용하면 새로운 결함 패턴이 나타날 때마다 주석을 쉽게 업데이트하고 데이터 세트를 확장할 수 있습니다. 이렇게 업데이트된 데이터 세트를 활용해 모델을 재훈련하면, 팀이 변화하는 생산 환경에 더 신속하게 대응할 수 있습니다.
건설 현장은 여러 팀이 활동하고 장비가 이동하며 배치도가 끊임없이 바뀌는 역동적인 환경입니다. 이러한 환경에서 안전을 유지하려면 명확하고 상세한 설명이 첨부된 시각적 데이터가 필수적입니다.
정확한 라벨링은 데이터 품질을 향상시킬 뿐만 아니라, 혼잡한 현장, 변화하는 배경, 다양한 조명 조건 등 다양한 현장 환경에서 AI 시스템이 작업자, 장비, 안전 장비 및 잠재적 위험 요소를 식별하는 데 도움을 줍니다.
Ultralytics 현장 상황이 변화함에 따라 주석을 쉽게 업데이트하고 수정할 수 있도록 지원합니다. 새로운 이미지가 생성되면 즉시 캡처하여 데이터셋에 추가함으로써, 데이터셋이 실제 상황과 일치하도록 유지할 수 있습니다.
신뢰할 수 있는 컴퓨터 비전 및 AI 모델을 구축하려면 고품질의 라벨링이 필수적이지만, 기존의 워크플로는 종종 팀의 작업 속도를 저해합니다. Ultralytics 자동화된 라벨링 도구와 확장 가능한 워크플로를 통해 이 과정을 간소화합니다. 그 결과, 팀은 정확성과 일관성을 유지하면서도 데이터를 모델로 전환하는 과정을 더욱 신속하게 진행할 수 있습니다.
컴퓨터 비전에 대해 더 자세히 알아보시려면, 점점 성장하고 있는 저희 커뮤니티와 GitHub 저장소를 확인해 보세요. 비전 솔루션을 구축하고자 하신다면, 저희의 라이선스 옵션을 살펴보시기 바랍니다. 제조 분야에서의 컴퓨터 비전과 의료 분야에서의 AI가 제공하는 이점에 대해 더 자세히 알아보시려면 솔루션 페이지를 확인해 보세요.
미래의 머신러닝 여정을 시작하세요