YOLO Vision 2025를 놓치지 마세요!
2025년 9월 25일
10:00 — 18:00 BST
하이브리드 이벤트
Yolo Vision 2024

인스턴스 세분화란 무엇일까요? 간단 가이드

Abirami Vina

6분 소요

2025년 3월 6일

인스턴스 분할이 무엇인지, 작동 방식, 다양한 컴퓨터 비전 애플리케이션에서의 사용 및 미칠 수 있는 영향에 대해 자세히 살펴보는 데 동참하세요.

컴퓨터 비전 애플리케이션은 도로 상황을 모니터링하는 교통 카메라부터 상점의 무인 계산대에 이르기까지 우리 일상생활에서 점점 더 보편화되고 있습니다. 비전 AI는 인간과 유사한 방식으로 시각 데이터를 이해할 수 있도록 지원함으로써 다양한 산업에 영향을 미치고 있습니다.

이러한 애플리케이션 중 다수는 이미지의 주요 객체 주위에 경계 상자를 배치하는 컴퓨터 비전 작업인 객체 감지에 의존합니다. 이 접근 방식은 종종 잘 작동하지만 일부 이미지 분석 솔루션은 훨씬 더 높은 정밀도가 필요합니다.

예를 들어, 의료 영상은 종양을 감지하는 것 이상을 필요로 하며, 정확한 모양을 윤곽선으로 표시하는 것이 중요합니다. 마찬가지로 로봇 공학에서 기계는 객체를 올바르게 잡기 위해 정확한 윤곽선을 인식해야 합니다. 이러한 문제를 해결하기 위해 Instance Segmentation은 보다 정확한 솔루션을 제공합니다.

개체 인스턴스 분할은 객체 감지만으로는 충분하지 않은 사용 사례를 지원하도록 설계된 컴퓨터 비전 작업으로, 픽셀 수준의 정확도를 제공합니다. Ultralytics YOLO11과 같은 컴퓨터 비전 모델을 사용하여 이미지 및 비디오에 개체 인스턴스 분할을 쉽게 적용할 수 있습니다. 

__wf_reserved_inherit
Fig 1. 인스턴스 분할을 위해 YOLO11을 사용하는 예시입니다.

이 가이드에서는 인스턴스 분할 작동 방식, 응용 분야 및 특정 분할 작업에 맞게 Ultralytics YOLO11을 사용자 정의하여 학습시키는 방법을 분석합니다.

개체 인스턴스 분할이란 무엇인가요?

예를 들어, 사람들이 서로 가까이 서 있는 단체 사진이 있다고 가정해 보겠습니다. 객체 감지는 각 사람 주위에 상자를 그리는 데 도움이 될 수 있지만 정확한 모양을 알 수는 없습니다. 

반면에 인스턴스 분할은 각 사람의 전체 윤곽선을 볼 수 있도록 각 사람 주위를 조심스럽게 추적하는 것과 유사합니다. 단순히 상자로 무언가가 있는 위치를 표시하는 대신 픽셀 수준에서 각 객체의 정확한 모양을 식별하여 복잡한 이미지를 더 쉽게 이해할 수 있습니다.

그 결과 객체의 모양을 채우고 정확히 어떤 픽셀이 객체에 속하는지 정확하게 찾아내는 상세한 마스크가 생성됩니다. 이러한 수준의 정밀도는 객체의 정확한 모양과 경계를 파악하는 것이 중요한 많은 실제 응용 분야에서 유용합니다.

__wf_reserved_inherit
Fig 2. 인스턴스 분할을 위한 YOLO11 지원을 보여줍니다.

개체 인스턴스 분할 vs 시맨틱 분할

인스턴스 분할을 탐색하는 동안 시맨틱 분할 개념을 접할 수 있습니다.

두 기술 모두 컴퓨터가 픽셀 수준에서 이미지를 이해하도록 돕지만, 서로 다른 목적을 수행합니다. 시맨틱 세분화는 모든 픽셀을 해당 범주에 따라 레이블링하여 동일한 유형의 모든 객체를 함께 그룹화합니다. 예를 들어, 여러 대의 자동차가 있는 이미지에서 시맨틱 세분화는 개별 차량을 구별하지 않고 모두 "자동차"로 표시합니다.

반면에 개체 인스턴스 분할은 각 객체를 개별적으로 식별하여 한 단계 더 나아갑니다. 개별 인스턴스에 고유한 레이블을 할당하고 모양 주위에 정확한 마스크를 만듭니다. 따라서 동일한 이미지에서 개체 인스턴스 분할은 모든 것을 "자동차"로 레이블 지정하는 것이 아니라 각 자동차를 개별적으로 인식하고 윤곽을 그립니다.

두 가지의 주요 차이점은 시맨틱 세분화가 객체를 범주별로 그룹화하는 반면, 인스턴스 세분화는 각 객체를 명확한 경계를 가진 고유한 엔터티로 구별한다는 것입니다. 어떤 작업을 사용할지 선택하는 것은 특정 애플리케이션에 따라 다릅니다. 이미지에 무엇이 있는지 아는 것으로 충분한지, 아니면 개별 객체를 구별하는 것이 중요한지에 따라 달라집니다.

__wf_reserved_inherit
Fig 3. 인스턴스 분할 대 시맨틱 분할 (각각 오른쪽 및 왼쪽).

인기 있는 인스턴스 분할 모델

오늘날 Vision AI 커뮤니티에서 사용할 수 있는 다양한 인스턴스 분할 모델이 있습니다. 어떤 모델은 더 빠르고, 어떤 모델은 더 정확하며, 어떤 모델은 사용하기 더 쉽습니다. 

이러한 옵션들은 유용하지만 특정 작업에 어떤 것을 사용해야 하는지에 대한 의문이 생길 수 있습니다. 이러한 옵션 중에서 Ultralytics YOLO 모델은 속도와 정확성에 중점을 두기 때문에 매우 인기가 있습니다. 

또한 이러한 모델은 수년에 걸쳐 크게 발전했습니다. 예를 들어 Ultralytics YOLOv5는 PyTorch와 같은 프레임워크를 사용하여 배포를 간소화하여 깊이 있는 기술 전문 지식 없이도 더 많은 사용자가 고급 Vision AI에 액세스할 수 있도록 했습니다.

이러한 성공을 바탕으로 Ultralytics YOLOv8은 인스턴스 분할, 포즈 추정, 이미지 분류와 같은 컴퓨터 비전 작업에 대한 향상된 지원을 도입했습니다. 

YOLO11은 성능을 새로운 차원으로 끌어올립니다. YOLOv8m보다 22% 적은 파라미터로 COCO 데이터 세트에서 더 높은 평균 정밀도(mAP)를 달성하여 더 적은 리소스를 사용하면서도 객체를 더 정확하게 인식할 수 있습니다.

__wf_reserved_inherit
Fig 4. YOLO11 벤치마킹.

간단히 말해서, YOLO11은 효율성을 저해하지 않으면서도 최첨단 정확도를 제공하므로 업계의 판도를 바꿀 수 있습니다.

인스턴스 분할 작동 방식 이해

다음으로, 인스턴스 분할이 일반적으로 어떻게 작동하는지 살펴보겠습니다. 이전 컴퓨터 비전 모델은 2단계 접근 방식을 사용합니다. 

먼저 객체 주위에 경계 상자를 그려 객체를 감지합니다. 그런 다음 각 객체의 정확한 모양을 나타내는 픽셀 수준 마스크를 생성합니다. 잘 알려진 예는 객체 감지 모델을 기반으로 마스크 예측 단계를 추가하여 구축된 Mask R-CNN입니다. 이 방법은 효과적이지만 이미지를 여러 단계로 처리하기 때문에 속도가 느릴 수 있어 실시간 애플리케이션이 더 어려워집니다.

한편, YOLO11과 같은 모델은 이미지를 한 번에 처리하여 객체 바운딩 박스와 인스턴스 분할 마스크를 동시에 예측합니다. 이 간소화된 접근 방식은 높은 정확도를 유지하면서 훨씬 더 빠르게 만듭니다. 결과적으로 속도와 정밀도가 모두 중요한 자율 주행, 비디오 분석 및 로봇 공학과 같은 실시간 애플리케이션에 특히 유용합니다.

인스턴스 분할을 위한 사용자 정의 훈련 YOLO11

YOLO11은 즉시 사용 가능한 사전 훈련된 모델로 제공됩니다. 이 모델은 인스턴스 분할을 위해 일상적인 객체를 다루는 COCO-Seg 데이터 세트에서 훈련되었습니다. 그러나 Ultralytics Python 패키지는 사용자 정의 훈련을 지원하며, 이는 고유한 객체를 분할해야 하는 특수 응용 분야에 필수적입니다.

모델의 사용자 정의 학습 또는 미세 조정이 중요한 이유는 무엇입니까? 사용자 정의 학습은 사전 훈련된 모델에 이미 내장된 지식을 활용하여 전이 학습을 활용합니다. 처음부터 시작하는 대신 기존 모델을 더 작은 데이터 세트와 더 적은 컴퓨팅 리소스를 사용하여 새로운 작업에 적용하면서도 높은 정확도를 유지합니다.

YOLO11을 커스텀 학습하는 방법

다음은 인스턴스 분할을 위해 YOLO11을 미세 조정하는 데 관련된 단계에 대한 자세한 내용입니다. 

  • 데이터 준비: 특정 애플리케이션을 기반으로 이미지를 수집하고 주석을 답니다. Ultralytics는 여러 이미지 데이터 세트에 대한 지원을 제공하지만 필요한 YOLO 형식으로 이미지와 주석을 준비하여 자체 데이터 세트를 사용하여 훈련할 수도 있습니다.
  • 사전 학습된 모델 사용(Using a pre-trained model): 처음부터 시작하는 대신 사전 학습된 Ultralytics YOLO11 모델을 사용하십시오. 
  • 모델 훈련: 배치 크기(반복당 처리되는 이미지), 이미지 크기(대상 입력 해상도) 및 에포크(총 훈련 주기)와 같은 중요한 훈련 설정을 조정하고 모델을 훈련합니다. 
  • 성능 평가: 모델 훈련이 완료되면 mAP와 같은 성능 지표를 사용하여 모델의 정확도를 테스트할 수 있습니다. Ultralytics Python 패키지는 모델 평가를 위한 내장 함수도 제공합니다.

YOLO11로 구현되는 개체 인스턴스 분할 애플리케이션

개체 인스턴스 분할은 기계가 사물을 더 정확하게 보고 이해하도록 지원함으로써 실제 문제를 해결하는 데 사용될 수 있습니다. 자동화 개선에서 환경 보호에 이르기까지 여러 분야에서 핵심적인 역할을 합니다. 이것이 어떤 영향을 미치는지 몇 가지 예를 살펴보겠습니다.

YOLO11을 사용한 건설 현장 안전 및 모니터링

개체 인스턴스 분할은 건설 현장에서 안전과 효율성을 보장하는 데 중요한 역할을 할 수 있습니다. 예를 들어, 중장비 모니터링에 사용될 수 있습니다. 

YOLO11은 크레인, 굴삭기, 불도저와 같은 다양한 유형의 장비를 정확하게 분할하고 식별하도록 미세 조정할 수 있으며, 해당 장비의 위치를 실시간으로 추적할 수 있습니다. 이를 통해 현장 관리자는 기계가 지정된 구역 내에서만 작동하고 작업자가 있거나 위험이 존재하는 구역을 침범하지 않도록 할 수 있습니다. 

또한 이러한 솔루션을 실시간 경고 시스템과 통합하면 신속한 시정 조치를 취할 수 있습니다. 더 나아가 수집된 통찰력은 현장 레이아웃과 워크플로를 최적화하여 위험을 줄이고 생산성을 높이는 데 도움이 될 수 있습니다.

__wf_reserved_inherit
Fig 5. YOLO11을 사용하여 중장비 모니터링.

분할 및 YOLO11을 이용한 동물 모니터링

동물 행동 모니터링은 연구원, 농부, 환경 보호론자들이 다양한 환경에서 동물을 더 잘 돌볼 수 있도록 돕습니다. 인스턴스 분할은 농장, 동물원 및 자연 서식지에서 개별 동물을 식별하고 분할하여 이러한 시스템에서 유용한 역할을 합니다. 경계 상자를 사용하는 기존 객체 감지와 달리 인스턴스 분할은 각 동물의 픽셀 수준 구분을 제공하므로 동물이 가까이 있을 때 특히 유용합니다.

자세한 분할은 움직임과 행동을 보다 정확하게 추적하는 데 도움이 됩니다. 겹치거나 밀집된 동물들을 명확하게 인식할 수 있으며, 상호 작용, 건강 평가 및 활동 패턴에 대한 보다 정확한 분석을 제공합니다. 전반적으로 동물 행동에 대한 더 깊은 통찰력은 동물 관리 및 관리 관행을 향상시킵니다.

__wf_reserved_inherit
Fig 6. 인스턴스 분할을 사용한 소 모니터링.

스포츠 분석 및 선수 추적에서의 YOLO11

정밀한 선수 및 이벤트 추적은 스포츠 분석에서 매우 중요한 부분입니다. 기존 추적 방법은 수동 태깅에 의존하여 상세한 상호 작용을 포착하지 못할 수 있습니다. 컴퓨터 비전을 사용하면 각 선수, 공, 주요 이벤트와 같은 세부 정보를 픽셀 수준으로 분할하여 상세한 통찰력을 얻을 수 있습니다.

예를 들어, Instance Segmentation은 각 선수와 객체를 명확하게 분리하여 반칙이나 공에서 벗어난 사건과 같은 이벤트를 감지하는 데 도움이 될 수 있습니다. YOLO11과 같은 모델에서 제공하는 이러한 세분화된 모니터링은 분석가에게 이동 패턴, 공간적 위치 및 상호 작용을 매우 정확하게 연구할 수 있는 더 명확한 정보를 제공합니다. 이러한 통찰력의 핵심 이점은 팀이 전략을 개선하고 전반적인 성능을 향상시키는 데 도움이 된다는 것입니다.

인스턴스 분할의 장단점

인스턴스 분할이 다양한 산업에 가져다 줄 수 있는 주요 이점은 다음과 같습니다.

  • 향상된 자동화: 품질 관리 및 안전 모니터링과 같은 작업을 자동화함으로써 인스턴스 분할은 수동 개입의 필요성을 줄이고 인적 오류를 최소화합니다.
  • 더 나은 장면 이해: 각 객체를 정확하게 윤곽선으로 표시함으로써 인스턴스 분할은 복잡한 장면을 더 깊이 이해하는 데 기여하여 더 많은 정보에 입각한 의사 결정을 지원합니다.
  • 효율적인 후처리: 픽셀 수준 출력은 배경 제거, 객체 계산 및 공간 분석과 같은 작업을 간소화하여 추가 처리 단계의 필요성을 줄입니다.

이러한 이점은 인스턴스 분할이 다양한 사용 사례에 미치는 영향을 강조하지만, 구현과 관련된 어려움을 고려하는 것도 중요합니다. 

인스턴스 분할의 주요 제한 사항은 다음과 같습니다.

  • 투명성 문제: 유리 및 물과 같은 투명하거나 반사되는 객체를 분할하기가 어려워 부정확한 경계가 발생합니다.
  • 유지 관리 오버헤드: 모델을 정확하고 관련성 있게 유지하려면 환경 조건 및 데이터 세트가 변경됨에 따라 지속적인 업데이트 및 미세 조정이 필요합니다.
  • 높은 어노테이션 노력: 인스턴스 분할 모델을 훈련하려면 자세한 픽셀 수준 어노테이션이 필요하므로 데이터 준비에 소요되는 시간과 비용이 크게 증가합니다.

주요 내용

개체 인스턴스 분할을 사용하면 겹치는 경우에도 개별 객체를 정밀하게 구별할 수 있습니다. 픽셀 수준에서 객체 경계를 캡처하여 객체 감지와 같은 기존 컴퓨터 비전 작업에 비해 시각적 데이터에 대한 더 깊은 이해를 제공합니다.

최근 컴퓨터 비전의 발전으로 인스턴스 분할이 더 빠르고 사용하기 쉬워졌습니다. 특히 Ultralytics YOLO11과 같은 컴퓨터 비전 모델은 프로세스를 단순화하여 최소한의 설정으로 실시간 분할을 가능하게 하여 다양한 산업 및 응용 분야에서 더 쉽게 액세스할 수 있도록 합니다.

AI에 대해 더 궁금하신가요? 저희 GitHub 저장소를 방문하고 저희 커뮤니티와 연결하여 계속 탐색해 보세요. 솔루션 페이지에서 자율 주행 자동차의 AI농업 분야의 비전 AI와 같은 혁신에 대해 알아보세요. 라이선스 옵션을 확인하고 컴퓨터 비전 프로젝트를 시작해 보세요!

함께 미래의 AI를 만들어 갑시다!

미래의 머신러닝 여정을 시작하세요

무료로 시작하기
클립보드에 링크가 복사되었습니다.