개체 인스턴스 분할
인스턴스 분할이 픽셀 수준의 정밀도로 객체 감지를 개선하여 AI 애플리케이션을 위한 상세한 객체 마스크를 어떻게 가능하게 하는지 알아보세요.
개체 인스턴스 분할은 픽셀 수준에서 이미지 내의 개별 객체를 식별하고 구별하는 고급 컴퓨터 비전(CV) 작업입니다. 다른 비전 작업과 달리 이미지를 분류하거나 객체 주위에 바운딩 박스를 그리는 데 그치지 않고, 각 개별 객체 인스턴스에 대해 정확한 픽셀 단위 마스크를 생성합니다. 이 기술은 동일한 클래스의 겹치는 객체를 구별할 수 있으므로 장면을 훨씬 더 깊이 이해할 수 있도록 해줍니다.
인스턴스 분할 vs. 시맨틱 분할 및 객체 감지
인스턴스 분할을 다른 관련 컴퓨터 비전 작업과 구별하는 것이 중요합니다.
- 객체 감지: 이 작업은 일반적으로 객체 주위에 직사각형 바운딩 박스를 그리고 클래스 레이블을 할당하여 객체의 존재와 위치를 식별합니다. "이미지에 무엇이 있고 어디에 있습니까?"에 대한 답변을 제공하지만 모양 정보는 제공하지 않습니다.
- 시맨틱 분할: 이 작업은 이미지의 각 픽셀을 특정 범주로 분류합니다. 예를 들어 자동차에 속하는 모든 픽셀에 "자동차"로 레이블을 지정하지만 이미지에서 서로 다른 두 대의 자동차를 구별하지는 않습니다. "각 픽셀은 어떤 범주에 속합니까?"라는 질문에 답변합니다.
- 인스턴스 분할(Instance Segmentation): 객체 감지 및 시맨틱 분할의 기능을 결합한 것입니다. 각 객체 인스턴스를 감지하고 이에 대한 고유한 분할 마스크를 생성합니다. 자동차가 3대 있는 이미지에서 인스턴스 분할은 특정 자동차에 해당하는 3개의 개별 마스크를 출력합니다.
- 전체 영역 분할(Panoptic Segmentation): 이는 시맨틱 분할과 인스턴스 분할을 병합하는 가장 포괄적인 분할 작업입니다. 모든 픽셀에 클래스 레이블과 고유한 인스턴스 ID를 할당하여 장면에 대한 완전하고 통합된 이해를 제공합니다.
Instance Segmentation 작동 방식
일반적으로 개체 인스턴스 분할 모델은 두 가지 주요 기능을 수행합니다. 첫째, 이미지에서 모든 객체 인스턴스를 감지하고, 둘째, 감지된 각 인스턴스에 대한 분할 마스크를 생성합니다. 이 프로세스는 Faster R-CNN과 같은 객체 감지기를 확장하여 각 관심 영역에 대한 이진 마스크를 예측하는 병렬 분기를 추가하는 Mask R-CNN과 같은 아키텍처에 의해 널리 알려지게 되었습니다. 최신 모델은 더 나은 속도와 정확성을 위해 이 프로세스를 더욱 개선하여 많은 애플리케이션에서 실시간 추론을 가능하게 합니다. 개발은 종종 PyTorch 및 TensorFlow와 같은 강력한 딥 러닝 프레임워크에 의존합니다.
실제 애플리케이션
인스턴스 분할에서 제공하는 자세한 객체 윤곽선은 다양한 분야에서 유용합니다.
- 자율 주행 차량: 자율 주행 자동차는 개별 보행자, 차량 및 자전거 타는 사람의 모양과 위치를 정확하게 식별하기 위해 인스턴스 분할에 의존합니다. 이 세분화된 세부 정보는 특히 많은 객체가 겹치는 복잡한 도시 환경에서 안전한 탐색 및 경로 계획에 매우 중요합니다. Cityscapes와 같은 데이터 세트는 이 영역을 발전시키는 데 중요한 역할을 했습니다.
- 의료 영상 분석: 방사선학에서 인스턴스 분할은 CT 또는 MRI 스캔에서 종양, 병변 및 장기를 매우 정밀하게 묘사하는 데 사용됩니다. 이는 의사가 종양 크기를 측정하고, 수술을 계획하고, 치료 효과를 모니터링하는 데 도움이 됩니다. 종양 탐지를 위해 YOLO11을 사용하는 방법에 대한 블로그 게시물에서 자세한 내용을 확인할 수 있습니다.
- 로봇 공학: 로봇은 인스턴스 분할을 사용하여 환경을 이해하고, 잡을 특정 객체를 식별하고, 더 큰 정확도로 장애물을 피합니다. 이는 제조 및 물류 작업에 매우 중요합니다.
- 위성 이미지 분석: 이 기술은 숲의 개별 나무를 세거나, 도시의 건물을 매핑하거나, NASA와 같은 기관의 데이터를 사용하여 시간 경과에 따른 토지 이용의 변화를 추적하는 데 사용됩니다.
- 농업(Agriculture): 수확량 추정을 위해 개별 과일을 식별하고 계산하거나, 표적 제초제 적용을 위해 특정 잡초를 감지하는 데 사용할 수 있으며, 이는 정밀 농업(precision agriculture)의 핵심 부분입니다.
Ultralytics YOLO를 사용한 개체 인스턴스 분할
Ultralytics는 효율적인 인스턴스 분할을 수행할 수 있는 최첨단 모델을 제공합니다. YOLOv8 및 최신 YOLO11과 같은 모델은 인스턴스 분할을 포함한 다양한 비전 작업에서 높은 성능을 제공하도록 설계되었습니다. 자세한 내용은 분할 작업에 대한 설명서에서 확인할 수 있습니다. 사용자는 미세 조정을 통해 사전 훈련된 모델을 활용하거나 COCO와 같은 사용자 정의 데이터 세트에서 Ultralytics HUB 플랫폼과 같은 도구를 사용하여 머신 러닝(ML) 워크플로를 데이터 관리에서 모델 배포까지 간소화할 수 있습니다. 실제 구현을 위해 사전 훈련된 Ultralytics YOLOv8 모델을 사용한 분할에 대한 튜토리얼 또는 분할 객체 격리에 대한 가이드와 같은 리소스를 사용할 수 있습니다. Ultralytics YOLO11을 사용하여 인스턴스 분할을 수행하는 방법에 대해서도 알아볼 수 있습니다.