Instance Segmentation
인스턴스 세그멘테이션이 픽셀 수준의 객체 탐지를 가능하게 하는 방법을 알아보십시오. Ultralytics YOLO26을 사용하여 고속 실시간 마스크 생성 등을 수행하는 방법을 확인하십시오.
인스턴스 세그멘테이션은 컴퓨터 비전(CV) 분야의 정교한 기술로, 이미지 내의 각 관심 객체를 픽셀 단위로 식별하고 윤곽을 구분합니다. 표준 객체 탐지가 직사각형의 바운딩 박스(BBox)를 사용하여 항목의 위치를 지정하는 반면, 인스턴스 세그멘테이션은 탐지된 모든 개체에 대해 정확한 마스크를 생성함으로써 분석을 한층 더 심화합니다. 이러한 기능 덕분에 인공지능(AI) 모델은 겹쳐진 두 사람을 구분하는 것처럼 동일한 클래스의 개별 객체를 구별할 수 있으며, 단순한 분류 방식보다 시각적 장면을 훨씬 풍부하고 상세하게 이해할 수 있게 합니다.
Link to this section세그멘테이션 유형 구별#
인스턴스 세그멘테이션의 유용성을 충분히 파악하려면, 이를 다른 관련 이미지 처리 작업들과 차별화하는 것이 도움이 됩니다. 각 방법은 애플리케이션 요구 사항에 따라 서로 다른 수준의 세분성을 제공합니다.
- 시맨틱 세그멘테이션: 이 접근 방식은 이미지의 모든 픽셀을 범주(예: "도로", "하늘", "자동차")로 분류합니다. 하지만 동일한 범주 내의 개별 객체는 구분하지 않습니다. 만약 세 대의 자동차가 나란히 주차되어 있다면, 시맨틱 세그멘테이션은 이들을 하나의 "자동차" 영역으로 간주합니다.
- 인스턴스 세그멘테이션: 이 방법은 각 객체를 고유한 개체로 취급합니다. 개별 인스턴스를 탐지하고 각각의 픽셀에 고유한 레이블을 할당합니다. 주차된 자동차 예시의 경우, 인스턴스 세그멘테이션은 세 개의 별도 마스크를 생성하여 "자동차 A", "자동차 B", "자동차 C"를 개별적으로 식별합니다.
- 파놉틱 세그멘테이션: 시맨틱 세그멘테이션의 배경 레이블링과 인스턴스 세그멘테이션의 개별 객체 식별 기능을 결합한 하이브리드 접근 방식입니다.
Link to this section픽셀 단위 분석의 메커니즘#
현대의 인스턴스 세그멘테이션 모델은 일반적으로 고급 딥러닝(DL) 아키텍처, 특히 합성곱 신경망(CNN)에 의존합니다. 이러한 네트워크는 이미지에서 특징을 추출하여 객체의 클래스와 공간적 윤곽을 모두 예측합니다. 역사적으로 Mask R-CNN과 같은 2단계 아키텍처가 표준이었으며, 먼저 관심 영역을 제안한 뒤 마스크로 정교화하는 방식을 사용했습니다.
하지만 최근의 발전으로 YOLO26과 같이 탐지와 세그멘테이션을 동시에 수행하는 1단계 탐지기가 등장했습니다. 이러한 "엔드 투 엔드" 접근 방식은 실시간 추론 속도를 크게 향상시켜, 소비자용 하드웨어에서도 라이브 비디오 스트림에 고정밀 세그멘테이션을 적용할 수 있게 되었습니다.
Link to this section실제 애플리케이션 사례#
인스턴스 세그멘테이션이 제공하는 정밀한 경계 정보는 의사결정을 위해 객체의 정확한 형태와 위치를 파악해야 하는 산업 분야에서 매우 중요합니다.
- 의료 분야의 AI: 의료 진단에서는 종양이나 병변의 정확한 크기와 모양을 파악하는 것이 필수적입니다. 인스턴스 세그멘테이션을 사용하면 MRI 스캔 영상에서 이상 부위를 높은 정밀도로 윤곽 처리할 수 있어, 방사선 전문의의 치료 계획 수립과 질병 진행 상황 모니터링을 지원합니다.
- 자율 주행 자동차: 자율 주행 자동차는 복잡한 환경을 탐색하기 위해 세그멘테이션에 의존합니다. Cityscapes와 같은 데이터셋을 활용하여 차량은 주행 가능한 표면을 식별하고, 차선 표시를 인식하며, 혼잡한 횡단보도에서 개별 보행자를 분리하여 안전을 확보할 수 있습니다.
- 농업 분야의 AI: 정밀 농업에서는 세그멘테이션을 사용하여 작물의 건강 상태를 모니터링합니다. 비전 시스템을 갖춘 로봇은 자동 수확을 위해 개별 과일을 식별하거나, 특정 잡초를 탐지하여 제초제를 정밀 살포함으로써 화학 물질 사용을 줄이고 수확량을 최적화할 수 있습니다.
Link to this sectionPython을 활용한 세그멘테이션 구현#
개발자는 ultralytics 라이브러리를 사용하여 인스턴스 세그멘테이션을 쉽게 구현할 수 있습니다. 다음 예제는 사전 학습된 YOLO26 모델을 로드하고 이미지에 대한 세그멘테이션 마스크를 생성하는 방법을 보여줍니다.
from ultralytics import YOLO
# Load a pre-trained YOLO26 instance segmentation model
# The 'n' suffix denotes the nano version, optimized for speed
model = YOLO("yolo26n-seg.pt")
# Run inference on an image
# This predicts classes, bounding boxes, and masks
results = model("https://ultralytics.com/images/bus.jpg")
# Visualize the results
# Displays the image with overlaid segmentation masks
results[0].show()Link to this section과제 및 모델 학습#
인스턴스 세그멘테이션은 강력한 성능을 제공하지만, 단순한 바운딩 박스 탐지에 비해 계산 집약적입니다. 픽셀 단위의 완벽한 마스크를 생성하려면 상당한 GPU 자원과 정밀한 데이터 어노테이션이 필요합니다. 이러한 작업을 위한 데이터 어노테이션에는 모든 객체 주위에 촘촘한 다각형을 그려야 하므로 많은 시간이 소요될 수 있습니다.
To streamline this process, teams often use tools like the Ultralytics Platform, which offers features for dataset management, auto-annotation, and cloud-based training. This allows developers to fine-tune models on custom data—such as specific industrial parts or biological specimens—and deploy them efficiently to edge AI devices using optimized formats like ONNX or TensorRT.






