파노프틱 분할을 통해 의미론적 분할과 인스턴스 분할을 통합하는 방법을 탐구하세요. Ultralytics AI 프로젝트를 위한 정밀한 장면 이해를 어떻게 제공하는지 알아보세요.
파노프틱 분할은 의미론적 분할과 인스턴스 분할이라는 두 가지 서로 다른 형태의 이미지 분석을 통합하는 포괄적인 컴퓨터 비전(CV) 작업입니다. 기존 방법들은 이러한 작업을 별도로 처리합니다—일반적으로 "하늘"이나 "잔디"와 같은 배경 영역을 분류하거나 "자동차"나 "사람"과 같은 특정 물체를 탐지하는 식입니다. 반면 파노프틱 분할은 이를 하나의 일관된 프레임워크로 결합합니다. 이 접근법은 이미지의 모든 픽셀에 고유한 값을 할당하여, 계산 가능한 객체(‘사물’이라 함)와 형태가 불분명한 배경 영역(‘배경 요소’라 함)을 구분하는 완전한 장면 이해를 제공합니다. 모든 픽셀이 계수되고 분류되도록 함으로써, 이 기술은 분리된 탐지 방법보다 인간의 시각적 인식을 더 가깝게 모방합니다.
파노프틱 분할을 완전히 이해하려면, 이 기술이 처리하는 시각 정보의 이분법을 파악하는 것이 도움이 된다. 이 작업은 시각적 세계를 두 가지 주요 범주로 나눕니다:
이 구별은 고급 인공 지능(AI) 시스템에 있어 매우 중요하며, 특정 객체와 상호작용하면서 동시에 환경을 탐색할 수 있게 합니다.
현대적인 범시적 분할 아키텍처는 일반적으로 이미지에서 풍부한 특징 표현을 추출하기 위해 컨볼루션 신경망(CNN)이나 비전 트랜스포머(ViT)와 같은 강력한 딥러닝(DL) 백본을 활용합니다. 이 네트워크는 일반적으로 두 가지 분기 또는 "헤드"로 나뉩니다:
그런 다음 퓨전 모듈 또는 후처리 단계에서 이러한 출력 간의 충돌을 해결합니다. 예를 들어, 특정 픽셀이 "사람" 인스턴스에 속하는지 아니면 그 뒤의 "배경" 벽에 속하는지 결정하여 최종적으로 중첩되지 않는 범시적 분할 맵을 생성합니다.
파노프틱 세분화의 종합적 특성은 안전과 맥락이 최우선인 산업 분야에서 이를 필수불가결하게 만듭니다.
완전한 파노프틱 훈련은 복잡할 수 있지만, 개발자는 Ultralytics 사용하여 파노프틱 퍼즐의 핵심 구성 요소인 고정밀 인스턴스 분할을달성할 수 있습니다. 이 최첨단 모델은 실시간 성능을 제공하며 에지 배포에 최적화되어 있습니다.
다음 Python 사전 훈련된 분할 모델을 로드하고 추론을 실행하여 서로 다른 객체를 분리하는 방법을 보여줍니다:
from ultralytics import YOLO
# Load the YOLO26 segmentation model
model = YOLO("yolo26n-seg.pt")
# Run inference on an image to segment individual instances
# The model identifies 'things' and generates pixel-perfect masks
results = model("https://ultralytics.com/images/bus.jpg")
# Display the resulting image with overlaid segmentation masks
results[0].show()
훈련 데이터를 관리하고 주석 작업을 자동화하려는 팀을 위해 Ultralytics 데이터셋 관리 및 모델 훈련을 위한 도구 모음을 제공합니다. 분할 작업에는 고품질 데이터 주석이 필수적입니다. 모델이 효과적으로 학습하려면 정확한 픽셀 단위 레이블이 필요하기 때문입니다.
세분화 유형 간의 미묘한 차이를 이해하는 것은 프로젝트에 적합한 모델을 선택하는 데 매우 중요합니다:
이러한 작업에 사용되는 데이터셋 형식을 더 자세히 살펴보려면, 분할 성능 측정을 위한 표준 벤치마크인 COCO 문서를 검토할 수 있습니다.