Yolo 비전 선전
선전
지금 참여하기
용어집

시맨틱 분할

픽셀 단위의 이미지 이해를 위한 의미적 분할을 탐구하세요. Ultralytics 사용하여 정밀한 분할 모델을 훈련하고 배포하는 방법을 지금 바로 배우세요.

의미적 분할은 컴퓨터 비전 작업으로, 개별 픽셀마다 특정 클래스 라벨을 할당하여 이미지를 서로 다른 영역으로 나누는 것을 포함합니다. 이미지 전체에 단일 라벨을 할당하는 이미지 분류나 객체 주변에 경계 상자를 그리는 객체 탐지와 같은 단순한 작업과 달리, 의미적 분할은 장면에 대한 픽셀 단위의 이해를 제공합니다. 이러한 세분화된 분석은 객체의 정확한 형태와 경계가 그 정체성만큼 중요한 응용 분야에서 핵심적입니다. 이를 통해 기계는 인간과 유사한 방식으로 세상을 "보게" 되며, 도로, 보행자, 또는 의료 영상 내 종양을 구성하는 정확한 픽셀들을 구분할 수 있습니다.

세미틱 세그멘테이션의 작동 원리

의미적 분할의 핵심은 이미지를 분류해야 할 픽셀 격자로 간주한다는 점입니다. 딥러닝 모델, 특히 컨볼루션 신경망(CNN)이 이 작업의 표준 아키텍처입니다. 널리 사용되는 U-Net과 같은 전형적인 아키텍처는 인코더-디코더 구조를 채택합니다. 인코더는 입력 이미지를 압축하여 고수준 특징(질감, 형태 등)을 추출하고, 디코더는 이러한 특징들을 원래 이미지 해상도로 업샘플링하여 정밀한 분할 마스크를 생성합니다.

이를 달성하기 위해 모델은 대규모 주석 데이터셋으로 훈련됩니다. 이 데이터셋에서는 인간 주석자가 각 픽셀을 해당 클래스에 따라 신중하게 색칠했습니다. Ultralytics 같은 도구는 자동 주석 기능을 제공하여 고품질 기준 데이터 생성을 가속화함으로써 이 과정을 용이하게 합니다. 훈련된 모델은 모든 픽셀 값이 클래스 ID에 대응하는 마스크를 출력하며, 이는 효과적으로 이미지에 의미를 "칠하는" 역할을 합니다.

관련 개념 구분하기

의미적 분할을 다른 픽셀 수준 작업과 혼동하는 경우가 흔합니다. 차이점을 이해하는 것이 프로젝트에 적합한 접근법을 선택하는 핵심입니다:

  • 인스턴스 분할: 의미적 분할이 동일 클래스의 모든 객체를 단일 개체로 취급하는 반면(예: 모든 "자동차"는 파란색으로 채색됨), 인스턴스 분할은 개별 객체를 구분합니다(예: "자동차 A"는 파란색, "자동차 B"는 빨간색).
  • 파노프틱 분할: 이것은 두 개념을 결합합니다. 모든 픽셀에 클래스를 할당(의미론적)하면서 동시에 계수 가능한 개체의 개별 인스턴스를 분리(인스턴스)하여 가장 포괄적인 장면 이해를 제공합니다.

실제 애플리케이션

픽셀 단위의 완벽한 정확도로 시각적 데이터를 분석하는 능력은 수많은 고위험 산업 전반에 걸쳐 혁신을 주도합니다:

  • 자동차 분야의 인공지능: 자율주행 차량은 안전한 주행을 위해 세분화에 크게 의존합니다. 주행 가능 구역과 보도를 구분하고 보행자, 차량, 장애물을 정밀하게 윤곽을 그리는 방식으로 자율주행 시스템은 실시간으로 중요한 결정을 내릴 수 있습니다.
  • 의료 분야 인공지능: 의료 영상 분야에서 모델은 CT 스캔과 MRI 영상에서 segment , 병변 또는 종양을 segment . 이는 방사선과 의사가 치료 계획 수립을 위한 종양 부피 계산이나 로봇 수술 도구를 극도로 정밀하게 안내하는 데 도움을 줍니다.
  • 농업 분야 인공지능: 농부들은 항공 드론 영상과 분할 기술을 활용해 작물 건강 상태를 모니터링합니다. 픽셀을 "건강한 작물", "잡초", "토양"으로 분류함으로써 자동화 시스템은 제초제 살포를 정확히 표적화하여 화학 물질 사용량을 줄이고 수확량을 최적화합니다.

Ultralytics 활용한 세분화 구현

현대적인 세분화 모델은 정확도와 속도 사이의 균형을 유지해야 하며, 특히 실시간 추론 에지 디바이스에서. Ultralytics YOLO26 모델 패밀리에는 특수화된 세분화 모델(기호로 표시됨)이 포함됩니다. -seg (접미사)는 기본적으로 종단 간(end-to-end)으로 설계되어 기존 아키텍처(예: YOLO11.

다음 예제는 이미지를 사용하여 분할을 수행하는 방법을 보여줍니다. ultralytics Python 패키지. 이는 객체 경계를 구분하는 이진 마스크를 생성합니다.

from ultralytics import YOLO

# Load a pre-trained YOLO26 segmentation model
model = YOLO("yolo26n-seg.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Visualize the results
# This will display the image with the segmentation masks overlaid
results[0].show()

과제 및 향후 방향

상당한 진전이 있었음에도 불구하고, 의미적 분할은 여전히 계산 집약적이다. 모든 픽셀에 대한 분류를 생성하려면 상당한 GPU 필요하다. 연구자들은 효율성을 위해 이러한 모델을 최적화하는 데 적극적으로 노력하고 있으며, 모바일 폰과 임베디드 장치에서 무거운 네트워크를 실행하기 위한 모델 양자화 같은 기법을 탐구하고 있다.

또한 방대한 양의 라벨링 데이터 세트에 대한 수요가 병목 현상을 일으키고 있습니다. 이를 해결하기 위해 업계는 합성 데이터 생성 및 자기 지도 학습으로 전환하고 있으며, 이를 통해 모델은 수백만 개의 수동 픽셀 라벨 없이도 원본 이미지로부터 학습할 수 있습니다. 이러한 기술이 성숙해짐에 따라 스마트 카메라, 로봇 공학, 증강 현실 애플리케이션에서 세그멘테이션 기술이 더욱 보편화될 것으로 예상됩니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기