이미지의 모든 픽셀을 분류하여 정확한 장면 이해를 돕는 시맨틱 classify 강력한 기능을 알아보세요. 지금 애플리케이션과 도구를 살펴보세요!
시맨틱 세그멘테이션은 컴퓨터 비전(CV)의 기본 기술로 컴퓨터 비전(CV)의 기본 기술로, 이미지의 모든 개별 픽셀에 특정 클래스 레이블을 할당하는 기초 기술입니다. 전체 이미지를 분류하거나 객체 주위에 경계 상자를 배치하는 단순한 작업과 달리 또는 객체 주위에 경계 상자를 배치하는 단순한 작업과 달리, 시맨틱 분할은 장면의 픽셀 단위로 완벽한 맵을 제공합니다. 이 세분화된 세부 수준 덕분에 기계는 물체의 정확한 경계와 모양을 이해하고 '도로'와 같은 "도로", "사람", "하늘" 또는 "종양"과 같은 뚜렷한 영역을 분류할 수 있습니다. 이미지를 이미지를 단순한 객체의 합이 아닌 분류된 픽셀의 모음으로 취급함으로써, 이 방법은 시각적 맥락을 포괄적으로 시각적 컨텍스트에 대한 포괄적인 이해를 제공합니다. 인공 지능(AI) 시스템 복잡한 환경과 상호 작용하는 고급 인공지능(AI) 시스템에 필수적인 시각적 맥락을 포괄적으로 이해할 수 있습니다.
시맨틱 세분화 프로세스는 특히 딥 러닝(DL) 모델, 특히 아키텍처를 기반으로 합니다. 컨볼루션 신경망(CNN). 이러한 모델은 전문가가 주석을 단 대규모 대규모 주석 데이터 세트에 대해 학습됩니다. 가 각 픽셀에 라벨을 붙인 대규모 데이터 세트에서 학습됩니다. 학습하는 동안 네트워크는 텍스처와 가장자리와 같은 낮은 수준의 특징을 높은 수준의 의미론적 개념과 높은 수준의 의미론적 개념과 연관시키는 방법을 학습합니다.
일반적인 아키텍처 패턴에는 인코더-디코더 구조가 포함됩니다:
완전 컨볼루션 네트워크(FCN) 와 같은 선구적인 아키텍처는 완전히 연결된 레이어를 컨볼루션 레이어로 대체하여 공간 지도를 출력하는 기반을 마련했습니다. 보다 전문화된 U-Net과 같은 보다 전문적인 디자인은 스킵 연결을 활용하여 세밀한 디테일을 보존하여 높은 정밀도가 요구되는 작업에 매우 효과적입니다.
프로젝트에 적합한 도구를 선택하려면 시맨틱 세분화와 다른 다른 컴퓨터 비전 작업과 구별하는 것이 중요합니다:
픽셀 수준에서 장면을 파싱하는 기능은 여러 산업 분야에서 혁신을 주도해 왔습니다:
다음과 같은 최신 프레임워크 PyTorch 와 TensorFlow 와 같은 최신 프레임워크는 세분화 모델을 구축할 수 있는 도구를 제공합니다. 하지만 하이레벨 라이브러리를 사용하면 프로세스가 크게 간소화됩니다. 라이브러리의 Ultralytics YOLO11 모델 지원 세분화 작업을 즉시 지원하며, 세분화 작업에 적합한 속도와 정확성의 균형을 제공합니다. 실시간 추론.
다음 예는 사전 학습된 YOLO11 세분화 모델을 로드하고 이미지에 대해 추론을 수행하는 방법을 보여줍니다.
이미지에 대해 ultralytics python 패키지.
from ultralytics import YOLO
# Load a pre-trained YOLO11 segmentation model
model = YOLO("yolo11n-seg.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Visualize the segmentation mask results
results[0].show()
사용자 지정 솔루션을 만들고자 하는 개발자에게는 다음과 같은 주석 도구가 유용합니다. LabelMe 또는 CVAT와 같은 주석 도구는 학습 데이터를 준비하는 데 필수적입니다. 학습이 완료되면 이러한 모델은 다음을 사용하여 엣지 디바이스에 배포할 수 있습니다. OpenCV 또는 최적화된 포맷을 사용하여 엣지 디바이스에 배포하여 프로덕션 환경에서 효율적인 성능을 발휘할 수 있습니다.