Interactive Segmentation

대화형 세그멘테이션이 인간 중심의 프롬프트를 사용하여 객체를 분리하는 방법을 알아보십시오. 작업을 위해 Ultralytics YOLO26 및 Ultralytics 플랫폼을 사용하는 방법을 확인하십시오.

대화형 세그멘테이션은 사용자가 클릭, BBox 또는 텍스트 프롬프트와 같은 연속적이거나 단일 샷 입력을 제공하여 AI 모델이 이미지 내 특정 객체를 분리하도록 유도하는 컴퓨터 비전 분야의 고도로 협업적인 접근 방식입니다. 완전히 자동화된 방식과 달리, 이 'Human-in-the-loop' 기술을 통해 사용자는 세그멘테이션 대상을 정확하게 정의할 수 있으며, 이는 모호한 시각적 데이터, 겹치는 객체 또는 학습되지 않은 클래스를 다룰 때 특히 유용합니다. 지난 몇 년 동안 파운데이션 모델의 도입으로 이 프로세스의 속도와 정확도가 획기적으로 향상되었으며, 데이터 어노테이션 및 정밀 이미징을 위한 핵심 도구로 자리 잡았습니다.

Link to this section대화형 세그멘테이션 작동 원리#

핵심 워크플로우는 프롬프트 기반 컨셉 세그멘테이션에 의존하며, 모델은 사용자 가이드를 해석하여 픽셀 단위의 완벽한 마스크를 생성합니다. 사용자는 선택하려는 전경 객체에 "긍정" 클릭을 수행하고, 제외하려는 배경 영역에 "부정" 클릭을 수행할 수 있습니다. Segment Anything Model (SAM) 및 그 후속 모델인 Meta SAM 3와 같은 고급 모델은 이를 더욱 발전시켜 다양한 제스처 유형 [1], BBox, 심지어 텍스트 설명까지 받아들여 시각적 검색의 기반으로 활용합니다. 모델은 이러한 프롬프트를 바탕으로 최적의 경계를 계산하며, 사용자는 원하는 정확도에 도달할 때까지 클릭을 추가하여 반복적으로 마스크를 다듬을 수 있습니다.

Link to this section실제 애플리케이션 사례#

대화형 세그멘테이션은 인간의 전문성과 AI의 효율성을 결합하여 수많은 산업 분야의 워크플로우를 혁신하고 있습니다.

의료 영상: 의료 AI 분야에서 의사와 방사선 전문의는 대화형 도구를 사용하여 MRI 및 CT 스캔에서 종양, 병변 또는 특정 장기를 분리합니다. 의료 영상을 위한 공간 모델링 [2]에 관한 연구에 따르면, 대화형 클릭을 통해 의료 전문가가 AI 예측을 빠르게 수정함으로써 환자 진단에 필요한 엄격한 정밀도를 보장할 수 있습니다.
지리 공간 및 위성 매핑: 도시 계획가와 환경 과학자는 대화형 모델을 사용하여 GIS 특징 추출 [3]을 가속화합니다. 복잡한 해안선, 농업 경계 또는 새로운 인프라를 수동으로 추적하는 대신, 분석가는 몇 번의 전략적 클릭만으로 정확한 지리적 다각형을 즉시 생성할 수 있습니다.
산업 결함 탐지: 제조업 AI 분야에서 품질 관리 엔지니어는 대화형 프롬프트를 사용하여 생산 라인의 미세한 결함을 강조 표시할 수 있으며, 전체 모델을 재학습할 필요 없이 새로운 유형의 결함에 시스템을 동적으로 적응시킬 수 있습니다.

Link to this section대화형 세그멘테이션과 인스턴스 세그멘테이션 비교#

두 개념 모두 픽셀 수준에서 객체를 분리하는 것을 포함하지만 운영 목적은 다릅니다. 인스턴스 세그멘테이션은 일반적으로 Ultralytics YOLO26과 같은 모델이 사용자 개입 없이 미리 정의된 클래스(예: "자동차", "사람", "개")를 감지하고 윤곽을 그리는 완전 자동화 프로세스입니다. 인스턴스 세그멘테이션 가이드에서 작동 방식에 대해 자세히 알아볼 수 있습니다.

Conversely, interactive segmentation does not strictly rely on predefined classes. It is class-agnostic, meaning it segments whatever the user points to, making it an excellent fit for active learning pipelines where novel objects need to be rapidly annotated and added to custom datasets using tools like the Ultralytics Platform.

Link to this sectionUltralytics를 사용한 예제#

PyTorch와 ultralytics Python 패키지를 사용하여 자신의 프로젝트에서 대화형 세그멘테이션을 쉽게 구현할 수 있습니다. 이 예제에서는 FastSAM을 사용하여 BBox 프롬프트를 제공함으로써 특정 객체를 세그멘테이션합니다.

from ultralytics import FastSAM

# Load a pretrained FastSAM model
model = FastSAM("FastSAM-s.pt")

# Perform interactive segmentation using a bounding box prompt [x1, y1, x2, y2]
results = model("path/to/image.jpg", bboxes=[100, 100, 300, 300])

# Display the segmented result on screen
results[0].show()

이 코드 조각은 단순한 공간 프롬프트가 모델을 직접 안내하여 관심 영역을 분리하는 방법을 보여주며, 최소한의 코드로 복잡한 이미지 세그멘테이션 작업을 간소화합니다.

Interactive Segmentation

Link to this section대화형 세그멘테이션 작동 원리#

Link to this section실제 애플리케이션 사례#

Link to this section대화형 세그멘테이션과 인스턴스 세그멘테이션 비교#

Link to this sectionUltralytics를 사용한 예제#

Explore solutions

로봇 공학에서의 AI

물류 분야의 AI

소매업에서의 AI

의료 분야의 AI

제조 분야의 AI

자동차 분야의 AI

농업 분야의 AI

로봇 공학에서의 AI

물류 분야의 AI

소매업에서의 AI

의료 분야의 AI

제조 분야의 AI

자동차 분야의 AI

농업 분야의 AI

로봇 공학에서의 AI

물류 분야의 AI

소매업에서의 AI

의료 분야의 AI

제조 분야의 AI

자동차 분야의 AI

농업 분야의 AI

미래의 AI를 함께 구축합시다!