Yolo 비전 선전
선전
지금 참여하기
용어집

대화형 세분화

인터랙티브 세그멘테이션이 ‘휴먼-인-더-루프(human-in-the-loop)’ 프롬프트를 활용해 물체를 분리하는 방식을 알아보세요. Ultralytics Ultralytics 활용해 다양한 작업을 수행하는 방법을 확인해 보세요.

대화형 분할은 컴퓨터 비전 분야에서 인간 사용자가 클릭, 경계 상자, 텍스트 프롬프트와 같은 지속적 또는 일회성 입력을 제공하여 AI 모델이 이미지 내의 특정 물체를 분리하도록 안내하는, 협업 중심의 접근 방식입니다. 완전 자동화 방식과 달리, 이 '휴먼-인-더-루프(human-in-the-loop)' 기법은 사용자가 세분화해야 할 대상을 정확히 정의할 수 있게 해주므로, 모호한 시각 데이터, 중첩된 객체 또는 미지 클래스를 다룰 때 특히 유용합니다. 지난 몇 년간 파운데이셔널 모델의 도입으로 이 프로세스의 속도와 정확도가 획기적으로 향상되어, 데이터 주석 및 정밀 이미징을 위한 필수적인 도구로 자리 잡았습니다.

상호작용 기반 세분화의 작동 원리

이 워크플로의 핵심은 프롬프트 기반 개념 분할에 있으며, 여기서 모델은 사용자의 지시를 해석하여 픽셀 단위의 정밀한 마스크를 생성합니다. 사용자는 선택하고자 하는 전경 객체에 “긍정” 클릭을, 제외하고 싶은 배경 영역에 “부정” 클릭을 할 수 있습니다. Segment Anything Model(SAM) 및 그 후속 모델인 Meta SAM 같은 고급 모델들은 다양한 제스처 유형 [1], 바운딩 박스, 심지어 텍스트 설명까지 수용하여 시각적 검색의 정확도를 한층 더 높입니다. 모델은 이러한 프롬프트를 기반으로 최적의 경계를 계산하며, 사용자는 원하는 정확도가 달성될 때까지 추가 클릭을 통해 마스크를 반복적으로 다듬을 수 있습니다.

실제 애플리케이션

대화형 세분화 기술은 인간의 전문성과 AI의 효율성을 결합하여 다양한 산업 분야의 업무 흐름을 혁신하고 있습니다.

  • 의료 영상: 의료 분야 AI에서 의사와 영상의학 전문의는 상호작용형 도구를 사용하여 MRI 및 CT 영상에서 종양, 병변 또는 특정 장기를 선별합니다. 의료 영상용 공간 모델링에 대한 연구[2]에 따르면, 상호작용형 클릭 기능을 통해 의료 전문가들은 AI의 예측 결과를 신속하게 수정할 수 있어, 환자 진단에 필요한 엄격한 정확성을 보장할 수 있습니다.
  • 지리공간 및 위성 매핑: 도시 계획가와 환경 과학자들은 대화형 모델을 활용하여 GIS 특징 추출을가속화합니다 [3]. 분석가들은 복잡한 해안선, 농경지 경계 또는 새로운 인프라를 수동으로 추적하는 대신, 몇 번의 전략적인 클릭만으로 정확한 지리적 다각형을 즉시 생성할 수 있습니다.
  • 산업용 결함 탐지: 제조업 분야의 AI를 활용할 경우, 품질 관리 엔지니어들은 대화형 프롬프트를 통해 생산 라인상의 미세한 결함을 강조할 수 있으며, 모델 전체를 재훈련하지 않고도 새로운 유형의 결함에 맞춰 시스템을 동적으로 조정할 수 있습니다.

상호작용 기반 분할 대 인스턴스 분할

두 개념 모두 픽셀 단위로 물체를 구분한다는 점은 같지만, 실제 적용 목적은 서로 다릅니다. 인스턴스 분할은 일반적으로 Ultralytics 같은 모델이 사용자의 개입 없이 미리 정의된 클래스(예: “자동차”, “사람”, “개”)를 감지하고 윤곽을 그리는 완전 자동화된 프로세스입니다. 이 과정이 어떻게 작동하는지에 대한 자세한 내용은 인스턴스 분할 가이드를 참고하시기 바랍니다.

반면, 대화형 세그멘테이션은 미리 정의된 클래스에 엄격히 의존하지 않습니다. 이는 클래스에 구애받지 않는다는 뜻으로, 사용자가 지정한 대상이라면 무엇이든 세그멘테이션할 수 있어, Ultralytics 같은 도구를 사용하여 새로운 객체를 신속하게 주석 처리하고 사용자 지정 데이터셋에 추가해야 하는 능동적 학습 파이프라인에 매우 적합합니다.

Ultralytics 사용 예시

다음 방법을 사용하면 여러분의 프로젝트에 대화형 세분화를 손쉽게 구현할 수 있습니다. PyTorch 그리고 ultralytics Python . 이 예제에서는 FastSAM 경계 상자 프롬프트를 제공하여 특정 segment .

from ultralytics import FastSAM

# Load a pretrained FastSAM model
model = FastSAM("FastSAM-s.pt")

# Perform interactive segmentation using a bounding box prompt [x1, y1, x2, y2]
results = model("path/to/image.jpg", bboxes=[100, 100, 300, 300])

# Display the segmented result on screen
results[0].show()

이 코드 예제는 간단한 공간 프롬프트가 모델이 관심 영역을 정확히 추출하도록 직접 유도하는 방식을 보여줍니다. 이를 통해 최소한의 코드로 복잡한 이미지 분할 작업을 효율적으로 수행할 수 있습니다.

함께 AI의 미래를 만들어 갑시다!

미래의 머신러닝 여정을 시작하세요