본 가이드를 통해 이미지 처리의 임계값 처리를 살펴보세요. 임계값 처리의 정의, Otsu의 임계값 처리를 포함한 다양한 이미지 임계값 처리 기술을 알아보세요.

본 가이드를 통해 이미지 처리의 임계값 처리를 살펴보세요. 임계값 처리의 정의, Otsu의 임계값 처리를 포함한 다양한 이미지 임계값 처리 기술을 알아보세요.
인간은 이미지를 일관성 있고 의미 있는 그림으로 보는 반면, 컴퓨터는 디지털 이미지의 가장 작은 구성 요소인 작은 픽셀의 격자로 봅니다. 이미지 처리라는 과정을 통해 이러한 픽셀을 조정하거나 분석하여 이미지 품질을 개선하고 유용한 정보를 추출할 수 있습니다.
일반적인 이미지 처리 기술 중 하나는 이미지 임계값 처리라고 합니다. 이 방법은 각 픽셀을 설정된 값과 비교하여 회색조 이미지(각 픽셀이 회색 음영을 나타냄)를 흑백 이미지로 변환합니다. 중요한 영역과 배경을 명확하게 구분합니다.
임계값 처리는 이미지 분할에 자주 사용되며, 이는 이미지를 분석하기 쉽도록 의미 있는 영역으로 분할하는 기술입니다. 일반적으로 기계가 시각적 데이터를 해석하도록 돕는 첫 번째 단계 중 하나입니다. 이 기사에서는 임계값 처리가 무엇인지, 작동 방식 및 실제 시나리오에서 적용되는 위치를 살펴봅니다. 시작해 보겠습니다!
임계값 처리가 어떻게 작동하는지 자세히 알아보기 전에, 먼저 그 이면에 있는 기본 아이디어와 이미지 처리에서 어떻게 사용되는지 자세히 살펴보겠습니다.
이미지를 처리할 때 이미지 속 객체를 배경에서 분리하고 싶다고 가정해 보겠습니다. 이를 수행하는 한 가지 방법은 임계값 처리입니다. 임계값 처리는 모든 픽셀이 완전히 검은색 또는 완전히 흰색이 되도록 이미지를 단순화합니다. 결과는 각 픽셀이 0(검은색) 또는 255(흰색) 값을 갖는 이진 이미지입니다. 이 단계는 이미지의 중요한 부분을 명확하게 두드러지게 만들기 때문에 이미지 처리에서 종종 유용합니다.
마찬가지로, 이미지 전체에서 밝기 값이 어떻게 분포되어 있는지 이해하려면 히스토그램이 도움이 될 수 있습니다. 히스토그램은 검은색(0)에서 흰색(255)까지 각 픽셀 강도가 나타나는 빈도를 보여주는 그래프입니다.
히스토그램을 보면 이미지의 밝기가 어두운지, 밝은지, 아니면 그 중간인지 알 수 있습니다. 이를 통해 이미지의 패턴과 대비 수준을 한눈에 파악할 수 있으므로 이미지를 흑백으로 전환할 때 적절한 임계값을 더 쉽게 선택할 수 있습니다.
이미지 이진화가 완료되면 이미지는 전경과 배경의 두 부분으로 나뉩니다. 일반적으로 흰색으로 표시되는 전경은 텍스트, 모양 또는 감지하려는 객체와 같은 중요한 요소를 강조합니다. 검은색으로 표시되는 배경은 나머지 모든 것입니다. 이러한 분리를 통해 머신은 이미지에서 중요한 요소에 집중할 수 있습니다.
앞서 언급했듯이 분할은 밝기나 질감과 같은 특징을 기반으로 이미지를 의미 있는 영역으로 나눕니다. 임계값 설정은 이를 수행하는 간단한 방법이며 컴퓨터 비전 파이프라인의 첫 번째 단계 중 하나인 경우가 많습니다.
컴퓨터 비전은 인간이 시각 데이터를 처리하고 해석하는 방식과 매우 유사하게 기계가 시각 데이터를 처리하고 해석할 수 있도록 하는 AI의 한 분야입니다. 프로세스 초기에 임계값 처리를 사용함으로써 컴퓨터 비전 시스템은 객체를 배경에서 분리하여 감지 또는 인식과 같은 후속 단계를 보다 정확하게 수행할 수 있도록 합니다.
이제 임계값 처리가 무엇인지 더 잘 이해했으니, 이미지 임계값 처리 방법과 이미지 처리에서 다양한 유형의 임계값 처리를 살펴보겠습니다.
예를 들어, 전역 임계값은 이진 이미지를 만드는 가장 쉬운 방법 중 하나입니다. 전체 이미지에 단일 강도 값을 적용합니다. 이 임계값보다 밝은 픽셀은 흰색으로 바뀌고 어두운 픽셀은 검은색으로 바뀝니다. 이렇게 하면 배경에서 객체를 분리하는 데 도움이 됩니다.
이미지의 조명이 고르고 대비가 강할 때 가장 효과적입니다. 그러나 조명이 고르지 않거나 대비가 낮은 영역에서는 단일 임계값이 세부 사항을 놓치거나 가장자리를 흐리게 할 수 있습니다.
이를 처리하기 위해 Otsu의 임계값 처리와 같은 방법이 사용됩니다. 값을 수동으로 설정하는 대신 Otsu의 임계값 처리 방법은 이미지의 히스토그램을 분석하고 픽셀 강도를 전경과 배경으로 가장 잘 분리하는 임계값을 선택합니다.
전역 임계값 처리와 달리 적응형 또는 로컬 임계값 처리는 이미지의 여러 부분에 대해 임계값 값을 개별적으로 계산합니다. 따라서 그림자가 있는 스캔한 문서나 질감이 있는 표면과 같이 조명이 고르지 않은 이미지에 더 효과적입니다.
이미지를 작은 영역으로 나누고 각 블록에 대한 로컬 임계값을 계산하여 전경과 배경 간의 대비를 유지하는 데 도움이 됩니다. 이 접근 방식은 조명이 이미지 전체에서 다양한 텍스트 인식, 의료 영상, 표면 검사와 같은 작업에 널리 사용됩니다.
이미지 처리에서 적응형 임계값 설정에 대한 일반적인 접근 방식으로는 적응형 평균 임계값 설정과 적응형 가우시안 임계값 설정이 있습니다. 적응형 평균 임계값 설정에서는 로컬 neighborhood의 평균 픽셀 강도가 중심 픽셀의 임계값으로 사용됩니다. 반면, 적응형 가우시안 임계값 설정은 가우시안 윈도우를 사용하여 가중 평균을 사용하며, 중심에 가까운 픽셀에 더 많은 중요도를 부여합니다.
다음으로, 이미지 임계값 처리가 실제 애플리케이션에서 어떻게 사용되는지 살펴보겠습니다.
오래된 책과 손으로 쓴 편지는 보존하거나 인쇄 또는 손으로 쓴 문자를 읽는 기술인 OCR(광학 문자 인식)을 사용하여 디지털 텍스트로 변환하기 위해 스캔되는 경우가 많습니다. 텍스트를 추출하기 전에 일반적으로 문서를 정리하거나 전처리해야 합니다. 스캔한 이미지에는 그림자, 흐릿한 잉크 또는 고르지 않은 조명이 있는 경우가 많아 문자 인식이 어려울 수 있습니다.
명확성을 높이기 위해 임계값 처리를 사용하여 회색조 이미지를 이진 형식으로 변환하여 배경에서 텍스트를 분리하는 데 도움을 줍니다. 글자와 같은 어두운 영역은 검은색이 되고 밝은 배경은 흰색으로 바뀌어 OCR 시스템이 텍스트를 훨씬 쉽게 읽을 수 있습니다.
마찬가지로, 의료 영상에서 임계값 처리는 X-레이 이미지에서 뼈나 폐와 같은 스캔에서 특정 구조를 분리하는 데 일반적으로 사용됩니다. 회색조 이미지를 이진 형식으로 변환하면 관심 영역을 주변 조직과 분리하고 추가 분석을 위해 이미지를 준비하는 것이 더 쉬워집니다. 더 복잡한 경우 다단계 임계값 처리를 적용하여 이미지를 여러 개의 뚜렷한 영역으로 나눌 수 있으므로 여러 유형의 조직 또는 구조를 동시에 식별할 수 있습니다.
이미지 처리에서 임계값 설정을 사용할 때의 주요 이점은 다음과 같습니다:
이미지 임계값은 많은 시나리오에서 유용하지만 특정 제한 사항도 있습니다. 다음은 임계값과 관련된 몇 가지 고려해야 할 과제입니다.
임계값 처리는 제어된 설정에서 간단한 분할 작업에 적합합니다. 그러나 여러 객체 또는 배경 노이즈가 있는 복잡한 이미지를 처리할 때는 어려움을 겪는 경우가 많습니다. 고정된 규칙에 의존하기 때문에 임계값 처리에는 대부분의 실제 응용 프로그램에 필요한 유연성이 부족합니다.
이러한 한계를 넘어서기 위해 많은 최첨단 시스템에서 이제 컴퓨터 비전을 사용합니다. 임계값 처리와 달리 Vision AI 모델은 복잡한 패턴과 특징을 감지하도록 학습되어 훨씬 더 정확하고 적응력이 뛰어납니다.
예를 들어, Ultralytics YOLO11과 같은 컴퓨터 비전 모델은 객체를 감지하고 이미지를 실시간으로 분할할 수 있습니다. 따라서 자율 주행 차량에서 교통 신호를 감지하거나 농업에서 작물 문제를 식별하는 것과 같은 작업에 이상적입니다.
특히 YOLO11은 이미지의 각 객체가 개별적으로 분할되는 인스턴스 분할과 같은 다양한 컴퓨터 비전 작업을 지원합니다. 또한 자세 추정(객체의 위치 또는 자세 결정) 및 객체 추적(비디오 프레임에서 객체가 움직일 때 객체 추적)을 포함한 다른 비전 기반 작업도 수행할 수 있습니다.
임계값 처리는 간단한 작업이나 초기 아이디어를 테스트하는 데는 효과적이지만, 속도, 정확성 및 유연성이 필요한 응용 프로그램은 일반적으로 컴퓨터 비전으로 더 잘 처리됩니다.
임계값 처리는 배경에서 객체를 분리하는 데 빠르고 사용하기 쉽기 때문에 이미지 처리에서 중요한 도구입니다. 스캔한 문서, 의료 이미지 및 공장에서 제품 결함을 확인하는 데 유용합니다.
그러나 이미지와 비디오가 더욱 복잡해짐에 따라 이미지 임계값 설정과 같은 기본 이미지 처리 방법은 어려움을 겪을 수 있습니다. 고급 컴퓨터 비전 모델이 개입할 수 있는 부분입니다. YOLO11과 같은 모델은 더 많은 작업을 이해하고 수행하고, 한 번에 여러 객체를 식별하고, 실시간으로 작동할 수 있어 다양한 사용 사례에 유용합니다.
AI에 대해 더 자세히 알고 싶으십니까? 커뮤니티 및 GitHub 저장소를 확인하십시오. 솔루션 페이지에서 로보틱스 분야의 AI 및 농업 분야의 컴퓨터 비전에 대해 알아보십시오. 라이선스 옵션을 살펴보고 오늘 컴퓨터 비전으로 개발을 시작하십시오!