이 가이드를 통해 이미지 처리의 스레숄딩에 대해 알아보세요. 스레숄딩이란 무엇인지, 오츠의 스레숄딩을 포함한 다양한 이미지 스레숄딩 기법에 대해 알아보세요.

이 가이드를 통해 이미지 처리의 스레숄딩에 대해 알아보세요. 스레숄딩이란 무엇인지, 오츠의 스레숄딩을 포함한 다양한 이미지 스레숄딩 기법에 대해 알아보세요.
인간은 이미지를 일관성 있고 의미 있는 그림으로 보는 반면, 컴퓨터는 디지털 이미지의 가장 작은 구성 요소인 작은 픽셀 격자로 간주합니다. 이미지 처리라는 프로세스에서 이러한 픽셀을 조정하거나 분석하여 이미지를 개선하고 유용한 정보를 추출할 수 있습니다.
일반적인 이미지 처리 기법은 이미지 스레숄딩이라고 합니다. 이 방법은 각 픽셀을 설정된 값과 비교하여 회색조 이미지(각 픽셀이 회색 음영을 나타내는 이미지)를 흑백 이미지로 변환합니다. 이를 통해 중요한 영역과 배경을 명확하게 구분할 수 있습니다.
임계값은 이미지를 의미 있는 영역으로 분할하여 분석하기 쉽도록 하는 기술인 이미지 분할에 자주 사용됩니다. 이는 일반적으로 기계가 시각적 데이터를 해석하는 첫 번째 단계 중 하나입니다. 이 글에서는 임계값이란 무엇이고, 어떻게 작동하며, 실제 시나리오에서 어디에 적용되는지 살펴보겠습니다. 시작해 보겠습니다!
임계값이 어떻게 작동하는지 자세히 살펴보기 전에 먼저 임계값의 기본 개념과 이미지 처리에서 어떻게 사용되는지 자세히 살펴보겠습니다.
이미지로 작업할 때 이미지에 있는 개체를 배경에서 분리하고 싶다고 가정해 보겠습니다. 이를 위한 한 가지 방법은 임계값을 사용하는 것입니다. 임계값은 모든 픽셀이 완전히 검은색이거나 완전히 흰색이 되도록 이미지를 단순화합니다. 그 결과 각 픽셀의 값이 0(검정) 또는 255(흰색)인 이진 이미지가 생성됩니다. 이 단계는 이미지의 중요한 부분을 선명하게 돋보이게 하기 때문에 이미지 처리에서 종종 유용합니다.
마찬가지로 이미지 전체에 밝기 값이 어떻게 분포되어 있는지 이해하려면 히스토그램이 도움이 될 수 있습니다. 히스토그램은 검은색(0)에서 흰색(255)까지 각 픽셀 강도가 얼마나 자주 나타나는지 보여주는 그래프입니다.
히스토그램을 보면 이미지가 어두운지, 밝은지 또는 그 중간인지 확인할 수 있습니다. 이렇게 하면 패턴과 대비 수준을 한 눈에 파악할 수 있으므로 이미지를 흑백으로 변환할 때 적절한 임계값을 쉽게 선택할 수 있습니다.
이미지의 임계값이 설정되면 이미지는 전경과 배경의 두 부분으로 나뉩니다. 일반적으로 흰색으로 표시되는 전경은 텍스트, 도형 또는 감지하려는 개체와 같은 중요한 요소를 강조 표시합니다. 검은색으로 표시되는 배경은 그 외의 모든 요소입니다. 이렇게 구분하면 기계가 이미지에서 중요한 요소에 집중하는 데 도움이 됩니다.
앞서 언급했듯이 세분화는 밝기나 질감과 같은 특징에 따라 이미지를 의미 있는 영역으로 나눕니다. 임계값은 이를 수행하는 간단한 방법이며 컴퓨터 비전 파이프라인의 첫 번째 단계 중 하나입니다.
컴퓨터 비전은 기계가 인간처럼 시각적 데이터를 처리하고 해석할 수 있도록 하는 AI의 한 분야입니다. 컴퓨터 비전 시스템은 프로세스 초기에 임계값을 사용하여 객체를 배경에서 분리함으로써 감지 또는 인식과 같은 이후 단계가 더 쉽게 정확하게 작동할 수 있도록 합니다.
이제 임계값이 무엇인지 더 잘 이해했으니 이미지 임계값을 설정하는 방법과 이미지 처리의 다양한 임계값 유형에 대해 살펴보겠습니다.
예를 들어 글로벌 임계값은 이진 이미지를 만드는 가장 쉬운 방법 중 하나입니다. 전체 이미지에 단일 강도 값을 적용합니다. 이 임계값보다 밝은 픽셀은 흰색이 되고 어두운 픽셀은 검은색으로 변합니다. 이렇게 하면 피사체를 배경에서 분리하는 데 도움이 됩니다.
이미지의 조명이 균일하고 대비가 강할 때 가장 잘 작동합니다. 그러나 조명이 고르지 않거나 대비가 낮은 영역에서는 단일 임계값으로 인해 디테일을 놓치거나 가장자리가 흐려질 수 있습니다.
이를 처리하기 위해 Otsu의 스레숄딩과 같은 방법이 사용됩니다. 오츠의 임계값 설정 방법은 값을 수동으로 설정하는 대신 이미지의 히스토그램을 분석하여 픽셀 강도를 전경과 배경으로 가장 잘 구분하는 임계값을 선택합니다.
전역 임계값과 달리 적응형 또는 로컬 임계값은 이미지의 여러 부분에 대해 임계값을 개별적으로 계산합니다. 따라서 그림자가 있거나 질감이 있는 표면이 있는 스캔 문서와 같이 조명이 고르지 않은 이미지에 더 효과적입니다.
이미지를 작은 영역으로 나누고 각 블록에 대해 로컬 임계값을 계산하여 전경과 배경 사이의 대비를 유지하는 방식으로 작동합니다. 이 접근 방식은 텍스트 인식, 의료 영상, 표면 검사 등 이미지 전체에 걸쳐 조명이 달라지는 작업에 널리 사용됩니다.
이미지 처리에서 적응형 스레숄딩에 대한 몇 가지 일반적인 접근 방식에는 적응형 평균 스레숄딩과 적응형 가우시안 스레숄딩이 있습니다. 적응형 평균 임계값에서는 로컬 이웃의 평균 픽셀 강도가 중앙 픽셀의 임계값으로 사용됩니다. 반면 적응형 가우스 임계값은 가우스 윈도우와 함께 가중 평균을 사용하여 중앙에 가까운 픽셀에 더 많은 중요성을 부여합니다.
다음으로 실제 애플리케이션에서 이미지 임계값이 어디에 사용되는지 살펴보겠습니다.
오래된 책과 손글씨 편지는 보존을 위해 스캔하거나 인쇄된 문자나 손글씨를 읽어내는 기술인 OCR(광학 문자 인식)을 사용해 디지털 텍스트로 변환하는 경우가 많습니다. 텍스트를 추출하기 전에 일반적으로 문서를 정리하거나 사전 처리해야 합니다. 스캔한 이미지에는 그림자, 희미한 잉크, 고르지 않은 조명으로 인해 문자 인식이 어려운 경우가 많습니다.
선명도를 높이기 위해 임계값을 사용하여 회색조 이미지를 이진 형식으로 변환하면 배경에서 텍스트를 분리하는 데 도움이 됩니다. 글자처럼 어두운 영역은 검은색이 되고 밝은 배경은 흰색으로 바뀌어 OCR 시스템이 텍스트를 훨씬 더 쉽게 읽을 수 있습니다.
마찬가지로 의료 영상에서 임계값은 일반적으로 X-레이 이미지에서 뼈나 폐와 같은 스캔의 특정 구조를 분리하는 데 사용됩니다. 그레이 스케일 이미지를 이진 형식으로 변환하면 관심 영역을 주변 조직에서 분리하고 추가 분석을 위해 이미지를 더 쉽게 준비할 수 있습니다. 더 복잡한 경우에는 다단계 임계값을 적용하여 이미지를 여러 개의 별개의 영역으로 나누어 여러 유형의 조직이나 구조를 동시에 식별할 수 있습니다.
이미지 처리에서 임계값을 사용하면 얻을 수 있는 몇 가지 주요 이점은 다음과 같습니다:
이미지 임계값은 많은 시나리오에서 유용하지만 특정 제한 사항도 있습니다. 다음은 임계값 설정과 관련하여 고려해야 할 몇 가지 문제입니다:
임계값은 제어된 설정에서 간단한 분할 작업에는 잘 작동합니다. 그러나 여러 개체나 배경 노이즈가 있는 복잡한 이미지를 처리할 때는 종종 어려움을 겪습니다. 임계값은 고정된 규칙에 의존하기 때문에 대부분의 실제 애플리케이션에 필요한 유연성이 부족합니다.
이러한 한계를 뛰어넘기 위해 현재 많은 첨단 시스템에서는 컴퓨터 비전을 사용합니다. 임계값과 달리 비전 AI 모델은 복잡한 패턴과 특징을 감지하도록 학습되어 훨씬 더 정확하고 적응력이 뛰어납니다.
예를 들어, Ultralytics YOLO11과 같은 컴퓨터 비전 모델은 실시간으로 물체를 감지하고 이미지를 분할할 수 있습니다. 따라서 자율주행 차량의 교통 신호를 감지하거나 농업에서 작물 문제를 파악하는 등의 작업에 이상적입니다.
특히 YOLO11은 이미지의 각 객체를 개별적으로 분할하는 인스턴스 분할과 같은 다양한 컴퓨터 비전 작업을 지원합니다. 또한 포즈 추정(물체의 위치나 자세 파악) 및 물체 추적(비디오 프레임에서 움직이는 물체를 따라가는 작업) 등 다른 비전 기반 작업도 수행할 수 있습니다.
임계값은 간단한 작업이나 초기 아이디어 테스트에 적합하지만 속도, 정확성, 유연성이 필요한 애플리케이션은 일반적으로 컴퓨터 비전으로 더 잘 처리할 수 있습니다.
임계값은 배경에서 물체를 분리하는 데 빠르고 쉽게 사용할 수 있기 때문에 이미지 처리에서 중요한 도구입니다. 스캔한 문서, 의료 이미지, 공장에서 제품 결함을 확인할 때 유용하게 사용할 수 있습니다.
하지만 이미지와 동영상이 복잡해지면 이미지 임계값 설정과 같은 기본적인 이미지 처리 방법으로는 어려움을 겪을 수 있습니다. 이때 고급 컴퓨터 비전 모델이 개입할 수 있습니다. YOLO11과 같은 모델은 더 많은 작업을 이해하고 수행할 수 있으며, 한 번에 많은 물체를 식별하고 실시간으로 작업할 수 있어 많은 사용 사례에 유용합니다.
AI에 대해 더 자세히 알고 싶으신가요? 커뮤니티와 GitHub 리포지토리를 확인해 보세요. 솔루션 페이지에서 로봇 공학 분야의 AI와 농업 분야의 컴퓨터 비전에 대해 알아보세요. 라이선스 옵션을 살펴보고 지금 바로 컴퓨터 비전으로 빌드를 시작하세요!