인간은 이미지를 볼 때 자연스럽게 물체의 가장자리를 인식하고, 곡선을 따라가며, 표면의 질감을 알아챕니다. 하지만 컴퓨터의 경우 이해는 개별 픽셀 수준에서 시작됩니다.
디지털 이미지의 가장 작은 단위인 픽셀은 색상과 밝기를 한 지점에 저장합니다. 컴퓨터는 이미지 전체에서 이러한 픽셀 값의 변화를 추적하여 주요 세부 사항을 나타내는 패턴을 감지할 수 있습니다.
특히 이미지 처리에서는 픽셀 데이터를 사용하여 필수 기능을 강조하고 방해 요소를 제거합니다. 일반적인 이미지 처리 기술 중 하나는 밝기나 색상이 급격하게 변하는 지점을 식별하여 물체의 윤곽을 잡고 경계를 표시하며 구조를 추가하는 가장자리 감지입니다.
이를 통해 컴퓨터는 모양을 분리하고, 치수를 측정하고, 장면의 일부가 어떻게 연결되는지 해석할 수 있습니다. 가장자리 감지는 고급 이미지 분석의 첫 번째 단계인 경우가 많습니다.
이 글에서는 엣지 감지의 정의와 작동 방식, 실제 적용 사례에 대해 살펴봅니다. 시작해 보겠습니다!
가장자리 감지는 이미지에서 밝기나 색상이 한 지점에서 다음 지점으로 눈에 띄게 변화하는 부분을 찾는 데 중점을 둡니다. 변화가 작으면 해당 영역이 부드럽게 나타납니다. 변화가 날카로운 경우 두 개의 다른 영역 사이의 경계를 표시하는 경우가 많습니다.
다음은 이러한 픽셀 변경이 발생하는 몇 가지 이유입니다:
가장자리 감지는 일반적으로 컬러 이미지를 회색조 이미지로 변환하는 것으로 시작하므로 각 지점은 밝기만 표시합니다. 이렇게 하면 알고리즘이 색상 대신 밝고 어두운 차이에 더 쉽게 초점을 맞출 수 있습니다.
다음으로 특수 필터를 사용하면 이미지를 스캔하여 밝기가 갑자기 변하는 부분을 찾을 수 있습니다. 이러한 필터는 밝기가 얼마나 가파르게 변하는지를 계산하는데, 이를 그라데이션이라고 합니다. 그라데이션이 높을수록 가까운 지점 간의 차이가 커지며, 이는 종종 가장자리를 나타냅니다.
그런 다음 알고리즘은 이미지를 계속 다듬어 작은 디테일을 제거하고 가장 중요한 선과 모양만 유지합니다. 그 결과 추가 분석에 사용할 수 있는 선명한 윤곽선과 출력 이미지가 생성됩니다.
엣지 감지에 대해 자세히 알아보기 전에 엣지 감지가 시간이 지남에 따라 어떻게 발전했는지 살펴보겠습니다.
이미지 처리는 사진을 정리하고 개선하기 위해 임계값과 필터링과 같은 간단한 규칙 기반 방법으로 시작되었습니다. 아날로그 시대에는 광학 필터, 돋보기 또는 화학적 처리를 통해 사진이나 필름의 디테일을 살리는 작업을 의미했습니다.
대비 조정, 노이즈 감소, 이미지 강도 조정, 기본 가장자리 감지 등의 기술은 입력 이미지를 더 선명하게 만들고 모양과 질감을 강조하는 데 도움이 되었습니다. 1960년대와 70년대에 아날로그 처리에서 디지털 처리로의 전환은 천문학, 의료 영상, 위성 모니터링과 같은 분야에서 현대적인 분석의 길을 열었습니다.
1980년대와 90년대에는 컴퓨터의 속도가 빨라지면서 특징 추출, 모양 감지, 기본적인 물체 인식과 같은 더 복잡한 작업을 처리할 수 있게 되었습니다. 소벨 연산자나 캐니와 같은 알고리즘은 보다 정밀한 가장자리 감지를 제공했고, 패턴 인식은 산업 자동화부터 광학 문자 인식을 통한 인쇄 텍스트 판독까지 모든 분야에 적용되었습니다.
오늘날 기술의 꾸준한 발전은 컴퓨터 비전의 발전으로 이어졌습니다. 비전 AI 또는 컴퓨터 비전은 기계가 시각 정보를 해석하고 이해하도록 가르치는 데 중점을 둔 AI의 한 분야입니다.
이중 임계값(강한 가장자리는 유지하고 약한 가장자리는 제거하여 이미지를 선명하게 만드는 기능) 및 가장자리 감지 같은 기존의 이미지 처리는 고정된 규칙을 따르고 특정 작업만 처리할 수 있었지만, 컴퓨터 비전은 예제를 통해 학습하고 새로운 상황에 적응할 수 있는 데이터 중심 모델을 사용합니다.
오늘날 이미징 시스템은 단순히 이미지를 향상시키거나 가장자리를 감지하는 것 이상의 기능을 제공합니다. 물체를 인식하고 움직임을 추적하며 전체 장면의 맥락을 이해할 수 있습니다.
이를 가능하게 하는 핵심 기술 중 하나는 컨볼루션입니다. 컨볼루션 작업은 작은 필터(커널이라고도 함)가 이미지를 스캔하여 가장자리, 모서리, 텍스처와 같은 중요한 패턴을 찾는 프로세스입니다. 이러한 패턴은 컴퓨터 비전 모델이 물체를 인식하고 이해하는 데 사용하는 기본 구성 요소가 됩니다.
예를 들어, Ultralytics YOLO11과 같은 컴퓨터 비전 모델은 이러한 컨볼루션 기반 기능을 사용하여 인스턴스 분할과 같은 고급 작업을 수행합니다. 인스턴스 분할은 이미지에서 각 객체의 경계를 정확하게 윤곽을 그려야 하므로 이는 에지 감지와 밀접한 관련이 있습니다.
엣지 감지는 엣지 픽셀의 강도 변화를 찾아 오브젝트 엣지를 표시하는 데 중점을 두는 반면, 인스턴스 분할은 이러한 아이디어를 기반으로 엣지를 감지하고 각 오브젝트를 고유 영역으로 분류 및 분리합니다.
컴퓨터 비전의 성장에도 불구하고 이미지 처리는 여전히 많은 애플리케이션에서 중요한 부분을 차지합니다. 그 이유는 컴퓨터 비전이 기본적인 이미지 전처리 단계를 기반으로 구축되는 경우가 많기 때문입니다.
물체를 감지하거나 장면을 이해하기 전에 시스템은 일반적으로 이미지를 정리하고 노이즈를 줄이며 가장자리를 찾아 주요 디테일을 돋보이게 합니다. 이러한 단계는 고급 모델을 더욱 정확하고 효율적으로 만듭니다.
다음으로 가장자리를 감지하는 데 사용되는 가장 일반적인 이미지 처리 알고리즘과 그 작동 원리를 살펴보겠습니다.
소벨 에지 감지는 이미지에서 물체의 윤곽을 찾는 데 사용되는 핵심적인 방법입니다. 모든 디테일을 한 번에 분석하는 대신 한 픽셀에서 다음 인접 픽셀로 밝기가 급격하게 변하는 영역에 초점을 맞춥니다.
이러한 갑작스러운 변화는 일반적으로 한 물체가 끝나고 다른 물체가 시작되는 지점 또는 물체가 배경과 만나는 지점을 표시합니다. 이러한 가장자리를 분리하여 복잡한 이미지를 다른 시스템이 움직임 추적, 모양 감지 또는 물체 인식과 같은 작업을 처리하기 쉽도록 깔끔한 윤곽선으로 변환합니다.
소벨 에지 감지는 이미지의 강도가 어떻게 변하는지를 측정하는 그라데이션 감지기라고 생각하면 됩니다. 핵심은 커널이라고 하는 작은 행렬을 이미지 전체에 걸쳐 슬라이드하고 인접한 픽셀 값의 가중치 합계를 계산하는 컨볼루션 연산을 통해 작동합니다.
이 커널은 수평 및 수직 방향에 따른 밝기 변화를 강조하도록 설계되었습니다. 데이터에서 커널을 학습하는 딥러닝 모델과 달리, Sobel은 고정 커널을 사용하여 학습 없이도 가장자리를 효율적으로 강조 표시합니다.
소벨 에지 감지 방법이 어떻게 작동하는지 자세히 살펴보세요:
캐니 가장자리 감지는 이미지에서 가장자리를 찾는 또 다른 인기 있는 방법입니다. 깨끗하고 정밀한 윤곽선을 생성하는 것으로 유명합니다. 기본 가장자리 감지 기술과 달리 노이즈를 필터링하고 경계를 선명하게 하며 가장 중요한 가장자리에 초점을 맞추기 위해 신중하게 설계된 일련의 단계를 따릅니다.
다음은 캐니 엣지 감지기의 작동 방식에 대한 간략한 개요입니다:
노이즈를 걸러내면서 정확한 결과를 제공하기 때문에 캐니 에지 감지는 정밀도가 중요한 분야에서 널리 사용됩니다. 예를 들어 의료 영상, 위성 매핑, 문서 스캔, 로봇 비전과 같은 산업에서 사용됩니다.
지금까지 살펴본 에지 감지의 두 가지 예는 소벨과 캐니입니다. 둘 다 에지를 찾는 것을 목표로 하지만 문제에 접근하는 방식은 다릅니다.
그라데이션 기반 방법(예: Sobel, Prewitt, Scharr)은 그라데이션이라고 하는 밝기의 급격한 변화를 찾아서 가장자리를 감지합니다. 이미지를 스캔하여 이 변화가 가장 심한 곳을 표시합니다. 이 방법은 간단하고 빠르며 이미지가 선명할 때 잘 작동합니다. 그러나 노이즈에 민감하여 밝기의 미세한 변화가 가장자리로 오인될 수 있습니다.
가우스 기반 방법(예: 가우스의 캐니 또는 라플라시안)은 이 문제를 처리하기 위해 이미지를 먼저 흐리게 처리하는 추가 단계를 추가합니다. 가우시안 필터를 사용하여 수행되는 이 스무딩은 잘못된 가장자리를 만들 수 있는 작은 변화를 줄여줍니다. 스무딩 후에도 이러한 방법은 여전히 날카로운 밝기 변화를 찾지만 노이즈가 많거나 품질이 낮은 이미지의 경우 결과가 더 깨끗하고 정확합니다.
엣지 감지가 어떻게 작동하는지에 대한 이해를 바탕으로 실제 상황에서 엣지 감지가 어떻게 적용되는지 살펴보겠습니다.
교량이나 고층 건물과 같은 대형 콘크리트 구조물을 검사하는 것은 종종 어렵고 위험한 작업입니다. 이러한 구조물은 장거리에 걸쳐 있거나 높은 고도에 있을 수 있기 때문에 기존의 검사 방식은 느리고 비용이 많이 들며 위험합니다. 또한 이러한 검사에는 일반적으로 비계, 로프 접근, 수동 근접 측정 또는 사진 촬영이 필요합니다.
2019년에 연구원들은 고해상도 카메라가 장착된 드론을 이용해 콘크리트 표면의 상세한 입력 이미지를 캡처하는 더 안전하고 빠른 방법을 테스트하면서 흥미로운 접근 방식을 모색했습니다. 그런 다음 이러한 이미지를 다양한 가장자리 감지 기술로 처리하여 균열을 자동으로 식별했습니다.
연구 결과 이 방법을 사용하면 위험 지역에 사람이 직접 접근할 필요성이 크게 줄어들고 검사 속도가 빨라지는 것으로 나타났습니다. 그러나 정확도는 여전히 조명 조건, 이미지 선명도, 안정적인 드론 작동과 같은 요인에 따라 달라졌습니다. 어떤 경우에는 오탐을 제거하기 위해 여전히 사람의 검토가 필요했습니다.
엑스레이와 MRI에는 종종 노이즈라고 하는 시각적 장애가 포함되어 있어 미세한 디테일을 보기 어렵게 만들 수 있습니다. 이는 종양의 가장자리를 찾거나 장기의 윤곽을 추적하거나 시간에 따른 미묘한 변화를 모니터링할 때 의사에게 어려움이 됩니다.
최근의 한 의료 영상 연구에서는 Sobel, Canny, Prewitt, Laplacian과 같은 일반적인 가장자리 감지 방법이 노이즈가 있는 이미지를 얼마나 잘 처리하는지 테스트했습니다. 연구진은 이미지에 다양한 유형과 수준의 노이즈를 추가하고 각 방법이 중요한 특징을 얼마나 정확하게 윤곽을 잡아내는지 확인했습니다.
캐니는 일반적으로 노이즈가 심한 경우에도 가장 깨끗한 가장자리를 만들었지만 모든 경우에 최선은 아니었습니다. 특정 노이즈 패턴에 더 효과적인 방법도 있었기 때문에 완벽한 해결책은 하나도 없었습니다.
이는 컴퓨터 비전과 같은 기술이 중요한 이유를 잘 보여줍니다. 이러한 솔루션은 고급 알고리즘과 Vision AI 모델을 결합하여 기본적인 엣지 감지를 넘어 까다로운 조건에서도 더욱 정확하고 신뢰할 수 있는 결과를 제공할 수 있습니다.
엣지 감지 및 이미지 처리를 사용하면 얻을 수 있는 몇 가지 이점은 다음과 같습니다:
이미지 처리에서 가장자리 감지에는 많은 이점이 있지만 몇 가지 문제점도 있습니다. 다음은 고려해야 할 몇 가지 주요 제한 사항입니다:
가장자리 감지는 우리의 눈과 뇌가 세상을 이해하기 위해 함께 작동하는 방식에서 영감을 받았습니다. 인간의 시각과 관련하여 시각 피질의 특수 뉴런은 가장자리, 선, 경계에 매우 민감합니다.
이러한 시각적 단서는 한 물체의 끝과 다른 물체의 시작을 빠르게 파악하는 데 도움이 됩니다. 우리의 뇌는 모양과 물체를 식별할 때 가장자리에 크게 의존하기 때문에 단순한 선 그리기라도 즉시 알아볼 수 있습니다.
컴퓨터 비전은 이 기능을 모방하는 것을 목표로 하지만 한 단계 더 발전합니다. Ultralytics YOLO11과 같은 모델은 기본적인 가장자리 강조 및 이미지 향상 기능을 뛰어넘습니다. 물체를 감지하고 정밀하게 윤곽을 그리며 실시간으로 움직임을 추적할 수 있습니다. 이러한 심층적인 이해 수준 덕분에 에지 감지만으로는 충분하지 않은 시나리오에서 필수적입니다.
다음은 엣지 감지를 기반으로 그 이상의 기능을 제공하는 YOLO11에서 지원하는 몇 가지 주요 컴퓨터 비전 작업입니다:
컴퓨터 비전이 기존에 가장자리 감지에 의존하던 애플리케이션을 개선한 좋은 예는 인프라 및 산업 자산의 균열 감지입니다. YOLO11과 같은 컴퓨터 비전 모델은 도로, 교량, 파이프라인의 균열을 정확하게 식별하도록 학습시킬 수 있습니다. 동일한 기술을 항공기 유지보수, 건물 검사, 제조 품질 관리에도 적용할 수 있어 검사 속도를 높이고 안전을 개선하는 데 도움이 됩니다.
가장자리 감지는 초기의 간단한 방법부터 복잡한 이미지의 미묘한 경계까지 찾아낼 수 있는 고급 기법에 이르기까지 많은 발전을 거듭해 왔습니다. 중요한 디테일을 끌어내고, 주요 영역을 강조하며, 심층 분석을 위해 이미지를 준비하는 데 도움이 되므로 이미지 처리의 핵심 부분으로 자리 잡았습니다.
컴퓨터 비전에서 가장자리 감지는 모양을 정의하고, 물체를 분리하고, 유용한 정보를 추출하는 데 중요한 역할을 합니다. 의료 영상, 산업 검사, 자율 주행, 보안 등 다양한 분야에서 정확하고 신뢰할 수 있는 시각적 이해를 제공하기 위해 사용됩니다.
커뮤니티에 가입하고 GitHub 리포지토리를 살펴보고 AI에 대해 자세히 알아보세요. 자체 Vision AI 프로젝트를 시작하려는 경우 라이선스 옵션을 살펴보세요. 솔루션 페이지에서 의료 분야의 AI 및 리테일 분야의 Vision AI와 같은 애플리케이션에 대해 자세히 알아보세요.