YOLO Vision 2025를 놓치지 마세요!
2025년 9월 25일
10:00 — 18:00 BST
하이브리드 이벤트
Yolo Vision 2024

이미지 처리에서 에지 검출 이해

Abirami Vina

5분 분량

2025년 8월 25일

이미지 처리의 엣지 감지. Sobel, Canny 및 기타 엣지 감지 알고리즘을 학습하여 엣지를 정확하게 감지하고 강력한 엣지 인식을 달성하십시오.

인간은 이미지를 볼 때 자연스럽게 사물의 윤곽을 인식하고 곡선을 따라가며 표면의 질감을 알아차립니다. 하지만 컴퓨터는 개별 픽셀 수준에서 이해를 시작합니다.

디지털 이미지의 가장 작은 단위인 픽셀은 단일 지점에서 색상과 밝기를 저장합니다. 컴퓨터는 이미지 전체에서 이러한 픽셀 값의 변화를 추적하여 주요 세부 정보를 나타내는 패턴을 감지할 수 있습니다.

특히 이미지 처리는 픽셀 데이터를 사용하여 필수 기능을 강조하고 방해 요소를 제거합니다. 일반적인 이미지 처리 기술 중 하나는 객체의 윤곽을 나타내고 경계를 표시하며 구조를 추가하기 위해 밝기나 색상이 급격하게 변하는 지점을 식별하는 에지 감지입니다.

이를 통해 컴퓨터는 모양을 분리하고, 치수를 측정하며, 장면의 부분이 어떻게 연결되는지 해석할 수 있습니다. 에지 감지는 고급 이미지 분석의 첫 번째 단계인 경우가 많습니다.

그림 1. 다양한 에지 감지 방법의 결과와 함께 원본 이미지를 보여주는 예시입니다. (출처)

본 문서에서는 에지 감지가 무엇인지, 어떻게 작동하는지, 그리고 실제 응용 분야를 살펴보겠습니다. 그럼 시작해 볼까요!

엣지 감지 개념

엣지 감지는 이미지에서 밝기 또는 색상이 한 지점에서 다음 지점으로 눈에 띄게 변하는 위치를 찾는 데 중점을 둡니다. 변화가 작으면 영역이 매끄럽게 보입니다. 변화가 뚜렷하면 종종 두 개의 다른 영역 사이의 경계를 표시합니다.

이러한 픽셀 변화가 발생하는 몇 가지 이유는 다음과 같습니다:

  • 표면 노멀 불연속성: 두 표면이 벽의 모서리나 상자의 모서리처럼 특정 각도로 만날 때, 이러한 방향의 급격한 변화는 이미지에서 명확한 경계를 생성합니다.
  • 깊이 불연속성: 객체가 카메라에서 서로 다른 거리에 있을 때 나타나며, 시스템이 객체를 구별하는 데 도움이 되는 눈에 보이는 분리를 생성합니다.
  • 표면 색상 또는 질감 변화: 한 영역의 색상 또는 질감이 인접 영역과 다를 때 발생하며, 눈에 띄는 분리를 만듭니다.
  • Illumination changes(조명 변화): 표면의 그림자나 하이라이트를 포함한 조명 변화로 인해 발생하며, 표면 자체가 매끄럽거나 연속적일 때에도 눈에 띄는 분리를 만듭니다.
그림 2. 이미지에서 다양한 유형의 에지 불연속성. (출처)

엣지 검출 인식은 어떻게 작동하나요?

엣지 감지는 일반적으로 컬러 이미지를 회색조 이미지로 변환하여 시작하므로 각 지점은 밝기만 표시합니다. 이렇게 하면 알고리즘이 색상 대신 밝고 어두운 차이에 집중하기가 더 쉬워집니다.

다음으로, 특수 필터가 이미지를 스캔하여 밝기가 갑자기 변하는 위치를 찾을 수 있습니다. 이러한 필터는 밝기 변화의 경사도를 계산합니다. 경사도가 높을수록 인접한 점 간의 차이가 커지므로 엣지를 나타내는 경우가 많습니다.

그런 다음 알고리즘은 이미지에서 작은 디테일을 제거하고 가장 중요한 선과 모양만 유지하면서 이미지를 계속 개선합니다. 그 결과는 추가 분석에 사용할 수 있는 명확한 윤곽선과 출력 이미지입니다.

에지 감지 및 이미지 처리의 발전

에지 감지에 대해 더 자세히 알아보기 전에, 그것이 시간이 지남에 따라 어떻게 발전했는지 논의해 보겠습니다.

이미지 처리는 사진을 정리하고 개선하기 위해 임계값 처리 및 필터링과 같은 간단한 규칙 기반 방법으로 시작되었습니다. 아날로그 시대에는 광학 필터, 확대경 또는 화학 처리를 사용하여 사진이나 필름을 작업하여 세부 사항을 드러내는 것을 의미했습니다. 

대비 조정, 노이즈 감소, 이미지 강도 조정 및 기본 에지 감지와 같은 기술은 입력 이미지를 더 선명하게 만들고 모양과 텍스처를 강조하는 데 도움이 되었습니다. 1960년대와 70년대에 아날로그에서 디지털 처리로 전환되면서 천문학, 의료 영상 및 위성 모니터링과 같은 분야에서 현대적인 분석의 길이 열렸습니다.

1980년대와 90년대에는 컴퓨터 속도가 빨라짐에 따라 특징 추출, 모양 감지 및 기본 객체 인식과 같은 더 복잡한 작업을 처리할 수 있게 되었습니다. Sobel 연산자 및 Canny와 같은 알고리즘은 더욱 정확한 에지 감지를 제공했으며, 패턴 인식은 산업 자동화에서 광학 문자 인식을 통한 인쇄 텍스트 읽기에 이르기까지 모든 분야에서 응용 분야를 찾았습니다.

21세기 엣지 감지 및 컴퓨터 비전

오늘날 기술의 꾸준한 발전으로 컴퓨터 비전이 개발되었습니다. 비전 AI, 즉 컴퓨터 비전은 기계가 시각 정보를 해석하고 이해하도록 가르치는 데 중점을 둔 AI의 한 분야입니다. 

기존의 이미지 처리 방식(예: 이중 임계값 처리로 강한 에지는 유지하고 약한 에지는 제거하여 이미지를 더 선명하게 만듦)과 에지 감지는 고정된 규칙을 따르며 특정 작업만 처리할 수 있었던 반면, 컴퓨터 비전은 예제에서 학습하고 새로운 상황에 적응할 수 있는 데이터 기반 모델을 사용합니다. 

오늘날 이미징 시스템은 단순히 이미지를 개선하거나 가장자리를 감지하는 것을 훨씬 뛰어넘습니다. 객체를 인식하고, 움직임을 추적하며, 전체 장면의 맥락을 이해할 수 있습니다. 

이를 가능하게 하는 핵심 기술 중 하나는 컨볼루션입니다. 컨볼루션 연산은 작은 필터(커널이라고도 함)가 이미지를 스캔하여 가장자리, 모서리 및 텍스처와 같은 중요한 패턴을 찾는 프로세스입니다. 이러한 패턴은 컴퓨터 비전 모델이 객체를 인식하고 이해하는 데 사용하는 구성 요소가 됩니다.

예를 들어, Ultralytics YOLO11과 같은 컴퓨터 비전 모델은 이러한 컨볼루션 기반 특징을 사용하여 인스턴스 분할과 같은 고급 작업을 수행합니다. 인스턴스 분할은 이미지에서 각 객체의 경계를 정확하게 윤곽선으로 표시해야 하므로 에지 감지와 밀접한 관련이 있습니다. 

에지 감지는 객체 에지를 표시하기 위해 에지 픽셀의 강도 변화를 찾는 데 중점을 두는 반면, 인스턴스 분할은 에지를 감지하고, 분류하고, 각 객체를 자체 영역으로 분리하기 위해 해당 아이디어를 기반으로 합니다.

Fig 3. YOLO11 및 인스턴스 분할 사용 모습. (출처)

엣지 감지 알고리즘 및 접근 방식

컴퓨터 비전의 성장에도 불구하고 이미지 처리 기술은 여전히 많은 응용 분야에서 중요한 부분입니다. 컴퓨터 비전은 종종 기본적인 이미지 전처리 단계를 기반으로 구축되기 때문입니다. 

객체를 감지하거나 장면을 이해하기 전에 시스템은 일반적으로 이미지를 정리하고, 노이즈를 줄이고, 주요 세부 사항을 돋보이게 하기 위해 에지를 찾습니다. 이러한 단계를 통해 고급 모델의 정확도와 효율성이 향상됩니다.

다음으로, 가장 일반적인 이미지 처리 알고리즘 중 일부를 살펴보고 이러한 알고리즘이 엣지를 감지하는 데 어떻게 사용되는지 알아보겠습니다. 

Sobel 에지 감지

Sobel 에지 감지는 이미지에서 객체의 윤곽선을 찾는 데 사용되는 핵심 방법입니다. 모든 세부 사항을 한 번에 분석하는 대신 밝기가 한 픽셀에서 다음 인접 픽셀로 급격하게 변하는 영역에 초점을 맞춥니다. 

이러한 갑작스러운 변화는 일반적으로 한 객체가 끝나고 다른 객체가 시작되는 지점 또는 객체가 배경과 만나는 지점을 나타냅니다. 이러한 가장자리를 분리함으로써 Sobel은 복잡한 이미지를 움직임 추적, 모양 감지 또는 객체 인식과 같은 작업을 위해 다른 시스템이 처리하기 쉬운 더 깔끔한 윤곽선으로 변환합니다.

Sobel 에지 감지는 이미지 전체에서 강도 변화를 측정하는 기울기 감지기라고 생각할 수 있습니다. 핵심적으로 이는 컨볼루션 연산을 통해 작동합니다. 커널이라고 하는 작은 행렬을 이미지 전체에서 슬라이딩하고 인접 픽셀 값의 가중 합계를 계산합니다. 

이러한 커널은 수평 및 수직 방향을 따라 밝기 변화를 강조하도록 설계되었습니다. 데이터로부터 커널을 학습하는 딥러닝 모델과는 달리, Sobel은 고정된 커널을 사용하여 학습 없이도 효율적으로 가장자리를 강조합니다.

다음은 Sobel 에지 감지 방법의 작동 방식에 대한 자세한 내용입니다.

  • 두 개의 3×3 필터 사용: 이 방법은 필터라고 하는 두 개의 작은 3×3 그리드를 사용합니다. 가로(x 방향) 및 세로 방향(y 방향)으로 이미지 위로 미끄러지는 스텐실이라고 생각하십시오. 하나의 그리드는 가로 가장자리를 찾도록 설계되었고 다른 그리드는 세로 가장자리를 찾도록 설계되었습니다.

  • 기울기 계산(Calculating gradient): 각 필터는 밝기가 얼마나 빠르게 변하는지, 기울기 방향을 찾습니다. 큰 변화는 가능한 가장자리를 의미합니다.

  • 결과 결합: 수평 및 수직 결과를 결합하여 각 픽셀의 전체적인 에지 강도와 방향을 결정합니다.

  • 에지 감지: 높은 기울기 크기를 가진 픽셀은 강력한 에지로 표시됩니다.

  • 경계 윤곽선 표시: 이러한 가장자리는 객체 모양을 정의하고 이미지에서 서로 다른 영역을 분리하는 데 도움이 됩니다.
그림 4. Sobel 에지 검출은 입력 이미지의 주요 윤곽선을 강조 표시하고 에지 맵을 생성할 수 있습니다. (출처) 

Canny 에지 검출

Canny 에지 검출은 이미지에서 에지를 찾는 데 널리 사용되는 또 다른 방법입니다. 깔끔하고 정확한 윤곽선을 생성하는 것으로 알려져 있습니다. 기본적인 에지 검출 기술과는 달리, 노이즈를 필터링하고 경계를 선명하게 하며 가장 중요한 에지에 집중하기 위해 신중하게 설계된 일련의 단계를 따릅니다. 

다음은 Canny 에지 검출기가 작동하는 방식에 대한 간략한 개요입니다.

  • 이미지 스무딩: 이미지는 먼저 가우시안 필터로 흐리게 처리됩니다. 이는 노이즈와 가장자리로 오인될 수 있는 작은 디테일을 줄이는 스무딩 기술입니다.
  • 밝기 변화 감지: 그런 다음 알고리즘은 밝기의 급격한 변화를 검색하고, 기울기 계산을 사용하여 해당 변화의 강도와 방향을 측정합니다.

  • 가장자리 얇게 만들기: 감지된 각 선을 따라 가장 강한 점만 유지하고 약한 점은 제거하여 선명하고 깨끗한 가장자리를 만듭니다.

  • 엣지 분류: 각 픽셀은 밝기 변화의 임계값에 따라 강한 엣지, 약한 엣지 또는 엣지가 아닌 것으로 레이블이 지정됩니다.

  • 최종 정리: 강한 가장자리에 연결된 약한 가장자리는 유지되고 다른 모든 가장자리는 버려져 명확하고 연결된 경계만 남습니다.
Fig 5. Canny 에지 검출기를 사용한 후의 원본 이미지와 결과 이미지입니다. (출처)

Canny 에지 검출은 노이즈를 필터링하면서 정확한 결과를 제공하므로 정밀도가 중요한 분야에서 널리 사용됩니다. 예를 들어 의료 영상, 위성 지도 제작, 문서 스캔 및 로봇 비전과 같은 산업에서 사용됩니다.

경사 기반 에지 감지 vs. 가우시안 기반 에지 감지

지금까지 살펴본 두 가지 에지 감지 예는 Sobel과 Canny입니다. 둘 다 에지를 찾는 것을 목표로 하지만 문제에 접근하는 방식은 다릅니다.

경사 기반 방법(Sobel, Prewitt, Scharr 등)은 경사라고 하는 밝기의 급격한 변화를 찾아 에지를 감지합니다. 이미지를 스캔하고 이러한 변화가 가장 강한 위치를 표시합니다. 이러한 방법은 간단하고 빠르며 이미지가 선명할 때 잘 작동합니다. 그러나 노이즈에 민감합니다. 밝기의 미세한 변화가 에지로 오인될 수 있습니다.

가우시안 기반 방법(예: Canny 또는 Laplacian of Gaussian)은 이 문제를 처리하기 위해 추가 단계를 추가합니다. 먼저 이미지를 흐리게 처리합니다. 가우시안 필터를 사용하여 수행되는 이 스무딩은 가짜 가장자리를 만들 수 있는 작은 변화를 줄입니다. 스무딩 후에도 이러한 방법은 여전히 날카로운 밝기 변화를 찾지만, 결과는 노이즈가 많거나 품질이 낮은 이미지에 대해 더 깨끗하고 정확합니다.

그림 6. 기울기 기반 vs. 가우시안 기반 에지 감지. 이미지 출처: 작성자.

엣지 감지의 실제 응용

엣지 감지 작동 방식에 대한 더 나은 이해를 바탕으로 실제 상황에서 어떻게 적용되는지 살펴보겠습니다.

엣지 감지를 사용하여 균열 식별

교량이나 고층 건물과 같은 대형 콘크리트 구조물을 검사하는 것은 종종 어렵고 위험한 작업입니다. 이러한 구조물은 거리가 멀거나 높은 곳에 위치하여 기존 검사 방식으로는 속도가 느리고 비용이 많이 들 뿐만 아니라 위험합니다. 또한 일반적으로 비계, 로프 접근, 수동 근접 측정 또는 사진 촬영이 필요합니다.

2019년에는 연구자들이 고해상도 카메라가 장착된 드론을 사용하여 콘크리트 표면의 상세한 입력 이미지를 캡처하는 더 안전하고 빠른 방법을 테스트하여 흥미로운 접근 방식이 모색되었습니다. 그런 다음 이러한 이미지는 다양한 에지 감지 기술로 처리되어 균열을 자동으로 식별했습니다.

이 연구는 이 방법이 위험 지역에 대한 직접적인 인적 접근의 필요성을 크게 줄이고 검사 속도를 높인다는 것을 보여주었습니다. 그러나 그 정확성은 여전히 조명 조건, 이미지 선명도 및 안정적인 드론 작동과 같은 요인에 따라 달라졌습니다. 경우에 따라 오탐지를 제거하기 위해 여전히 사람의 검토가 필요했습니다.

의료 영상에서 에지 검출 적용

X선 및 MRI 사진에는 종종 노이즈라고 하는 시각적 방해 요소가 포함되어 있어 미세한 부분을 보기가 더 어려울 수 있습니다. 이로 인해 의사들이 종양의 가장자리를 찾거나, 장기의 윤곽을 추적하거나, 시간 경과에 따른 미묘한 변화를 관찰하는 데 어려움을 겪게 됩니다.

최근 의료 영상 연구에서는 Sobel, Canny, Prewitt 및 Laplacian과 같은 일반적인 에지 감지 방법이 노이즈가 있는 이미지를 얼마나 잘 처리하는지 테스트했습니다. 연구원들은 이미지에 다양한 유형과 수준의 노이즈를 추가하고 각 방법이 중요한 특징을 얼마나 정확하게 윤곽선으로 나타낼 수 있는지 확인했습니다.

Canny는 일반적으로 노이즈가 심할 때에도 가장 깔끔한 에지를 생성했지만 모든 경우에 최적은 아니었습니다. 일부 방법은 특정 노이즈 패턴에서 더 나은 성능을 보였으므로 완벽한 단일 솔루션은 없습니다.

그림 7. 노이즈가 증가함에 따라 Canny(d–f)는 Sobel(g–i)보다 더 선명한 에지를 제공합니다. (출처)

이는 컴퓨터 비전과 같은 기술이 왜 그렇게 중요한지 강조합니다. 고급 알고리즘과 Vision AI 모델을 결합함으로써 이러한 솔루션은 기본적인 에지 감지를 넘어 까다로운 조건에서도 더욱 정확하고 신뢰할 수 있는 결과를 제공할 수 있습니다.

에지 감지의 장점

에지 감지 및 이미지 처리를 사용할 때의 이점은 다음과 같습니다: 

  • 향상된 데이터 압축: 에지 감지를 통해 주요 특징만 사용하여 이미지를 표현할 수 있으므로, 필수 정보를 유지하면서 파일 크기를 줄일 수 있습니다. 이는 스토리지 및 전송 효율성을 높입니다.

  • 더욱 정확한 객체 위치 파악: 에지 감지는 객체 경계를 정확하게 식별하여 시스템이 객체를 찾고 추적하는 능력을 향상시키며, 이는 로봇 공학의 Vision AI 및 자율 주행 차량과 같은 애플리케이션에 도움이 됩니다.

  • 다중 스케일 특징 감지: 에지 감지 기술은 다양한 스케일에서 이미지를 분석하여 작은 디테일과 더 큰 모양을 모두 캡처할 수 있습니다. 이러한 유연성은 텍스처 분석에서 장면 이해에 이르기까지 다양한 작업에 유용합니다.

엣지 감지를 위한 이미지 처리 사용의 한계

이미지 처리에서 에지 감지의 많은 이점이 있지만 몇 가지 어려움도 있습니다. 고려해야 할 주요 제한 사항은 다음과 같습니다.

  • 복잡한 텍스처 관련 문제: 복잡하거나 반복되는 패턴이 있는 이미지에서 에지 감지는 종종 많은 거짓 또는 관련 없는 에지를 생성하여 추가 분석을 복잡하게 만들고 신뢰성을 떨어뜨립니다.

  • 조명에 민감함: 밝기, 그림자 및 반사의 변화로 인해 엣지 감지기가 조명의 변화를 객체 경계로 잘못 해석하여 일관성 없는 결과를 초래할 수 있습니다.

  • 객체 식별 없음: 가장자리는 객체의 시작과 끝을 강조하지만 객체가 무엇인지는 보여주지 않습니다. 감지된 가장자리에 의미 또는 라벨을 할당하려면 추가 처리가 필요합니다.

컴퓨터 비전이 에지 감지에 사용될 수 있는 경우

엣지 감지는 우리의 눈과 뇌가 협력하여 세상을 이해하는 방식에서 영감을 얻었습니다. 인간의 시각과 관련하여 시각 피질의 특수 뉴런은 엣지, 선 및 경계에 매우 민감합니다. 

이러한 시각적 단서는 물체의 끝과 다른 물체의 시작을 빠르게 판단하는 데 도움을 줍니다. 간단한 선 그림만으로도 즉시 인식이 가능한 이유도 이 때문입니다. 우리 뇌는 모양과 물체를 식별하기 위해 가장자리에 크게 의존합니다.

컴퓨터 비전은 이러한 능력을 모방하는 것을 목표로 하지만 한 단계 더 나아갑니다. Ultralytics YOLO11과 같은 모델은 기본적인 에지 강조 및 이미지 개선을 넘어섭니다. 객체를 감지하고, 정밀하게 윤곽을 그리고, 실시간으로 움직임을 추적할 수 있습니다. 이러한 더 깊은 수준의 이해는 에지 감지만으로는 충분하지 않은 시나리오에서 필수적입니다.

Ultralytics YOLOv8을 사용하여 더 정확하게 엣지 감지

다음은 YOLO11에서 지원하는 주요 컴퓨터 비전 작업으로, 에지 감지를 기반으로 이를 뛰어넘습니다.

  • 객체 감지: 이미지나 비디오에서 여러 객체를 식별하고 위치를 찾기 위해 각 객체 주위에 경계 상자를 그려 무엇이 있는지, 각 객체가 어디에 위치하는지 명확하게 보여줍니다.

  • 인스턴스 분할: 여기에는 객체를 픽셀 수준으로 분해하여 객체가 겹치거나 불규칙한 모양을 갖는 경우에도 깨끗하고 정확한 윤곽선을 생성하는 작업이 포함됩니다.

  • 자세 추정: 여기서 목표는 객체 또는 사람의 위치, 방향 또는 자세를 결정하여 움직임을 모니터링하거나 시간 경과에 따른 구조적 변화를 감지하는 데 도움을 주는 것입니다.

  • 객체 추적: 이 작업은 객체가 비디오 프레임을 통해 이동할 때 객체를 추적하여 정확한 장기 관찰을 위해 일관된 식별을 보장합니다.

  • Image classification(이미지 분류): 시각적 특징을 기반으로 객체 또는 전체 이미지에 레이블을 할당하여 대규모 데이터 세트를 보다 쉽게 구성하고 해석할 수 있습니다.

컴퓨터 비전으로 인프라의 가장자리 감지

기존에 엣지 감지에 의존하던 애플리케이션을 컴퓨터 비전으로 개선한 좋은 예는 인프라 및 산업 자산의 균열 감지입니다. YOLO11과 같은 컴퓨터 비전 모델은 도로, 교량 및 파이프라인의 균열을 정확하게 식별하도록 훈련할 수 있습니다. 동일한 기술을 항공기 유지 보수, 건물 검사 및 제조 품질 관리에도 적용하여 검사 속도를 높이고 안전성을 향상시킬 수 있습니다.

그림 8. 균열 분할에 YOLO11을 사용한 예시입니다. (출처)

주요 내용

엣지 감지는 초기의 간단한 방법에서 복잡한 이미지에서 미묘한 경계까지 감지할 수 있는 고급 기술로 발전해 왔습니다. 중요한 세부 사항을 드러내고, 주요 영역을 강조 표시하고, 더 심층적인 분석을 위해 이미지를 준비하는 데 도움이 되므로 이미지 처리의 핵심 부분입니다.

컴퓨터 비전에서 엣지 감지는 모양을 정의하고, 객체를 분리하고, 유용한 정보를 추출하는 데 중요한 역할을 합니다. 의료 영상, 산업 검사, 자율 주행 및 보안과 같은 여러 분야에서 정확하고 신뢰할 수 있는 시각적 이해를 제공하는 데 사용됩니다.

커뮤니티에 참여하고 GitHub 저장소를 탐색하여 AI에 대해 자세히 알아보세요. 자체 Vision AI 프로젝트를 시작하려는 경우 라이선스 옵션을 확인하세요. 솔루션 페이지를 방문하여 헬스케어 분야의 AI리테일 분야의 Vision AI와 같은 애플리케이션에 대해 자세히 알아보세요.

함께 미래의 AI를 만들어 갑시다!

미래의 머신러닝 여정을 시작하세요

무료로 시작하기
클립보드에 링크가 복사되었습니다.