합성곱이 컴퓨터 비전에서 AI를 어떻게 강화하여 객체 탐지, 이미지 인식, 정밀 의료 영상과 같은 작업을 가능하게 하는지 알아보세요.
컨볼루션은 최신 컴퓨터 비전 시스템의 기본 구성 요소로 사용되는 특수 수학적 연산으로 컴퓨터 비전(CV) 시스템의 기본 구성 요소입니다. 컨볼루션은 인공 지능(AI) 컨볼루션을 사용하면 모델이 이미지와 같은 격자형 데이터를 처리할 때 입력을 체계적으로 필터링하여 의미 있는 패턴을 추출합니다. 수동으로 규칙을 설정해야 하는 기존 알고리즘과 달리 컨볼루션을 사용하면 신경망이 자동으로 공간 학습 단순한 가장자리와 질감부터 복잡한 물체 모양에 이르기까지 다양한 특징의 계층 구조를 자동으로 학습할 수 있습니다. 과정을 모방할 수 있습니다.
이 작업은 입력 이미지를 가로질러 작은 숫자 행렬인 커널 또는 필터로 알려진 작은 숫자 행렬을 입력 이미지에 걸쳐 슬라이드하는 방식으로 작동합니다. 각 위치에서 커널은 겹치는 픽셀 값으로 요소 단위 곱셈을 수행하고 결과를 합산하여 단일 출력 픽셀을 생성합니다. 이 프로세스는 피처 맵을 생성합니다. 피처 맵을 생성하여 특정 패턴이 감지된 영역을 강조 표시합니다. 패턴이 감지된 영역을 강조 표시합니다.
컨볼루션의 작동 방식을 정의하는 주요 매개변수에는 다음이 포함됩니다:
컨볼루션은 다음과 같은 주요 엔진입니다. 컨볼루션 신경망(CNN)의 주요 엔진입니다. 컨볼루션의 중요성은 두 가지 주요 속성, 즉 매개변수 공유와 공간적 지역성. 여러 모델에서 동일한 모델 가중치 (커널)를 전체 이미지에 사용함으로써 네트워크는 계산 효율을 유지하며 다음과 같은 기능을 수행할 수 있습니다. 번역 불변성, 즉, 프레임의 위치에 관계없이 물체를 인식할 수 있습니다. 이러한 효율성 덕분에 다음과 같은 정교한 아키텍처를 구현할 수 있습니다. YOLO11 와 같은 정교한 아키텍처에서 실시간 추론을 수행할 수 있습니다. 강력한 GPU부터 리소스 제약이 있는 에지 AI 디바이스까지 다양한 하드웨어에서 실시간 추론을 수행할 수 있습니다.
컨볼루션의 유용성은 시각적 데이터를 활용하는 거의 모든 산업에 걸쳐 있습니다:
컨볼루션과 완전히 연결된(밀도가 높은) 레이어를 구분하는 것이 중요합니다. 완전히 연결된 레이어에서는 모든 입력 뉴런이 모든 출력 뉴런에 연결되므로 계산 비용이 많이 들고 이미지의 공간 구조를 무시합니다. 공간 구조를 무시합니다. 반대로 컨볼루션은 공간 관계를 보존하고 매개변수의 수를 대폭 줄여 매개변수의 수를 대폭 줄여 고차원 데이터에 대한 과적합을 방지합니다. 데이터에 대한 과적합을 방지합니다. 고밀도 레이어는 종종 최종 분류에 사용되지만, 컨볼루션 레이어는 다음과 같은 무거운 작업을 처리합니다. 무거운 작업을 처리합니다.
최신 오브젝트 감지기의 컨볼루션 아키텍처를 시각화할 수 있습니다.
ultralytics 패키지를 추가합니다. 다음 코드는
YOLO11 모델을 생성하고 구조를 인쇄하여
Conv2d 처리하는 데 사용되는 레이어입니다.
from ultralytics import YOLO
# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")
# Print the model architecture to observe Conv2d layers
# These layers perform the convolution operations to extract features
print(model.model)

