컨볼루션 신경망(CNN)
컨볼루션 신경망(CNN)이 어떻게 컴퓨터 비전을 혁신하여 의료, 자율 주행 자동차 등의 분야에서 AI를 지원하는지 알아보세요.
컨볼루션 신경망(CNN)은 이미지와 같이 격자형 토폴로지를 가진 데이터를 처리하는 데 매우 효과적인 특수한 유형의 신경망(NN) 입니다. 인간의 시각 피질에서 영감을 받은 CNN은 입력 데이터에서 특징의 공간적 계층 구조를 자동으로 적응적으로 학습합니다. 따라서 대부분의 최신 컴퓨터 비전(CV) 작업의 기본 아키텍처가 되며, 이미지 분류부터 물체 감지에 이르기까지 모든 분야에서 최첨단 결과를 달성하고 있습니다.
Cnn의 업무 방식
한 계층의 모든 뉴런이 다음 계층의 모든 뉴런에 연결되는 표준 신경망과 달리 CNN은 컨볼루션이라는 특별한 수학적 연산을 사용합니다. 이를 통해 네트워크는 픽셀 간의 공간적 관계를 유지하면서 로컬 수용 영역의 특징을 학습할 수 있습니다.
일반적인 CNN 아키텍처는 몇 가지 주요 계층으로 구성됩니다:
- 컨볼루션 레이어: 필터 또는 커널이 입력 이미지 위로 슬라이드하여 특징 맵을 생성하는 핵심 빌딩 블록입니다. 이 맵은 가장자리, 모서리, 텍스처와 같은 패턴을 강조합니다. 이러한 필터의 크기와 필터가 감지하는 패턴은 모델 학습 중에 학습됩니다.
- 활성화 레이어: 각 컨볼루션 후에 ReLU와 같은 활성화 함수를 적용하여 비선형성을 도입함으로써 모델이 더 복잡한 패턴을 학습할 수 있도록 합니다.
- 풀링(다운샘플링) 레이어: 이 레이어는 특징 맵의 공간 크기(너비와 높이)를 줄여 계산 부하를 줄이고 감지된 특징이 위치 및 방향의 변화에 더 견고하게 대응할 수 있도록 도와줍니다. 이 주제에 대한 고전적인 논문은 심층 컨볼루션 신경망을 사용한 이미지넷 분류입니다.
- 완전 연결 레이어: 여러 컨볼루션 및 풀링 레이어를 거쳐 상위 수준의 특징을 평탄화하여 완전 연결 레이어로 전달하면 학습된 특징을 기반으로 분류를 수행합니다.
Cnn 대 다른 아키텍처
CNN은 딥러닝 모델의 일종이지만 다른 아키텍처와는 크게 다릅니다.
- 신경망(NN): 표준 NN은 입력 데이터를 평면 벡터로 처리하여 모든 공간 정보를 잃습니다. CNN은 이 정보를 보존하므로 이미지 분석에 이상적입니다.
- 비전 트랜스포머(ViT): 공간적 지역성에 대한 귀납적 편향이 강한 CNN과 달리, ViTs 이미지를 일련의 패치로 취급하고 자기 주의 메커니즘을 통해 글로벌 관계를 학습합니다. ViT는 학습에 더 많은 데이터가 필요한 경우가 많지만, 장거리 컨텍스트가 중요한 작업에서 탁월한 성능을 발휘할 수 있습니다. 다음과 같은 많은 최신 모델은 RT-DETR하이브리드 접근 방식을 사용하여 CNN
backbone
트랜스포머 기반 detection head
.
실제 애플리케이션
CNN은 수많은 실제 애플리케이션의 원동력입니다:
도구 및 프레임워크
강력한 도구와 프레임워크를 통해 CNN을 개발하고 배포할 수 있습니다: