Yolo 비전 선전
선전
지금 참여하기
용어집

합성곱 신경망(CNN)

합성곱 신경망(CNN)이 의료, 자율 주행 자동차 등에서 AI를 강화하여 컴퓨터 비전을 어떻게 혁신하는지 알아보세요.

컨볼루션 신경망(CNN)은 특수한 종류의 딥 러닝(DL) 아키텍처의 디지털 이미지와 같은 격자형 토폴로지를 가진 데이터를 처리하도록 설계되었습니다. 동물 시각 피질의 생물학적 구조에서 영감을 받은 동물 시각 피질의 생물학적 구조에서 영감을 얻은 CNN은 특징의 공간적 계층 구조를 자동으로 학습합니다. 입력 데이터를 단순한 숫자 목록으로 취급하는 기존의 신경망과 달리 평면적인 숫자 목록으로 취급하는 기존 신경망과 달리, CNN은 픽셀 간의 공간적 관계를 보존하기 때문에 최신 기술의 기반이 되는 가장 최신의 컴퓨터 비전(CV) 애플리케이션의 기반 기술입니다. 이로써 입력을 효율적으로 필터링하여 의미 있는 패턴을 추출함으로써 이러한 네트워크는 스마트폰의 얼굴 인식에서 얼굴 인식부터 의료 이미지 분석의 의료 이미지 분석.

컨볼루션 신경망의 작동 원리

CNN의 효과는 이미지를 처리하기 쉬운 형태로 축소하는 능력에 있습니다. 손실 없이 처리하기 쉬운 형태로 축소하는 능력에 있습니다. 이는 일련의 전문화된 레이어를 통해 이루어집니다:

  1. 컨볼루션 레이어: 핵심 구성 요소입니다. 이 레이어는 학습 가능한 필터 세트를 사용합니다. 입력 이미지 위로 미끄러지는 커널이라고 하는 학습 가능한 필터 세트를 사용합니다. 컨볼루션이라고 알려진 이 수학적 프로세스는 컨볼루션으로 알려진 이 수학적 프로세스는 특정 패턴을 강조하는 특징 맵을 생성합니다. 특징 맵을 생성합니다. 이 과정을 시각화할 수 있는 대화형 CNN 설명을 통해 필터가 어떻게 시각적 데이터를 추출하는지 시각화할 수 있습니다.
  2. 활성화 함수: 컨볼루션 후 비선형 함수가 피처 맵에 적용됩니다. 가장 일반적인 가장 일반적인 선택은 ReLU(정류 선형 단위)로, 음수 픽셀 값을 0으로 대체하는 음수 픽셀 값을 0으로 대체합니다. 이렇게 하면 비선형성을 도입하여 네트워크가 단순한 선형 조합이 아닌 복잡한 관계를 학습할 수 있습니다.
  3. 풀링 레이어: 다운샘플링이라고도 하는 이 레이어는 기능의 차원을 줄입니다. 맵의 차원을 줄입니다. 최대 풀링과 같은 기술은 지역에서 가장 눈에 띄는 피처를 선택하여 피처를 선택하여 계산 부하를 줄이고 과적합을 방지하여 모델의 일반화를 돕습니다. 과적합.
  4. 완전히 연결된 레이어: 마지막 단계에서는 높은 수준의 특징이 평평하게 처리되어 표준 신경망(NN)에 공급됩니다. 이 레이어 은 이전 레이어에서 추출한 특징을 기반으로 최종 분류 또는 회귀 작업을 수행합니다.

중요성 및 실제 적용 사례

CNN은 수동으로 특징을 추출할 필요가 없어짐으로써 인공 지능 분야에 혁신을 가져왔습니다. 학습 데이터에서 직접 고유한 특징을 학습하는 능력 덕분에 학습 데이터로부터 직접 특징을 학습할 수 있는 능력으로 인해 다양한 산업 분야에서

  • 자율 시스템을 위한 객체 감지: 자동차 산업에서 CNN은 자율주행 자동차가 주변 환경을 인식하고 자율 주행 자동차가 주변 환경을 인식하는 데 환경을 인식하는 데 매우 중요합니다. 다음과 같은 모델 YOLO11 와 같은 모델은 CNN 기반 백본을 활용하여 보행자, 교통 표지판 및 기타 차량을 차량을 실시간으로 높은 정확도로 감지합니다.
  • 의료 진단: CNN은 의료 스캔에서 이상 징후를 식별하여 방사선과 의사를 지원합니다. 예를 들어 예를 들어, 딥러닝 모델은 엑스레이나 MRI 스캔을 분석하여 사람이 직접 검사하는 것보다 빠르게 종양이나 골절을 detect 수 있습니다. 검사하는 것보다 더 빠르게 발견할 수 있습니다. 연구 사례 미국 국립보건원(NIH) 의 연구는 이러한 자동화된 도구가 진단의 일관성을 크게 향상시키는 방법을 보여줍니다.
  • 소매 및 재고 관리: 자동 결제 시스템 및 스마트 재고 관리 CNN을 사용하여 진열대에 있는 제품을 인식하고, 재고 수준을 track , 손실을 방지하여 주요 소매업체의 주요 소매업체

CNN과 관련 개념의 차별화

일반적인 AI 용어와 혼용되어 사용되는 경우가 많지만, CNN은 다른 용어와 비교하여 뚜렷한 특징이 있습니다. 아키텍처에 비해 뚜렷한 특징이 있습니다:

  • CNN과 표준 신경망 비교: 기존의 완전 연결 신경망은 모든 입력 뉴런과 모든 출력 뉴런을 뉴런을 모든 출력 뉴런에 연결합니다. 이를 이미지에 적용하면 엄청난 수의 매개변수가 필요하고 공간 구조가 손실됩니다. 이와 달리 CNN은 매개변수 공유 (전체 이미지에 동일한 필터 사용)를 사용하기 때문에 매우 효율적입니다. 이미지 전체에 동일한 필터 사용)를 사용하기 때문에 시각적 데이터에 매우 효율적입니다.
  • CNN과 비전 트랜스포머(ViT) 비교: CNN은 컨볼루션을 통해 로컬 특징에 초점을 맞춥니다, 비전 트랜스포머(ViT)는 이미지를 처리합니다. 이미지를 일련의 패치로 처리합니다. 자체 주의 메커니즘을 사용하여 컨텍스트를 캡처합니다. ViT는 효과적으로 학습하기 위해 더 큰 데이터 세트가 필요한 경우가 많은 반면, CNN은 강력한 '귀납적' 편향성'이 강해 더 작은 데이터 세트에서도 우수한 성능을 발휘합니다. 하이브리드 모델은 종종 두 가지를 결합하는 경우가 많습니다. 아키텍처에서 볼 수 있듯이 RT-DETR.

구현 예시

최신 라이브러리를 사용하면 CNN의 강력한 기능을 손쉽게 활용할 수 있습니다. The ultralytics 패키지는 다음을 제공합니다. 빠른 추론을 위해 최적화된 CNN 백본을 갖춘 YOLO11 같은 최신 모델에 액세스할 수 있습니다.

다음 예는 사전 학습된 CNN 기반 모델을 로드하고 예측을 실행하는 방법을 보여 줍니다:

from ultralytics import YOLO

# Load a YOLO11 model, which uses a highly optimized CNN architecture
model = YOLO("yolo11n.pt")

# Run object detection on an image to identify features and objects
results = model("https://ultralytics.com/images/bus.jpg")

# Display the prediction results
results[0].show()

개발을 위한 도구 및 프레임워크

CNN 개발은 오픈 소스 도구로 구성된 강력한 에코시스템의 지원을 받습니다. 연구자와 엔지니어는 일반적으로 다음과 같은 프레임워크를 사용합니다. PyTorch 또는 TensorFlow 와 같은 프레임워크를 사용하여 처음부터 사용자 정의 아키텍처를 구축할 수 있습니다. 이러한 라이브러리 는 컨볼루션과 역전파에 필요한 저수준 tensor 연산을 제공합니다.

데이터 관리부터 배포까지 컴퓨터 비전 프로젝트의 수명 주기를 간소화하고자 하는 분들을 위해 곧 출시될 곧 출시될 Ultralytics 플랫폼은 포괄적인 솔루션을 제공합니다. 모델 트레이닝과 관련된 복잡한 워크플로우를 모델 훈련과 관련된 복잡한 워크플로를 간소화하고 팀이 비즈니스 문제 해결을 위한 인프라 관리가 아닌 비즈니스 문제 해결을 위해 CNN을 적용할 수 있습니다. 또한, 이러한 모델을 에지 디바이스에 배포하는 것은 다음과 같은 포맷을 통해 용이합니다. ONNXTensorRT와 같은 형식을 통해 프로덕션 환경에서 고성능을 보장합니다. 환경에서의 고성능을 보장합니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기