합성곱 신경망(CNN)이 의료, 자율 주행 자동차 등에서 AI를 강화하여 컴퓨터 비전을 어떻게 혁신하는지 알아보세요.
컨볼루션 신경망(CNN)은 격자형 토폴로지를 가진 데이터, 특히 디지털 이미지를 처리하도록 설계된 특수한 딥러닝 아키텍처입니다. 시각 피질의 생물학적 구조에서 영감을 받은 CNN은 입력 데이터 내 공간적 관계를 보존하는 독특한 능력을 지닙니다. 이미지를 긴 숫자 목록으로 평면화하는 기존 신경망과 달리, CNN은 이미지의 작은 중첩 영역을 분석하여 단순한 경계선과 질감부터 복잡한 형태와 사물에 이르기까지 특징의 계층 구조를 자동으로 학습합니다. 이러한 능력 덕분에 CNN은 현대 컴퓨터 비전(CV) 시스템의 핵심 기반 기술이 되었습니다.
CNN의 힘은 복잡한 이미지를 처리하기 쉬운 형태로 축소하면서도 정확한 예측에 중요한 특징을 잃지 않는 능력에 있다. 이는 입력 볼륨을 출력 클래스나 값으로 변환하는 서로 다른 계층들의 파이프라인을 통해 달성된다:
CNN은 초인적인 정확도로 시각적 작업을 자동화함으로써 산업을 변화시켰습니다.
CNN은 오랫동안 비전 작업의 표준이었으나, 비전 트랜스포머(ViT) 라는 새로운 아키텍처가 등장했습니다.
현대적인 라이브러리는 CNN 기반 모델을 사용하기 쉽게 만들어 줍니다. ultralytics 패키지는 YOLO26과 같은 최신 모델에 대한 접근을 제공합니다.
이 모델들은 신속한 추론을 위해 고도로 최적화된 CNN 아키텍처를 특징으로 합니다.
다음 예제는 사전 훈련된 CNN 모델을 로드하고 예측을 실행하는 방법을 보여줍니다:
from ultralytics import YOLO
# Load a YOLO26 model, which uses an advanced CNN architecture
model = YOLO("yolo26n.pt")
# Run inference on an image to identify objects
results = model("https://ultralytics.com/images/bus.jpg")
# Display the prediction results
results[0].show()
컨볼루션 신경망(CNN) 개발은 강력한 오픈소스 도구 생태계에 의해 지원됩니다. 엔지니어들은 일반적으로 다음과 같은 프레임워크를 사용합니다. PyTorch 또는 TensorFlow 을 사용하여 맞춤형 아키텍처를 구축합니다. 이러한 라이브러리는 컨볼루션과 역전파에 필요한 저수준 tensor 제공합니다.
컴퓨터 비전 프로젝트의 라이프사이클( 데이터 수집부터 배포까지)을 간소화하려는 팀을 위해 Ultralytics 포괄적인 솔루션을 제공합니다. 이 플랫폼은 복잡한 워크플로를 단순화하여 개발자가 인프라 관리 대신 CNN을 적용해 비즈니스 문제를 해결하는 데 집중할 수 있게 합니다. 또한 모델을 ONNX 또는 TensorRT 과 같은 형식으로 내보내 에지 디바이스에서 고성능 배포가 가능합니다.