Yolo 비전 선전
선전
지금 참여하기
용어집

Residual Networks (ResNet)

ResNet이 소실 기울기 문제를 해결하여 딥러닝에 혁명을 일으키고, 이미지 분석, NLP 등을 위한 초심층 네트워크를 가능하게 하는 방법을 알아보세요.

레스넷으로 널리 알려진 잔여 네트워크는 다음과 같은 분야에서 중추적 인 발전을 나타냅니다. 인공 지능(AI)컴퓨터 비전(CV) 분야의 중요한 발전입니다. 2015년에 도입된 이 아키텍처는 연구진에 의해 도입된 이 아키텍처는 중요한 과제를 해결했습니다. 딥 러닝(DL)의 중요한 과제인 소실 그라데이션 문제. 이전에는 ResNet이 등장하기 전에는 신경망(NN)의 깊이를 증가시키면 종종 레이어를 더 추가하면 오히려 학습 오류가 증가했습니다. ResNet은 '건너뛰기 연결'을 도입하여 이 문제를 해결했습니다. 연결'을 도입하여 이 문제를 해결했습니다. 수백, 수천 개의 레이어로 구성된 네트워크를 성공적으로 훈련하면서도 정확도.

핵심 혁신: 잔여 블록

ResNet의 가장 큰 특징은 잔여 블록입니다. 기존의 컨볼루션 신경망(CNN)에서는 레이어가 순차적으로 쌓이고 각 레이어가 입력에서 출력으로 직접 매핑을 학습하려고 시도합니다. 그러나 네트워크가 깊어질수록 입력 데이터의 신호는 네트워크의 끝에 도달하기 전에 저하될 수 있습니다.

ResNet은 레이어의 입력을 출력에 바로 추가할 수 있는 '바로 가기' 또는 건너뛰기 연결을 도입했습니다. 출력에 직접 추가할 수 있습니다. 이 메커니즘은 기본적으로 네트워크가 전체 변환을 처음부터 학습하는 대신 입력과 최적의 출력 사이의 "잔여"(차이)를 전체 변환을 처음부터 학습하는 대신 입력과 최적의 출력 사이의 "잔여"(차이)를 학습하도록 네트워크에 지시합니다. 이 아키텍처는 정보 흐름을 보존하고 더 나은 특징 추출을 용이하게 하여 모델이 원본 입력 데이터를 잃지 않고 텍스처나 모양과 같은 복잡한 패턴을 캡처할 수 있습니다. 원본을 읽을 수 있습니다. 이미지 인식을 위한 딥 잔여 학습 백서를 읽고 수학적 기초를 이해할 수 있습니다.

머신 러닝에서 ResNet이 중요한 이유

ResNet은 많은 최신 비전 시스템의 기초가 되는 근간으로 간주됩니다. 매우 심층적인 네트워크를 훈련할 수 있는 기능 덕분에 다음과 같은 대규모 데이터에서도 잘 작동하는 매우 강력한 모델을 만들 수 있습니다. 다음과 같은 대규모 데이터 세트에서 우수한 성능을 발휘할 수 있습니다. ImageNet.

이 아키텍처는 특히 다음과 같은 경우에 중요합니다. 전이 학습. 사전 학습된 ResNet 모델은 방대한 양의 데이터에서 풍부한 기능 맵을 학습했기 때문에 방대한 양의 데이터를 학습했기 때문에 상대적으로 적은 데이터 세트로도 특정 작업에 맞게 미세 조정할 수 있습니다. 이러한 다용도성 덕분에 ResNet은 다음과 같은 작업을 위한 표준 선택입니다. 이미지 분류부터 복잡한 비디오 분석에 이르기까지 다양한 작업을 위한 표준 선택입니다.

실제 애플리케이션

ResNet이 제공하는 안정성과 깊이 덕분에 중요하고 위험도가 높은 환경에서도 사용할 수 있습니다.

  • 의료 진단: 의료 진단 분야 의료 분야의 AI, 레스넷 아키텍처는 자주 사용되는 의료 이미지 분석. 예를 들어 연구자들은 딥 ResNet 모델을 사용하여 MRI 스캔이나 엑스레이를 분석하여 종양 탐지, 이 모델은 얕은 네트워크에서는 놓칠 수 있는 조직 구조의 미세한 이상을 식별해야 합니다.
  • 자율 주행: 자율 주행 차량은 실시간 인식 시스템에 의존합니다. ResNet 변형은 종종 다음을 위한 특징 추출기 역할을 합니다. 물체 감지 시스템의 특징 추출기 역할을 하기도 합니다. 보행자, 교통 표지판 및 기타 차량을 식별하는 물체 감지 시스템의 특징 추출기 역할을 하기도 합니다. 네트워크의 깊이는 차량이 다양한 조명과 날씨 조건에서 물체를 인식할 수 있도록 보장합니다. 다양한 조명과 날씨 조건에서 자동차가 물체를 인식할 수 있도록 보장하며, 이는 자동차 안전의 핵심 요소인 자동차 안전의 핵심 요소입니다.

ResNet vs. 기타 아키텍처

다음과 같은 딥 러닝 라이브러리에서 볼 수 있는 다른 일반적인 아키텍처와 ResNet을 구별하는 것이 도움이 됩니다. PyTorch 또는 TensorFlow:

  • ResNet과 VGG: VGG(시각적 기하학 그룹) 네트워크는 단순성 때문에 인기가 많았습니다. 3x3 컨볼루션만 사용합니다. 하지만 VGG 모델은 계산량이 많고 19개 이상의 레이어를 효과적으로 훈련하는 데 어려움을 겪습니다. ResNet은 스킵 연결을 사용하여 훨씬 더 깊은 층(예: 50, 101 또는 152층)으로 이동하여 깊이 대비 추론 대기 시간이 추론 지연 시간을 줄입니다.
  • ResNet과 YOLO11: ResNet은 주로 분류기 백본입니다, YOLO11 은 최첨단 물체 감지기입니다. 하지만 YOLO11 같은 최신 감지기는 ResNet에서 발전된 아키텍처 개념을 통합하여 단계 간 부분 연결과 같은 연결과 같은 ResNet에서 발전된 아키텍처 개념을 통합하여 훈련 중에 효율적인 경사 흐름을 보장합니다.

Ultralytics 구현

다음을 사용하여 분류 작업에 ResNet 모델을 쉽게 활용할 수 있습니다. ultralytics Python 패키지. 이 를 사용하면 사전 학습된 가중치에 액세스하고 최소한의 코드로 추론을 수행할 수 있습니다.

from ultralytics import YOLO

# Load a pre-trained ResNet50 model capable of classifying images
model = YOLO("resnet50.pt")  # Downloads the model weights automatically

# Perform inference on an image URL
results = model("https://ultralytics.com/images/bus.jpg")

# Display the top classification result
print(f"Top class: {results[0].names[results[0].probs.top1]}")

더 깊은 이론을 이해하고 싶은 분들을 위해 다음과 같은 강좌를 추천합니다. Stanford의 CS231n은 CNN 아키텍처에 대한 훌륭한 학술 자료를 제공합니다. 간단한 분류기를 구축하든 스마트 제조를 위한 복잡한 시스템을 구축하든 스마트 제조를 위한 복잡한 시스템을 구축하든, ResNet을 이해하는 것은 최신 컴퓨터 비전을 마스터하는 데 필수적입니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기