Yolo 비전 선전
선전
지금 참여하기
용어집

피라미드 네트워크(FPN)

피처 피라미드 네트워크(FPN)가 다중 스케일 객체 탐지를 어떻게 향상시키는지 살펴보세요. Ultralytics 고급 FPN을 활용하여 크고 detect 객체를 detect 방식을 알아보세요.

피처 피라미드 네트워크(FPN)는 현대 컴퓨터 비전(CV)에서 사용되는 특수한 아키텍처 구성 요소이다. 컴퓨터 비전(CV) 시스템에서 다양한 크기의 객체 탐지 성능을 향상시키기 위해 사용되는 특수한 아키텍처 구성 요소입니다. 시스템에서 다양한 규모에서 객체 탐지 성능을 향상시키기 위해 사용됩니다. 이는 이미지 분석 분야의 오랜 과제인 동일한 이미지 내의 크고 두드러진 구조물과 작고 먼 세부 사항을 동시에 인식하는 문제를 효과적으로 해결합니다. 피라미드와 유사한 개념으로 입력의 다중 스케일 표현을 생성함으로써, FPN은 신경망이 모든 해상도 수준에서 풍부한 의미 정보를 추출할 수 있도록 합니다. 이 아키텍처는 일반적으로 백본(원시 특징 추출)과 객체 클래스와 경계 상자를 예측하는(객체 클래스와 바운딩 박스를 예측) 사이에 위치합니다.

피처 피라미드 네트워크의 작동 방식

FPN의 핵심 혁신은 정보 처리 방식에 있다. 전통적인 컨볼루션 신경망(CNN)은 는 입력 이미지를 점진적으로 다운샘플링하는 특징 계층 구조를 자연스럽게 생성합니다. 이는 의미적 이해(이미지에 무엇이 있는지 파악)를 심화시키지만, 종종 공간 해상도(정확한 위치 파악)를 저하시켜 작은 물체가 사라지게 만듭니다.

FPN은 다음의 3단계 과정을 통해 이를 해결합니다:

  1. 하향식 경로: 이는 네트워크의 표준 전방 전달 패스로, 예를 들어 잔차 네트워크(ResNet)과 같은 네트워크의 표준 피드포워드 패스입니다. 네트워크가 이미지를 처리함에 따라 특징 맵을 생성합니다. 를 생성하는데, 이는 크기는 줄어들지만 의미적 가치는 증가합니다.
  2. 탑다운 경로: 네트워크는 심층 레이어의 의미론적으로 풍부한 특징을 업샘플링하여 고해상도 피라미드를 구축합니다. 이 단계는 더 큰 공간 맵으로 강력한 컨텍스트를 "환각"시킵니다.
  3. 측방 연결: 다운샘플링 과정에서 손실된 선명한 세부 정보를 복구하기 위해 FPN은 업샘플링된 특징을 하향 경로에서 생성된 원본 고해상도 맵과 측방 연결을 통해 융합합니다.

이러한 조합은 각 계층이 강력한 의미론과 우수한 지역화를 갖춘 피라미드를 생성하여 정밀도를 크게 향상시킵니다. 정밀도리콜 을 크게 향상시킵니다.

객체 탐지 아키텍처에서의 중요성

FPN은 현대적인 객체 탐지 아키텍처의 핵심 요소입니다. FPN 도입 이전에는 모델이 속도(최종 레이어만 사용)와 정확도(이미지 피라미드 처리, 매우 느림) 사이에서 선택해야 했습니다. FPN은 두 마리 토끼를 잡는 해결책을 제공하여 실시간 추론을 가능하게 하면서도 동시에 작은 객체 탐지 능력을 희생하지 않습니다.

이러한 효율성은 다음과 같은 고급 모델에 매우 중요합니다. YOLO26과 같은 고급 모델에 매우 중요합니다. 이 모델은 FPN 원리(예: PANet)에서 영감을 받은 정교한 집계 네트워크를 활용하여 최첨단 성능을 달성합니다. 이 아키텍처는 모델이 에지 디바이스에 배포되든, Ultralytics 를 통해 강력한 서버에 배포되든 다양한 데이터셋에서 높은 정확도를 유지합니다.

실제 애플리케이션

FPN의 다중 스케일 기능은 안전과 정밀성이 최우선인 산업 분야에서 필수 불가결한 요소로 자리매김하고 있습니다.

  • 자동차 산업의 인공지능: 자율주행 차량은 근처의 track 트럭과 멀리 있는 작은 신호등이나 보행자를 동시에 track 합니다. FPN(분산 신경망)은 인식 스택이 이러한 서로 다른 규모를 단일 처리 단계에서 처리할 수 있게 하여 신속한 의사 결정을 보장합니다. nuScenes 와 같은 데이터셋이 이러한 기능의 벤치마킹에 자주 활용됩니다.
  • 의료 영상 분석: 진단 영상에서 병리학적 이상을 감지하려면 크기가 매우 다양하게 나타나는 이상 징후를 포착해야 합니다. FPN 기반 모델은 뇌 MRI 영상에서 큰 장기 구조물과 미세한 초기 단계 종양을 모두 식별할 수 있습니다. MRI 스캔에서에서 모두 식별할 수 있어 방사선과 의사가 정확한 진단을 내리는 데 도움을 줍니다.
  • 농업 분야의 인공지능: 정밀 농업은 드론 영상에서 작물과 해충을 탐지하는 데 의존합니다. 드론의 고도가 달라질 수 있으므로 이미지 내 식물의 크기도 변합니다. FPN은 모델이 잘 일반화하도록 도와주어 정확한 물체 계수 실시합니다.

FPN 대 기타 특징 집계기

표준 FPN과 최신 아키텍처에서 발견되는 진화된 변형들을 구분하는 것이 유용하다.

  • FPN 대 PANet: FPN은 특징을 풍부하게 하기 위해 상향식 경로를 추가하는 반면, Path Aggregation Network (PANet)는 FPN 위에 추가적인 상향식 경로를 더합니다. 이는 저수준 특징에 대한 정보 경로를 단축시켜 YOLO 흔히 채택되는 기법인 국소화 성능을 더욱 향상시킵니다.
  • FPN 대 BiFPN: EfficientDet에 등장하는 양방향 피라미드 네트워크(BiFPN) 은 서로 다른 특징에 학습 가능한 가중치를 도입하고 단일 입력만 가진 노드를 제거하여 네트워크의 효율성을 최적화합니다.

실제 사례

고급 라이브러리들처럼 ultralytics FPN 구축의 복잡성을 내부적으로 처리합니다. YOLO26과 같은 모델을 로드하면 아키텍처가 성능을 극대화하기 위해 이러한 특징 집계 레이어를 자동으로 포함합니다.

from ultralytics import YOLO

# Load the YOLO26 model, which uses advanced feature pyramid principles internally
# The 'n' suffix indicates the nano version, optimized for speed
model = YOLO("yolo26n.pt")

# Perform inference on an image containing objects of various sizes
# The model's neck (FPN-based) aggregates features to detect small and large items
results = model("https://ultralytics.com/images/bus.jpg")

# Display results to see bounding boxes around buses (large) and people (small)
results[0].show()

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기