피처 피라미드 네트워크(FPN)가 다중 스케일 객체 탐지를 어떻게 향상시키는지 살펴보세요. Ultralytics 고급 FPN을 활용하여 크고 detect 객체를 detect 방식을 알아보세요.
피처 피라미드 네트워크(FPN)는 현대 컴퓨터 비전(CV)에서 사용되는 특수한 아키텍처 구성 요소이다. 컴퓨터 비전(CV) 시스템에서 다양한 크기의 객체 탐지 성능을 향상시키기 위해 사용되는 특수한 아키텍처 구성 요소입니다. 시스템에서 다양한 규모에서 객체 탐지 성능을 향상시키기 위해 사용됩니다. 이는 이미지 분석 분야의 오랜 과제인 동일한 이미지 내의 크고 두드러진 구조물과 작고 먼 세부 사항을 동시에 인식하는 문제를 효과적으로 해결합니다. 피라미드와 유사한 개념으로 입력의 다중 스케일 표현을 생성함으로써, FPN은 신경망이 모든 해상도 수준에서 풍부한 의미 정보를 추출할 수 있도록 합니다. 이 아키텍처는 일반적으로 백본(원시 특징 추출)과 객체 클래스와 경계 상자를 예측하는(객체 클래스와 바운딩 박스를 예측) 사이에 위치합니다.
FPN의 핵심 혁신은 정보 처리 방식에 있다. 전통적인 컨볼루션 신경망(CNN)은 는 입력 이미지를 점진적으로 다운샘플링하는 특징 계층 구조를 자연스럽게 생성합니다. 이는 의미적 이해(이미지에 무엇이 있는지 파악)를 심화시키지만, 종종 공간 해상도(정확한 위치 파악)를 저하시켜 작은 물체가 사라지게 만듭니다.
FPN은 다음의 3단계 과정을 통해 이를 해결합니다:
이러한 조합은 각 계층이 강력한 의미론과 우수한 지역화를 갖춘 피라미드를 생성하여 정밀도를 크게 향상시킵니다. 정밀도 및 리콜 을 크게 향상시킵니다.
FPN은 현대적인 객체 탐지 아키텍처의 핵심 요소입니다. FPN 도입 이전에는 모델이 속도(최종 레이어만 사용)와 정확도(이미지 피라미드 처리, 매우 느림) 사이에서 선택해야 했습니다. FPN은 두 마리 토끼를 잡는 해결책을 제공하여 실시간 추론을 가능하게 하면서도 동시에 작은 객체 탐지 능력을 희생하지 않습니다.
이러한 효율성은 다음과 같은 고급 모델에 매우 중요합니다. YOLO26과 같은 고급 모델에 매우 중요합니다. 이 모델은 FPN 원리(예: PANet)에서 영감을 받은 정교한 집계 네트워크를 활용하여 최첨단 성능을 달성합니다. 이 아키텍처는 모델이 에지 디바이스에 배포되든, Ultralytics 를 통해 강력한 서버에 배포되든 다양한 데이터셋에서 높은 정확도를 유지합니다.
FPN의 다중 스케일 기능은 안전과 정밀성이 최우선인 산업 분야에서 필수 불가결한 요소로 자리매김하고 있습니다.
표준 FPN과 최신 아키텍처에서 발견되는 진화된 변형들을 구분하는 것이 유용하다.
고급 라이브러리들처럼 ultralytics FPN 구축의 복잡성을 내부적으로 처리합니다. YOLO26과 같은 모델을 로드하면 아키텍처가 성능을 극대화하기 위해 이러한 특징 집계 레이어를 자동으로 포함합니다.
from ultralytics import YOLO
# Load the YOLO26 model, which uses advanced feature pyramid principles internally
# The 'n' suffix indicates the nano version, optimized for speed
model = YOLO("yolo26n.pt")
# Perform inference on an image containing objects of various sizes
# The model's neck (FPN-based) aggregates features to detect small and large items
results = model("https://ultralytics.com/images/bus.jpg")
# Display results to see bounding boxes around buses (large) and people (small)
results[0].show()