Yolo 비전 선전
선전
지금 참여하기
용어집

특징 맵

기능 맵이 어떻게 Ultralytics YOLO 모델을 강화하여 정밀한 물체 감지와 자율 주행과 같은 고급 AI 애플리케이션을 지원하는지 알아보세요.

특징 맵은 컨볼루션 필터가 입력 이미지나 컨볼루션 필터가 입력 이미지 또는 입력 이미지 또는 컨볼루션 신경망(CNN). 컴퓨터 비전(CV)의 맥락에서는 이러한 맵은 신경망의 '눈' 역할을 하며 학습된 특징의 존재와 위치를 강조 표시합니다. 가장자리, 텍스처, 모서리 또는 복잡한 기하학적 모양과 같은 특징의 존재와 위치를 강조합니다. 원시 픽셀 데이터를 의미 있는 추상화로 변환함으로써 피처 맵은 정교한 모델이 다음과 같은 작업을 수행할 수 있도록 지원합니다. 이미지 분류부터 실시간 물체 감지까지 다양한 작업을 수행할 수 있습니다.

기능 맵을 만드는 방법

피처 맵 생성에는 다음과 같은 수학적 프로세스가 포함됩니다. 컨볼루션. 커널 또는 필터라고 하는 커널 또는 필터라고 하는 학습 가능한 가중치의 특수 행렬이 입력 데이터를 가로지릅니다. 각 위치에서 커널은 요소별 곱셈과 합계를 수행하여 출력 행렬에 단일 값을 생성합니다. 단일 값을 출력 행렬에 생성합니다.

  • 활성화: 결과 값은 일반적으로 활성화 함수를 통과하며 비선형성을 도입하여 네트워크가 복잡한 패턴을 학습할 수 있도록 합니다.
  • 공간 보존: 완전히 연결된 레이어와 달리 피처 맵은 공간 관계를 보존합니다, 즉, 특정 좌표에서 높은 값은 원본 이미지의 동일한 상대적 위치에서 감지된 특징에 해당합니다. 감지된 피처에 해당합니다.
  • 뎁스: 깊이: 단일 컨볼루션 레이어는 종종 여러 필터를 사용하여 결과물인 2D 배열을 쌓아 3D 볼륨의 피처 맵을 형성하며, 종종 딥러닝(DL) 아키텍처 다이어그램에서 딥러닝(DL) 아키텍처 다이어그램으로 시각화됩니다.

계층적 특징 학습

다음과 같은 최신 아키텍처 많은 시스템에서 사용되는 ResNet 백본과 같은 최신 아키텍처, 피처 맵의 계층적 특성을 활용합니다. 데이터가 네트워크를 통해 진행됨에 따라 추상화 수준은 가 증가합니다:

  1. 얕은 레이어: 초기 피처 맵은 수직선, 색상 그라데이션 또는 간단한 곡선과 같은 낮은 수준의 디테일을 캡처합니다. 그라데이션 또는 단순한 곡선과 같은 낮은 수준의 디테일을 캡처합니다. 이는 시각적 인식의 기초를 형성합니다. 시각적 인식의 기초를 형성합니다.
  2. 심층 레이어: 네트워크의 더 깊은 곳에서는 이러한 기본 요소가 결합됩니다. 결과 맵은 다음과 같은 자동차 바퀴의 모양이나 강아지의 얼굴과 같은 높은 수준의 의미론적 개념을 나타냅니다. 이 계층 구조는 다음과 같은 경우에 매우 중요합니다. 다음과 같은 최신 모델의 성능에 매우 중요합니다. YOLO11, 유사한 클래스를 높은 정확도로 구별할 수 있게 해줍니다. 정확도.

네트워크 인텔리전스 시각화

개발자는 종종 피처 맵을 시각화하여 모델이 학습한 내용을 해석하는데, 이 작업은 설명 가능한 AI(XAI). 다음과 같은 도구를 사용하면 같은 도구를 사용하면 엔지니어가 이러한 내부 상태를 검사할 수 있습니다. 자동차를 detect 위한 피처 맵이 배경 트리에서 활성화되어 있다면, 이는 모델이 이 노이즈에 과도하게 적합할 수 있음을 나타냅니다. 이 검사는 디버깅 및 개선에 필수적입니다. 모델 견고성.

다음 Python 코드는 피처 맵 차원에 액세스하는 방법을 보여줍니다. ultralytics 라이브러리 에 훅을 등록하여 컨볼루션 레이어에 연결합니다.

from ultralytics import YOLO

# Load the YOLO11 model (nano version)
model = YOLO("yolo11n.pt")


# Define a hook to print the shape of the feature map from the first layer
def hook_fn(module, input, output):
    print(f"Feature Map Output Shape: {output.shape}")


# Register the hook to the first convolutional layer of the model
model.model.model[0].register_forward_hook(hook_fn)

# Run inference on a dummy image to trigger the hook
model("https://ultralytics.com/images/bus.jpg")

실제 애플리케이션

피처 맵은 많은 혁신적인 기술을 뒷받침하는 엔진입니다:

  • 자율 주행 차량: In 자율 주행 시스템과 같은 같은 자율주행 시스템에서는 기능 지도가 카메라 피드를 처리하여 차선 표시와 보행자 및 교통 표지판을 식별합니다. 이러한 지도의 공간 충실도는 차량이 도로에 무엇이 있는지뿐만 아니라 도로에 무엇이 있는지뿐만 아니라 차량의 상대적 위치를 정확히 파악할 수 있습니다.
  • 의료 진단: In 의료 이미지 분석, 딥 러닝 모델은 MRI 또는 CT 스캔을 분석합니다. 이러한 네트워크의 특징 지도는 종양이나 골절. Nature Medicine과 같은 저널에 발표된 연구에 따르면 이러한 특정 활성화가 관심 영역을 높은 정밀도로 표시하여 방사선 전문의에게 어떻게 도움을 줄 수 있는지 보여줍니다.

관련 개념 구분하기

신경망 아키텍처를 완전히 이해하려면 피처 맵을 관련 용어와 구분하는 것이 도움이 됩니다:

  • 특징 맵과 특징 추출 비교: 특징 추출은 가장 중요한 원시 입력에서 유익한 데이터를 도출하는 프로세스입니다. 특징 맵은 이 프로세스의 결과물인 이 프로세스의 결과로 생성되는 데이터 구조입니다.
  • 피처 맵과 임베딩 비교: 피처 맵은 공간적 차원(높이와 너비)을 유지하지만, 임베딩은 일반적으로 평평하고 저차원적인 벡터입니다. 임베딩은 전체 이미지 또는 객체의 의미적 본질을 나타내며, 종종 다음과 같은 용도로 사용됩니다. 유사성 검색 벡터 데이터베이스에서 유사성 검색에 사용되는 반면, 특징 맵은 다음과 같은 공간적 위치 파악이 필요한 작업의 경우 이미지 세분화.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기