YOLO Vision 2025를 놓치지 마세요!
2025년 9월 25일
10:00 — 18:00 BST
하이브리드 이벤트
Yolo Vision 2024
용어집

특성 추출

Ultralytics YOLO11을 사용한 머신 러닝에서 특징 추출의 힘을 발견하십시오. 효율적인 감지 및 분석 기술을 배우십시오.

특성 추출은 원시 고차원 데이터를 보다 관리하기 쉽고 유익한 특성 집합으로 변환하는 머신 러닝(ML)데이터 전처리의 기본 프로세스입니다. 모델에 방대하고 종종 중복된 데이터(예: 이미지의 모든 픽셀)를 제공하는 대신 이 기술은 가장 특징적인 속성 또는 특성을 식별하고 파생합니다. 이 프로세스는 훈련에 필요한 컴퓨팅 리소스를 줄이고 ML 모델이 관련 정보에 집중하여 보다 효과적으로 학습하도록 도와 모델 정확도를 크게 향상시킬 수 있습니다.

특징 추출이 중요한 이유는 무엇인가?

특징 추출의 주요 목표는 중요한 정보를 잃지 않고 데이터를 단순화하는 것입니다. 이는 다음과 같은 여러 가지 이유로 중요합니다.

  • 복잡성 감소: 이미지, 오디오 또는 텍스트와 같은 원시 데이터 세트는 매우 클 수 있습니다. 특징 추출은 이 데이터를 더 작고 효율적인 표현으로 압축하여 알고리즘이 더 쉽게 처리할 수 있도록 합니다.
  • 성능 향상(Improves Performance): 노이즈 및 중복 데이터를 필터링하여 모델이 더 빠르게 훈련하고 종종 더 나은 결과를 얻을 수 있습니다. 이는 특징 수가 증가함에 따라 성능이 저하되는 현상인 "차원의 저주(curse of dimensionality)"를 완화하는 데 도움이 됩니다.
  • 과적합 방지: 더 간단한 특징 집합은 모델이 노이즈를 포함하여 학습 데이터를 너무 잘 학습하는 과적합의 위험을 줄여 새로운 미지의 데이터에 대해 더 잘 일반화하도록 도울 수 있습니다.

자동화 기술 vs. 전통적인 기술

특징 추출 방법은 전통적인 수작업 기술부터 딥러닝으로 구동되는 최신 자동화 방식에 이르기까지 다양합니다.

  • 기존 방법: 이러한 기술은 사전 정의된 규칙에 따라 특징을 추출하기 위해 특수 알고리즘에 의존합니다. 예로는 이미지 분석을 위한 Scale-Invariant Feature Transform (SIFT) 및 HOG (Histogram of Oriented Gradients) 또는 텍스트 처리를 위한 TF-IDF (Term Frequency-Inverse Document Frequency)가 있습니다. 효과적이긴 하지만 이러한 방법을 설계하려면 상당한 도메인 전문 지식이 필요한 경우가 많습니다.

  • 자동화된 방법(학습된 특징): 최신 신경망(NN), 특히 합성곱 신경망(CNN)은 자동 특징 추출에 탁월합니다. 데이터가 네트워크의 레이어를 통과함에 따라 모델은 초기 레이어의 단순한 가장자리와 색상에서 더 깊은 레이어의 복잡한 모양과 객체에 이르기까지 계층적 패턴을 스스로 식별하는 방법을 학습합니다. 이렇게 학습된 표현은 종종 수작업으로 만든 특징보다 더 강력하고 효과적입니다.

AI 및 컴퓨터 비전 분야의 애플리케이션

특성 추출은 많은 인공 지능(AI) 애플리케이션의 초석입니다.

  1. 객체 감지: 컴퓨터 비전(CV)에서 Ultralytics YOLO11과 같은 모델은 백본 네트워크를 사용하여 입력 이미지에서 특징을 자동으로 추출합니다. 특징 맵으로 표현되는 이러한 특징은 텍스처, 모양 및 객체 부분에 대한 정보를 인코딩합니다. 그런 다음 감지 헤드는 이러한 맵을 사용하여 객체를 식별하고 찾습니다. 이는 자율 주행 차량제조업의 AI와 같은 애플리케이션에 매우 중요합니다.

  2. 의료 영상 분석: 헬스케어에서 특징 추출은 방사선 전문의와 임상의가 의료 스캔을 분석하는 데 도움이 됩니다. CNN은 MRI 또는 CT 스캔을 처리하여 뇌종양 데이터 세트에서와 같이 종양 또는 기타 이상 징후를 나타내는 특징을 추출할 수 있습니다. 이 자동화된 분석은 더 빠르고 정확한 진단을 돕습니다. 종양 감지에 YOLO11 사용에 대한 블로그에서 작동 방식을 살펴볼 수 있습니다.

특징 추출 vs. 관련 개념

특징 추출(feature extraction)을 유사한 용어와 구별하는 것이 유용합니다.

  • 특성 추출 vs. 특성 엔지니어링: 특성 엔지니어링은 원시 데이터에서 특성을 생성하는 것을 포괄하는 더 넓은 용어입니다. 특성 추출은 기존 특성이 더 작고 새로운 세트로 변환되는 특정 유형의 특성 엔지니어링입니다. 또 다른 유형인 특성 선택은 원래 특성의 하위 집합을 선택하는 것을 포함합니다.

  • 특성 추출 vs. 차원 축소: 차원 축소는 결과이고, 특성 추출은 이를 달성하는 한 가지 방법입니다. PCA(주성분 분석)와 같은 기술은 차원 축소에 사용되는 특성 추출의 대표적인 예입니다.

  • 특성 추출 vs. 임베딩: 임베딩은 학습된 특성 표현의 한 유형입니다. 딥러닝 모델은 자동화된 특성 추출 프로세스의 결과로 이러한 조밀한 벡터 표현을 생성하여 데이터의 복잡한 의미 관계를 캡처합니다.

PyTorchTensorFlow와 같은 프레임워크는 이러한 강력한 모델을 구축하기 위한 도구를 제공하는 반면, Ultralytics HUB와 같은 플랫폼은 데이터 세트 관리부터 모델 훈련에 이르기까지 전체 워크플로를 간소화합니다.

Ultralytics 커뮤니티에 참여하세요

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기
클립보드에 링크가 복사되었습니다.