Ultralytics YOLO11을 사용한 머신 러닝에서 특징 추출의 힘을 발견하십시오. 효율적인 감지 및 분석 기술을 배우십시오.
특성 추출은 원시 고차원 데이터를 보다 관리하기 쉽고 유익한 특성 집합으로 변환하는 머신 러닝(ML) 및 데이터 전처리의 기본 프로세스입니다. 모델에 방대하고 종종 중복된 데이터(예: 이미지의 모든 픽셀)를 제공하는 대신 이 기술은 가장 특징적인 속성 또는 특성을 식별하고 파생합니다. 이 프로세스는 훈련에 필요한 컴퓨팅 리소스를 줄이고 ML 모델이 관련 정보에 집중하여 보다 효과적으로 학습하도록 도와 모델 정확도를 크게 향상시킬 수 있습니다.
특징 추출의 주요 목표는 중요한 정보를 잃지 않고 데이터를 단순화하는 것입니다. 이는 다음과 같은 여러 가지 이유로 중요합니다.
특징 추출 방법은 전통적인 수작업 기술부터 딥러닝으로 구동되는 최신 자동화 방식에 이르기까지 다양합니다.
기존 방법: 이러한 기술은 사전 정의된 규칙에 따라 특징을 추출하기 위해 특수 알고리즘에 의존합니다. 예로는 이미지 분석을 위한 Scale-Invariant Feature Transform (SIFT) 및 HOG (Histogram of Oriented Gradients) 또는 텍스트 처리를 위한 TF-IDF (Term Frequency-Inverse Document Frequency)가 있습니다. 효과적이긴 하지만 이러한 방법을 설계하려면 상당한 도메인 전문 지식이 필요한 경우가 많습니다.
자동화된 방법(학습된 특징): 최신 신경망(NN), 특히 합성곱 신경망(CNN)은 자동 특징 추출에 탁월합니다. 데이터가 네트워크의 레이어를 통과함에 따라 모델은 초기 레이어의 단순한 가장자리와 색상에서 더 깊은 레이어의 복잡한 모양과 객체에 이르기까지 계층적 패턴을 스스로 식별하는 방법을 학습합니다. 이렇게 학습된 표현은 종종 수작업으로 만든 특징보다 더 강력하고 효과적입니다.
특성 추출은 많은 인공 지능(AI) 애플리케이션의 초석입니다.
객체 감지: 컴퓨터 비전(CV)에서 Ultralytics YOLO11과 같은 모델은 백본 네트워크를 사용하여 입력 이미지에서 특징을 자동으로 추출합니다. 특징 맵으로 표현되는 이러한 특징은 텍스처, 모양 및 객체 부분에 대한 정보를 인코딩합니다. 그런 다음 감지 헤드는 이러한 맵을 사용하여 객체를 식별하고 찾습니다. 이는 자율 주행 차량 및 제조업의 AI와 같은 애플리케이션에 매우 중요합니다.
의료 영상 분석: 헬스케어에서 특징 추출은 방사선 전문의와 임상의가 의료 스캔을 분석하는 데 도움이 됩니다. CNN은 MRI 또는 CT 스캔을 처리하여 뇌종양 데이터 세트에서와 같이 종양 또는 기타 이상 징후를 나타내는 특징을 추출할 수 있습니다. 이 자동화된 분석은 더 빠르고 정확한 진단을 돕습니다. 종양 감지에 YOLO11 사용에 대한 블로그에서 작동 방식을 살펴볼 수 있습니다.
특징 추출(feature extraction)을 유사한 용어와 구별하는 것이 유용합니다.
특성 추출 vs. 특성 엔지니어링: 특성 엔지니어링은 원시 데이터에서 특성을 생성하는 것을 포괄하는 더 넓은 용어입니다. 특성 추출은 기존 특성이 더 작고 새로운 세트로 변환되는 특정 유형의 특성 엔지니어링입니다. 또 다른 유형인 특성 선택은 원래 특성의 하위 집합을 선택하는 것을 포함합니다.
특성 추출 vs. 차원 축소: 차원 축소는 결과이고, 특성 추출은 이를 달성하는 한 가지 방법입니다. PCA(주성분 분석)와 같은 기술은 차원 축소에 사용되는 특성 추출의 대표적인 예입니다.
특성 추출 vs. 임베딩: 임베딩은 학습된 특성 표현의 한 유형입니다. 딥러닝 모델은 자동화된 특성 추출 프로세스의 결과로 이러한 조밀한 벡터 표현을 생성하여 데이터의 복잡한 의미 관계를 캡처합니다.
PyTorch 및 TensorFlow와 같은 프레임워크는 이러한 강력한 모델을 구축하기 위한 도구를 제공하는 반면, Ultralytics HUB와 같은 플랫폼은 데이터 세트 관리부터 모델 훈련에 이르기까지 전체 워크플로를 간소화합니다.