최신 도구를 사용하여 의료, 농업, 소매업 등을 위한 맞춤형 모델을 학습하는 Ultralytics YOLO로 이미지 분류에 대해 알아보세요.
이미지 분류는 미리 정의된 카테고리 세트에서 전체 이미지에 하나의 특정 레이블을 할당하는 컴퓨터 비전(CV) 의 기본 작업입니다. 주요 목표는 이미지의 주요 피사체를 식별하고 그에 따라 분류하는 것입니다. 예를 들어, 분류 모델은 이미지를 분석하여 "고양이", "개" 또는 "자동차"와 같은 레이블을 출력합니다. 이 작업은 훨씬 더 복잡한 CV 애플리케이션의 기초를 형성하며 머신러닝(ML)의 핵심 구성 요소입니다. 이 프로세스는 알고리즘, 특히 컨볼루션 신경망(CNN)에 의존하여 라벨이 지정된 대규모 데이터 세트에서 구별되는 특징을 학습합니다.
이미지 분류 모델은 지도 학습을 통해 훈련되며, 이미 올바른 등급으로 수동으로 레이블이 지정된 방대한 수의 이미지가 제공됩니다. 학습하는 동안 신경망은 각 카테고리와 관련된 패턴, 질감, 모양, 색상 조합을 식별하는 방법을 학습합니다. 이러한 학습은 모델의 내부 파라미터 또는 가중치를 조정하여 예측과 실제 레이블 간의 차이를 최소화하는 역전파라는 프로세스를 통해 이루어집니다.
최신 분류 모델은 종종 여러 계층으로 구성된 딥러닝 아키텍처를 사용합니다. 초기 레이어는 가장자리와 모서리 같은 단순한 특징을 인식하는 방법을 학습하고, 더 깊은 레이어는 이를 결합하여 눈, 바퀴 또는 얼굴과 같은 더 복잡한 구조를 식별합니다. 네트워크의 최종 계층은 일반적으로 소프트맥스 함수를 사용해 가능한 각 클래스에 대한 확률 점수를 산출합니다. 가장 높은 확률을 가진 클래스가 최종 예측으로 선택됩니다. 이 프로세스의 핵심은 특징 추출로, 모델이 분류 작업에 가장 유익한 특징을 자동으로 학습합니다.
이미지 분류는 다양한 산업 분야에서 시각 인식 작업을 자동화하고 확장하는 데 사용됩니다. 대표적인 두 가지 예는 다음과 같습니다:
이미지 분류는 다른 컴퓨터 비전 작업과 밀접한 관련이 있지만, 그 목적이 뚜렷합니다. 다음과 구분하는 것이 중요합니다:
요약하면, 분류는 이미지에 무엇이 있는지, 감지는 무엇이 어디에 있는지, 세분화는 장면의 모든 것에 대한 상세한 픽셀 수준의 지도를 제공합니다.
물체 감지로 잘 알려진 Ultralytics YOLO 모델은 이미지 분류 작업에도 탁월합니다. YOLO11과 같은 최첨단 모델은 직관적인 Ultralytics Python 패키지 또는 코드가 필요 없는 Ultralytics HUB 플랫폼을 사용하여 사용자 지정 데이터 세트에서 쉽게 훈련하거나 미세 조정할 수 있습니다.
모델 훈련 팁과 이미지 분류에 YOLO11을 사용하는 방법에 대한 자세한 가이드를 포함한 광범위한 리소스를 제공하는 설명서를 참조하세요. 개발자는 ImageNet, CIFAR-100, Caltech-101과 같은 벤치마크 데이터 세트에서 사전 훈련된 모델을 활용하거나 처음부터 새로운 모델을 훈련할 수 있습니다. 최신 발전에 관심이 있는 분들을 위해 Papers With Code와 같은 리소스에서는 최고 성능의 모델에 대한 포괄적인 개요를 제공합니다. 표준 벤치마크에서 YOLO 모델 성능을 비교할 수도 있습니다. PyTorch 및 TensorFlow와 같은 프레임워크는 이러한 모델을 구축하고 훈련하기 위한 기반을 제공합니다.