Ultralytics YOLO를 사용한 이미지 분류에 대해 알아보세요. 최첨단 도구를 사용하여 의료, 농업, 소매 등 다양한 분야를 위한 맞춤형 모델을 학습합니다.
이미지 분류는 미리 정의된 범주 세트에서 전체 이미지에 단일하고 특정 레이블을 할당하는 컴퓨터 비전(CV)의 기본 작업입니다. 주요 목표는 이미지의 주요 주제를 식별하고 그에 따라 분류하는 것입니다. 예를 들어, 분류 모델은 이미지를 분석하고 "고양이", "개" 또는 "자동차"와 같은 레이블을 출력합니다. 이 작업은 더 복잡한 CV 애플리케이션의 기초를 형성하며 머신 러닝(ML)의 핵심 구성 요소입니다. 이 프로세스는 알고리즘, 특히 합성곱 신경망(CNN)에 의존하여 레이블이 지정된 대규모 데이터 세트에서 구별되는 특징을 학습합니다.
이미지 분류 모델은 지도 학습을 사용하여 훈련되며, 여기서 올바른 클래스로 수동으로 레이블이 지정된 방대한 수의 이미지가 제공됩니다. 훈련 중에 신경망은 각 범주와 관련된 패턴, 질감, 모양 및 색상 조합을 학습합니다. 이 학습은 모델의 예측과 실제 레이블 간의 차이를 최소화하기 위해 모델의 내부 매개변수 또는 가중치를 조정하는 역전파라는 프로세스를 통해 달성됩니다.
최신 분류 모델은 종종 여러 계층으로 구성된 딥러닝 아키텍처를 사용합니다. 초기 계층은 엣지 및 모서리와 같은 간단한 특징을 인식하도록 학습할 수 있으며, 더 깊은 계층은 이를 결합하여 눈, 바퀴 또는 얼굴과 같은 더 복잡한 구조를 식별합니다. 네트워크의 마지막 계층은 일반적으로 소프트맥스 함수를 사용하여 가능한 각 클래스에 대한 확률 점수를 생성합니다. 가장 높은 확률을 가진 클래스가 최종 예측으로 선택됩니다. 이 프로세스의 핵심은 모델이 분류 작업에 가장 유용한 특징을 자동으로 학습하는 특징 추출입니다.
이미지 분류는 시각적 인식 작업을 자동화하고 확장하기 위해 수많은 산업 분야에서 사용됩니다. 두 가지 주요 예는 다음과 같습니다.
이미지 분류는 다른 컴퓨터 비전 작업과 밀접하게 관련되어 있지만, 뚜렷한 목적을 가지고 있습니다. 다음과의 차이점을 구별하는 것이 중요합니다.
요약하자면, 분류는 이미지에 무엇이 있는지 알려주고, 객체 탐지는 무엇이 어디에 있는지 알려주며, 분할은 장면의 모든 것에 대한 자세한 픽셀 수준의 맵을 제공합니다.
Ultralytics YOLO 모델은 객체 감지로 유명하지만 이미지 분류 작업에도 탁월합니다. YOLO11과 같은 최첨단 모델은 직관적인 Ultralytics Python 패키지 또는 노코드 Ultralytics HUB 플랫폼을 사용하여 사용자 정의 데이터 세트에서 쉽게 학습하거나 미세 조정할 수 있습니다.
저희 설명서는 모델 훈련 팁과 YOLO11을 사용하여 이미지 분류하는 방법에 대한 자세한 가이드를 포함한 광범위한 리소스를 제공합니다. 개발자는 ImageNet, CIFAR-100 및 Caltech-101과 같은 벤치마크 데이터 세트에서 사전 훈련된 모델을 활용하거나 처음부터 새로운 모델을 훈련할 수 있습니다. 최신 발전에 관심이 있는 분들을 위해 Papers With Code와 같은 리소스는 최고 성능 모델에 대한 포괄적인 개요를 제공합니다. 표준 벤치마크에서 YOLO 모델 성능을 비교할 수도 있습니다. PyTorch 및 TensorFlow와 같은 프레임워크는 이러한 모델을 구축하고 훈련하기 위한 기반을 제공합니다.