Yolo 비전 선전
선전
지금 참여하기
용어집

이미지 분류

CNN부터 실제 AI 활용 사례까지 이미지 분류의 기초를 탐구하세요. Ultralytics 활용해 최신 분류기를 훈련하고 배포하는 방법을 배워보세요.

이미지 분류는 컴퓨터 비전(CV) 의 기초 작업으로, 기계 학습 모델이 전체 이미지를 분석하여 미리 정의된 범주 집합에서 단일 레이블을 할당하는 과정입니다. 본질적으로 "이 사진의 주요 주제는 무엇인가?"라는 질문에 답하는 것입니다. 인공지능(AI)의 핵심 구성 요소로서, 이 과정은 자동화된 시스템이 대규모로 시각적 데이터를 조직화하고 분류하며 해석할 수 있게 합니다. 인간의 눈에는 단순해 보일 수 있지만, 컴퓨터가 패턴을 인식하도록 하는 것은 원시 픽셀과 의미 있는 개념 사이의 간극을 메우기 위해 정교 한 기계 학습(ML) 알고리즘이 필요합니다.

분류의 메커니즘

현대 이미지 분류는 컨볼루션 신경망(CNN)으로 알려진 딥 러닝(DL) 아키텍처에 크게 의존합니다. 이러한 네트워크는 생물학적 시각 피질이 정보를 처리하는 방식을 모방하도록 설계되었습니다. 특징 추출이라는 과정을 통해 모델은 초기 계층에서 가장자리와 질감 같은 저수준 속성을 식별하는 법을 학습하고, 결국 이를 결합하여 더 깊은 계층에서 복잡한 형태와 물체를 인식합니다.

분류기를 구축하기 위해 개발자들은 지도 학습을 활용하여 라벨이 지정된 예제가 포함된 방대한 양의 훈련 데이터를 모델에 공급합니다. ImageNet과 같은 대규모 공개 데이터셋은 ImageNet 과 같은 대규모 공개 데이터셋은 이러한 시스템의 정확도 향상에 중요한 역할을 해왔습니다. 추론 단계에서 모델은 각 범주에 대한 확률 점수를 출력하며, 가장 가능성이 높은 클래스를 결정하기 위해 소프트맥스 함수를 활용하는 경우가 많습니다.

분류 대 기타 비전 작업

이미지 분류를 관련 컴퓨터 비전 기능과 구분하는 것이 중요합니다. 기술 선택은 특정 문제에 따라 달라지기 때문입니다:

  • 분류 대 객체 탐지: 분류는 전체 이미지에 하나의 레이블을 할당합니다. 반면 객체 탐지는 장면 내 여러 객체의 위치를 식별하여 각 객체 주변에 경계 상자를 그립니다.
  • 분류 대 이미지 분할: 분류는 전체적인 맥락을 살펴보는 반면, 분할은 픽셀 단위의 정밀도를 제공합니다. 의미론적 분할은 개별 픽셀마다 분류하여 객체와 배경 사이의 경계를 정확히 구분할 수 있게 합니다.

실제 애플리케이션

이미지 분류 기술은 다양한 산업 분야에서 실생활 AI 애플리케이션의핵심 동력으로 작용합니다:

의료 진단

의료 분야에서 분류 모델은 진단용 스캔을 분석하여 방사선 전문의를 지원합니다. 의료 영상 분석 도구는 X선이나 MRI를 "정상" 또는 "비정상"으로 신속하게 분류하거나 종양 검출과 같은 특정 질환을 식별할 수 있어 환자 분류 및 진단을 더 빠르게 진행할 수 있게 합니다.

제조업에서의 품질 관리

공장에서는 제품 기준을 유지하기 위해 자동화된 시각 검사 기술을 활용합니다. 조립 라인에 설치된 카메라가 부품 이미지를 촬영하면 분류 모델이 육안으로 확인된 결함 여부에 따라 즉시 '합격' 또는 '불합격'으로 판정합니다. 이러한 자동화된 품질 관리시스템은 결함이 없는 제품만 포장 단계로 진행되도록 보장합니다.

스마트 농업

농민들은 농업 분야에서 인공지능을 활용해 작물 건강을 모니터링합니다. 드론이나 스마트폰으로 촬영한 이미지를 분류함으로써 시스템은 질병, 영양소 결핍 또는 해충 침입의 징후를 식별할 수 있어, 표적화된 정밀 농업 개입이 가능해집니다.

YOLO26을 이용한 분류 구현

Ultralytics 프레임워크는 탐지 분야로 유명하지만, 이미지 분류 작업에서도 최첨단 성능을 제공합니다. 이 프레임워크의 아키텍처는 속도와 정확도를 위해 최적화되어 실시간 애플리케이션에 적합합니다.

사전 훈련된 모델을 로드하고 classify 방법을 간결하게 보여주는 예시입니다. ultralytics Python 패키지:

from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Run inference on an image source
results = model("https://ultralytics.com/images/bus.jpg")

# Print the top predicted class name
print(f"Prediction: {results[0].names[results[0].probs.top1]}")

워크플로우를 간소화하려는 팀을 위해 Ultralytics 전체 파이프라인을 단순화합니다. 사용자는 분류 데이터셋을 관리하고, 클라우드 기반 훈련을 수행하며, 다양한 형식(예: ONNX 또는 TensorRT 등 다양한 형식으로 모델을 배포할 수 있습니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기