용어집

이미지 인식

이미지 인식이 어떻게 AI의 시각적 분류 및 이해 능력을 강화하여 의료, 소매, 보안 등의 분야에서 혁신을 주도하는지 알아보세요.

이미지 인식은 컴퓨터 비전의 광범위한 분야로, 기계가 디지털 이미지나 동영상에서 사물, 사람, 장소, 행동을 식별하고 해석할 수 있게 해줍니다. 이미지 인식은 얼굴로 휴대폰 잠금을 해제하는 것부터 자율 주행 차량이 복잡한 환경을 탐색하는 것까지 수많은 애플리케이션을 구동하는 기본 기술입니다. 이미지 인식의 핵심은 머신러닝(ML)딥러닝(DL) 알고리즘을 사용하여 픽셀을 분석하고 의미 있는 패턴을 추출하여 시각 정보를 이해하는 인간의 능력을 모방하는 것입니다.

이미지 인식과 관련 작업 비교

종종 같은 의미로 사용되기도 하지만 이미지 인식은 몇 가지 구체적인 작업을 포괄하는 일반적인 용어입니다. 하위 분야와 구별하는 것이 중요합니다:

  • 이미지 분류: 가장 간단한 형태의 이미지 인식입니다. 미리 정의된 카테고리 세트에서 전체 이미지에 하나의 레이블을 할당하는 것입니다. 예를 들어 모델은 이미지를 "고양이", "개" 또는 "자동차"가 포함된 것으로 분류할 수 있습니다. 출력은 전체 이미지에 대한 하나의 레이블입니다.
  • 물체 감지: 보다 고급 작업인 객체 감지는 이미지 내의 객체를 분류할 뿐만 아니라 일반적으로 각 객체 주위에 경계 상자를 그려서 객체의 위치를 찾습니다. 예를 들어 자율 주행 자동차는 객체 감지를 사용하여 보행자, 다른 차량, 교통 표지판을 식별하고 위치를 찾습니다.
  • 이미지 세분화: 이 작업은 이미지의 각 객체에 속하는 정확한 픽셀을 식별함으로써 한 단계 더 나아갑니다. 의료 이미지 분석과 같이 물체의 모양과 경계를 깊이 이해해야 하는 애플리케이션에 매우 중요한 각 물체에 대한 세부 마스크를 생성합니다.

이미지 인식 작동 방식

최신 이미지 인식은 주로 이미지와 같은 격자형 데이터를 처리하는 데 특히 효과적인 신경망의 일종인 컨볼루션 신경망(CNN)을 기반으로 합니다. 이 과정에는 일반적으로 다음이 포함됩니다:

  1. 데이터 수집: 라벨이 지정된 이미지의 대규모 데이터 세트가 수집됩니다. 유명한 예로는 ImageNet과 COCO가 있습니다.
  2. 모델 훈련: CNN은 이 데이터 세트에 대해 훈련됩니다. 학습하는 동안 네트워크는 특징 추출이라는 프로세스를 통해 단순한 가장자리와 텍스처부터 복잡한 물체 부분까지 패턴을 식별하는 방법을 학습합니다. 모델의 가중치는 예측과 실측 레이블 간의 차이를 최소화하도록 조정됩니다.
  3. 추론: 학습이 완료되면 모델은 보이지 않는 새로운 이미지를 예측할 수 있습니다. 학습된 모델을 적용하는 이 과정을 추론이라고 합니다.

실제 애플리케이션

이미지 인식은 많은 산업 분야에서 필수적인 요소가 되었습니다:

  • 의료 분야: 의료 분야의 AI는 이미지 인식을 통해 방사선 전문의가 엑스레이, MRI, CT 스캔에서 종양, 골절 및 기타 이상 징후를 발견하는 데 도움을 줍니다. 예를 들어, 의료 이미지 데이터 세트로 모델을 학습시켜 높은 정확도로 뇌종양을 식별함으로써 의사가 더 빠르게 진단할 수 있도록 지원할 수 있습니다.
  • 소매업: 소매업체는 이미지 인식 기능을 사용하여 카메라로 진열대를 모니터링하여 제품의 재고가 부족한 시점을 감지함으로써 재고 관리에 활용합니다. 고객이 사진을 업로드하여 유사한 제품을 찾을 수 있는 이커머스 사이트의 시각적 검색 기능도 인기 있는 애플리케이션 중 하나입니다. 이에 대한 자세한 내용은 소매업의 AI 페이지에서 확인할 수 있습니다.

도구 및 교육

이미지 인식 애플리케이션을 개발하려면 전문 라이브러리와 프레임워크를 사용해야 하는 경우가 많습니다. 주요 기술은 다음과 같습니다:

울트라 애널리틱스 커뮤니티 가입

AI의 미래와 함께하세요. 글로벌 혁신가들과 연결, 협업, 성장하기

지금 가입하기
링크가 클립보드에 복사됨