용어집

이미지넷

1400만 개 이상의 이미지로 컴퓨터 비전의 발전을 촉진하고 AI 연구, 모델 및 애플리케이션을 지원하는 획기적인 데이터 세트인 ImageNet에 대해 알아보세요.

ImageNet은 이미지가 어떤 사물을 나타내는지 수작업으로 주석을 달아놓은 1,400만 개 이상의 이미지로 구성된 공개적으로 액세스할 수 있는 방대한 데이터 세트입니다. WordNet 계층 구조에 따라 구성된 이 데이터에는 20,000개 이상의 카테고리가 있으며, '풍선' 또는 '딸기'와 같은 일반적인 카테고리는 수백 개의 이미지로 구성되어 있습니다. 이 방대하고 다양한 컬렉션은 컴퓨터 비전(CV)딥러닝(DL) 분야를 발전시키는 데 중요한 역할을 해왔으며, 모델 훈련 및 벤치마킹의 표준으로 사용되고 있습니다.

스탠퍼드 대학교 연구진에 의한 ImageNet의 탄생은 인공 지능(AI)의 중추적인 순간이었습니다. ImageNet 이전에는 데이터 세트가 너무 작아 복잡한 신경망(NN)을 효과적으로 훈련할 수 없어 과적합과 같은 문제가 발생하는 경우가 많았습니다. ImageNet은 딥 모델을 훈련하는 데 필요한 규모를 제공하여 최신 AI 혁명의 토대를 마련했습니다. 자세한 내용은 ImageNet 연구 논문 원본에서 확인할 수 있습니다.

Imagenet 대규모 시각 인식 챌린지(ILSVRC)

2010년부터 2017년까지 매년 개최된 ILSVRC(ImageNet 대규모 시각 인식 챌린지)를 통해 ImageNet의 영향력은 더욱 커졌습니다. 이 대회는 컴퓨터 비전 알고리즘의 성능을 평가하는 중요한 벤치마크가 되었습니다. 2012년에는 AlexNet이라는 이름의 컨볼루션 신경망(CNN) 이 이전의 모든 모델을 크게 뛰어넘는 획기적인 승리를 거두었습니다. 이 성공은 딥 러닝과 GPU 컴퓨팅의 힘을 입증하며 이 분야에서 혁신의 물결을 일으켰습니다. ILSVRC는 많은 최신 아키텍처 개발의 핵심 동력이 되었으며, 오늘날의 모델이 다양한 벤치마크에서 어떤 성능을 보이는지 Papers with Code와 같은 사이트에서 확인할 수 있습니다.

이미지넷의 실제 적용 사례

ImageNet의 주요 용도는 모델 사전 학습을 위한 리소스입니다. 이 방대한 데이터 세트에 대한 모델 학습을 통해 다양한 시각적 특징을 인식하는 방법을 학습합니다. 그런 다음 이 지식을 새롭고 보다 구체적인 작업에 적용할 수 있습니다. 이 기술을 전이 학습이라고 합니다.

  1. 의료 영상 분석: Ultralytics YOLO 모델과 같이 ImageNet에서 사전 학습된 모델을 훨씬 더 작고 전문화된 의료 스캔 데이터 세트에 대해 미세 조정하여 종양과 같은 특정 상태를 감지할 수 있습니다. ImageNet에 대한 초기 학습은 일반적인 시각적 이해의 강력한 기반을 제공하며, 이는 레이블이 지정된 데이터가 부족한 의료 이미지 분석 작업에서 높은 정확도를 달성하는 데 매우 중요합니다. 이는 의료 분야에서 AI의 핵심 애플리케이션입니다.
  2. 소매 제품 인식: 소매업에서는 자동화된 재고 관리를 위해 진열대에 있는 수천 가지의 다양한 제품을 식별하도록 모델을 조정할 수 있습니다. 처음부터 학습하는 대신 ImageNet에서 사전 학습된 모델을 매장의 특정 상품에 맞게 빠르게 조정할 수 있습니다. 따라서 방대한 양의 맞춤형 학습 데이터에 대한 필요성이 줄어들고 모델 배포 속도가 빨라집니다. 리테일 솔루션의 많은 강력한 AI가 이 접근 방식을 활용하고 있습니다.

이미지넷과 관련 개념 비교

이미지넷을 다른 관련 용어 및 데이터 세트와 구별하는 것이 중요합니다:

  • 이미지넷과 CV 작업 비교: ImageNet 자체는 데이터 세트, 즉레이블이 지정된 이미지의 모음입니다. 작업이 아닙니다. 대신 이미지에 단일 레이블이 할당되는 이미지 분류와 같은 작업을 수행하는 모델을 훈련하고 벤치마킹하는 데 사용됩니다. 이는 경계 상자가 있는 객체를 찾는 객체 감지나 이미지의 모든 픽셀을 분류하는 이미지 분할과는 다릅니다.
  • 이미지넷과 COCO: 이미지넷은 분류의 표준이지만, 다른 컴퓨터 비전 데이터 세트는 다른 작업에 더 적합합니다. 예를 들어, 객체 감지 및 인스턴스 세분화를 위해 선호되는 벤치마크는 COCO(Common Objects in Context) 데이터 세트입니다. COCO는 각 이미지의 여러 개체에 대해 경계 상자 및 픽셀별 분할 마스크와 같은 보다 상세한 주석을 제공하기 때문입니다. 반면, 대부분의 ImageNet 이미지에는 단일 이미지 수준 레이블만 있습니다.

YOLO11과 같은 모델은 종종 분류 백본을 위해 ImageNet에서 사전 학습을 거친 후 탐지 작업을 위해 COCO에서 학습을 진행합니다. 이 다단계 훈련 프로세스는 두 데이터 세트의 강점을 활용합니다. 모델 비교 페이지에서 이러한 벤치마크에서 서로 다른 모델이 어떻게 비교되는지 확인할 수 있습니다. 영향력이 크긴 하지만, AI 윤리의 관점에서 고려해야 할 알려진 데이터 세트 편향 등의 한계가 있다는 점에 유의할 필요가 있습니다.

울트라 애널리틱스 커뮤니티 가입

AI의 미래와 함께하세요. 글로벌 혁신가들과 연결, 협업, 성장하기

지금 가입하기
링크가 클립보드에 복사됨