용어집

이미지넷

1400만 개 이상의 이미지로 컴퓨터 비전의 발전을 촉진하고 AI 연구, 모델 및 애플리케이션을 지원하는 획기적인 데이터 세트인 ImageNet에 대해 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

ImageNet은 컴퓨터 비전(CV) 연구 및 개발에 널리 사용되는 매우 큰 규모의 기초 데이터 세트입니다. 여기에는 사진 속 사물을 나타내기 위해 수동으로 주석을 단 1,400만 개 이상의 이미지가 포함되어 있습니다. 이러한 이미지는 English 명사, 동사, 형용사, 부사로 구성된 대규모 어휘 데이터베이스인 WordNet 계층 구조에 따라 인지 동의어 세트(synsets)로 그룹화된 이미지로 구성됩니다. 20,000개 이상의 카테고리를 갖춘 ImageNet은 특히 이미지 분류이미지 인식과 같은 작업을 위한 머신 러닝(ML) 모델을 훈련하고 평가하기 위한 풍부하고 다양한 리소스를 제공합니다. 방대한 규모와 상세한 주석은 인공 지능(AI) 분야를 발전시키는 데 결정적인 역할을 해왔습니다. Ultralytics 모델과 함께 데이터 세트를 사용하는 방법에 대한 자세한 내용은 ImageNet 데이터 세트 설명서 페이지에서 확인할 수 있습니다.

중요성 및 관련성

ImageNet의 도입은 특히 컴퓨터 비전 분야에서 딥 러닝(DL)의 중추적인 순간이었습니다. ImageNet 이전에는 크고 다양하며 라벨이 잘 지정된 데이터 세트의 부족이 발전을 가로막는 주요 병목 현상이었습니다. ImageNet과 같은 고품질 데이터 세트는 컨볼루션 신경망(CNN)과 같이 훨씬 더 깊고 복잡한 모델을 훈련할 수 있게 해주었고, 시각적 이해 작업에서 획기적인 발전을 가져왔습니다. 2010년부터 2017년까지 매년 열린 ILSVRC(ImageNet 대규모 시각 인식 챌린지)는 이미지넷의 하위 집합을 사용했으며 이미지 분류 및 물체 감지 알고리즘을 평가하기 위한 표준 벤치마크 데이터 세트가 되었습니다. ImageNet에서 최첨단 결과를 얻은 AlexNet과 ResNet과 같은 획기적인 모델은 최신 CV 아키텍처에 큰 영향을 미쳤으며 대규모 데이터에 대한 딥 러닝의 힘을 입증했습니다. 이 과제와 그 영향에 대한 자세한 내용은 ILSVRC 백서 원본에서 확인할 수 있습니다.

이미지넷의 애플리케이션

ImageNet의 주요 애플리케이션은 특히 이미지 분류를 위한 새로운 컴퓨터 비전 모델과 알고리즘의 성능(정확도, 속도)을 평가하는 표준 벤치마크 역할을 하고 있습니다. 널리 채택되어 연구자들이 결과를 공정하게 비교할 수 있습니다. 벤치마킹 외에도 이미지넷은 모델 사전 훈련에도 광범위하게 사용됩니다. 사전 훈련에는 먼저 대규모의 일반 ImageNet 데이터 세트에서 모델을 훈련시켜 강력한 시각적 특징을 학습할 수 있도록 하는 것이 포함됩니다. 이러한 사전 훈련된 모델은 종종 다음과 같은 프레임워크를 통해 사용할 수 있습니다. PyTorchTensorFlow와 같은 프레임워크를 통해 제공되는 이러한 사전 학습 모델은 전이 학습을 사용하여 다양한 다운스트림 작업을 위해 더 작고 구체적인 데이터 세트에 대해 미세 조정할 수 있습니다. 이렇게 하면 대상 작업에 필요한 데이터와 계산의 양이 크게 줄어들고 특히 대상 데이터 세트가 작은 경우 성능이 향상되는 경우가 많습니다. 많은 Ultralytics YOLO 모델은 사전 학습 전략을 활용합니다. Ultralytics HUB와 같은 플랫폼은 이러한 기술을 사용하여 모델을 훈련하는 프로세스를 용이하게 합니다.

실제 사례

ImageNet의 영향력은 학술 연구를 넘어 실용적인 응용 분야로까지 확장됩니다:

  • 의료 이미지 분석: ImageNet에서 사전 학습된 모델은 의료 이미지 분석의 특수한 작업에 맞게 미세 조정되는 경우가 많습니다. 의료 이미지는 ImageNet 사진과 크게 다르지만 학습된 기본적인 시각적 특징(가장자리, 질감, 기본 모양 등)은 강력한 출발점을 제공합니다. 이러한 접근 방식은 의료 영상에서 종양을 감지하거나 엑스레이 또는 CT 스캔에서 이상 징후를 식별하는 등의 작업을 위한 AI 도구의 개발을 가속화하여 의료 분야의 AI 발전에 기여합니다.
  • 자율 시스템: 자율주행 차량과 로봇의 인식 시스템은 보행자, 자동차, 교통 표지판, 장애물 등의 물체를 정확하게 식별하는 데 크게 의존합니다. 이러한 시스템의 객체 인식 구성 요소를 ImageNet에서 사전 학습하면 일반적인 객체 특징을 학습하여 특정 주행 또는 운영 환경 데이터를 미세 조정할 때 견고성과 신뢰성을 향상시킬 수 있습니다. 이는 웨이모에서 사용하는 것과 같은 기술을 개발하는 데 기여하고 자동차 솔루션의 AI에 통합됩니다.

이미지넷과 관련 개념 비교

이미지넷이 지원하는 작업 및 기타 관련 데이터 세트와 이미지넷을 구분하는 것이 중요합니다:

  • 이미지넷과 CV 작업 비교: ImageNet 자체는 레이블이 지정된 이미지의 모음인 데이터 세트입니다. 이미지 분류 (이미지에 단일 레이블 할당), 객체 감지 ( 경계 상자가 있는 객체 찾기), 이미지 세분화 ( 인스턴스 세분화의미적 세분화를 포함해 각 픽셀에 레이블 할당)와 같은 작업은 아닙니다. 대신 ImageNet은 주로 이러한 작업, 특히 분류를 수행하는 모델을 훈련하고 벤치마킹하는 데 사용됩니다.
  • 이미지넷과 COCO: 이미지넷은 분류의 표준이지만, COCO(Common Objects in Context )와 같은 데이터 세트는 개체 감지 및 분할을 벤치마킹하는 데 더 일반적으로 사용됩니다. 이미지당 여러 개체에 대한 정확한 경계 상자 및 픽셀별 분할 마스크와 같이 이러한 작업에 필요한 더 자세한 주석이 포함된 반면, COCO는 주로 이미지 수준 레이블을 제공하기 때문입니다(일부 개체 위치 정보 데이터는 존재하지만). Ultralytics 다양한 작업을 위한 다양한 컴퓨터 비전 데이터 세트를 지원합니다.

이미지넷은 엄청난 영향력을 가지고 있지만, AI 윤리에서 중요한 고려 사항인 데이터 수집 기간과 출처를 반영하는 데이터 세트 편향 가능성 등 한계도 있습니다.

모두 보기