1400만 개 이상의 이미지로 컴퓨터 비전의 발전을 촉진하고 AI 연구, 모델 및 애플리케이션을 지원하는 획기적인 데이터 세트인 ImageNet에 대해 알아보세요.
ImageNet은 컴퓨터 비전(CV) 연구 및 개발에 널리 사용되는 매우 큰 규모의 기초 데이터 세트입니다. 여기에는 사진 속 사물을 나타내기 위해 수동으로 주석을 단 1,400만 개 이상의 이미지가 포함되어 있습니다. 이러한 이미지는 English 명사, 동사, 형용사, 부사로 구성된 대규모 어휘 데이터베이스인 WordNet 계층 구조에 따라 인지 동의어 세트(synsets)로 그룹화된 이미지로 구성됩니다. 20,000개 이상의 카테고리를 갖춘 ImageNet은 특히 이미지 분류 및 이미지 인식과 같은 작업을 위한 머신 러닝(ML) 모델을 훈련하고 평가하기 위한 풍부하고 다양한 리소스를 제공합니다. 방대한 규모와 상세한 주석은 인공 지능(AI) 분야를 발전시키는 데 결정적인 역할을 해왔습니다. Ultralytics 모델과 함께 데이터 세트를 사용하는 방법에 대한 자세한 내용은 ImageNet 데이터 세트 설명서 페이지에서 확인할 수 있습니다.
ImageNet의 도입은 특히 컴퓨터 비전 분야에서 딥 러닝(DL)의 중추적인 순간이었습니다. ImageNet 이전에는 크고 다양하며 라벨이 잘 지정된 데이터 세트의 부족이 발전을 가로막는 주요 병목 현상이었습니다. ImageNet과 같은 고품질 데이터 세트는 컨볼루션 신경망(CNN)과 같이 훨씬 더 깊고 복잡한 모델을 훈련할 수 있게 해주었고, 시각적 이해 작업에서 획기적인 발전을 가져왔습니다. 2010년부터 2017년까지 매년 열린 ILSVRC(ImageNet 대규모 시각 인식 챌린지)는 이미지넷의 하위 집합을 사용했으며 이미지 분류 및 물체 감지 알고리즘을 평가하기 위한 표준 벤치마크 데이터 세트가 되었습니다. ImageNet에서 최첨단 결과를 얻은 AlexNet과 ResNet과 같은 획기적인 모델은 최신 CV 아키텍처에 큰 영향을 미쳤으며 대규모 데이터에 대한 딥 러닝의 힘을 입증했습니다. 이 과제와 그 영향에 대한 자세한 내용은 ILSVRC 백서 원본에서 확인할 수 있습니다.
ImageNet의 주요 애플리케이션은 특히 이미지 분류를 위한 새로운 컴퓨터 비전 모델과 알고리즘의 성능(정확도, 속도)을 평가하는 표준 벤치마크 역할을 하고 있습니다. 널리 채택되어 연구자들이 결과를 공정하게 비교할 수 있습니다. 벤치마킹 외에도 이미지넷은 모델 사전 훈련에도 광범위하게 사용됩니다. 사전 훈련에는 먼저 대규모의 일반 ImageNet 데이터 세트에서 모델을 훈련시켜 강력한 시각적 특징을 학습할 수 있도록 하는 것이 포함됩니다. 이러한 사전 훈련된 모델은 종종 다음과 같은 프레임워크를 통해 사용할 수 있습니다. PyTorch 및 TensorFlow와 같은 프레임워크를 통해 제공되는 이러한 사전 학습 모델은 전이 학습을 사용하여 다양한 다운스트림 작업을 위해 더 작고 구체적인 데이터 세트에 대해 미세 조정할 수 있습니다. 이렇게 하면 대상 작업에 필요한 데이터와 계산의 양이 크게 줄어들고 특히 대상 데이터 세트가 작은 경우 성능이 향상되는 경우가 많습니다. 많은 Ultralytics YOLO 모델은 사전 학습 전략을 활용합니다. Ultralytics HUB와 같은 플랫폼은 이러한 기술을 사용하여 모델을 훈련하는 프로세스를 용이하게 합니다.
ImageNet의 영향력은 학술 연구를 넘어 실용적인 응용 분야로까지 확장됩니다:
이미지넷이 지원하는 작업 및 기타 관련 데이터 세트와 이미지넷을 구분하는 것이 중요합니다:
이미지넷은 엄청난 영향력을 가지고 있지만, AI 윤리에서 중요한 고려 사항인 데이터 수집 기간과 출처를 반영하는 데이터 세트 편향 가능성 등 한계도 있습니다.