Yolo 비전 선전
선전
지금 참여하기
용어집

ImageNet

1400만 개 이상의 이미지로 컴퓨터 비전의 발전을 촉진하고 AI 연구, 모델 및 애플리케이션을 지원하는 획기적인 데이터 세트인 ImageNet 대해 알아보세요.

ImageNet 시각적 객체 인식 소프트웨어 연구에 사용하도록 설계된 널리 인용되는 대규모 시각 데이터베이스입니다. 여기에는 어떤 물체가 사진에 찍혔는지 표시하기 위해 수작업으로 주석이 달린 1,400만 개 이상의 이미지가 포함되어 있습니다. 백만 개가 넘는 이미지에 객체의 경계 상자가 표시되어 있습니다. 워드넷 계층 구조에 따라 정리된 워드넷 계층 구조에 따라 구성된 ImageNet 이미지를 특정 개념이나 "싱셋"에 매핑하여 컴퓨터 비전(CV) 모델을 훈련하고 평가하기 위한 컴퓨터 비전(CV) 모델을 훈련하고 평가하기 위한 기본 리소스입니다. 방대한 규모와 다양성 덕분에 연구자들은 소규모 실험을 넘어 현대의 딥 러닝(DL) 시대를 효과적으로 시작할 수 있었습니다. 딥 러닝(DL).

시각 인식의 진화

ImageNet 이전에는 연구자들이 심층 신경망을 훈련하기에는 너무 작은 데이터 세트로 인해 어려움을 겪었습니다. 신경망(NN)을 훈련하기에는 너무 작아서 과적합. 스탠포드 비전 및 학습 연구소의 연구원들이 만든 스탠포드 비전 및 학습 연구소의 연구원들이 만든 ImageNet 이러한 데이터 부족 문제를 해결했습니다. 이 회사는 다음을 통해 전 세계적으로 명성을 얻었습니다. ImageNet 대규모 시각 인식 챌린지(ILSVRC)를 통해 세계적인 명성을 얻었습니다. 2010년부터 2017년까지 진행된 연례 대회입니다.

이 대회는 유명 건축물의 시험대가 되었습니다. 2012년에는 AlexNet 아키텍처가 큰 차이로 이 대회에서 우승했습니다. 상당한 차이로 우승했습니다. 컨볼루션 신경망(CNN)을 사용하여 딥 러닝의 실행 가능성을 입증했습니다. 그래픽 처리 장치(GPU). 그 후 몇 년 동안 다음과 같이 더 깊고 복잡한 모델이 등장했습니다. VGG와 ResNet과 같은 오류율을 더욱 낮추고 특정 분류 작업에서 인간 수준의 성능을 뛰어넘었습니다.

이전 학습 및 사전 교육

ImageNet 데이터 세트이지만, 오늘날 가장 실용적인 활용도는 다음과 같습니다. 전이 학습에 있습니다. 딥 뉴럴 네트워크를 처음부터 훈련하려면 방대한 양의 훈련 데이터와 연산 능력이 필요합니다. 대신, 개발자는 이미 ImageNet"사전 학습"된 모델을 사용하는 경우가 많습니다.

ImageNet 개 품종부터 가정용품까지 20,000개 이상의 방대한 카테고리를 다루기 때문에 이를 기반으로 훈련된 모델은 풍부하고 높은 수준의 특징 표현을 학습합니다. 이렇게 학습된 특징은 새로운 모델의 강력한 백본 역할을 합니다. 다음과 같이 사전 학습된 가중치를 미세 조정함으로써 개발자는 다음을 수행할 수 있습니다. 특정 사용자 지정 데이터 세트에 대해 높은 정확도를 달성할 수 있습니다. 훨씬 적은 수의 이미지로 높은 정확도를 달성할 수 있습니다.

실제 애플리케이션

ImageNet 영향력은 인공지능을 활용하는 거의 모든 산업으로 확장되고 있습니다. 인공 지능(AI).

  1. 의료 진단: 의료 이미지 분석 의료 이미지 분석에서 라벨링된 데이터는 종종 희소하고 비용이 많이 듭니다. 연구원들은 ImageNet 사전 학습된 모델을 사용해 일반적인 모양과 질감을 식별한 다음 텍스처를 식별한 다음, 이를 미세 조정하여 엑스레이에서 종양이나 골절을 detect . 이러한 접근 방식은 의료 도구에서 생명을 구하는 AI의 개발을 가속화합니다.
  2. 스마트 리테일 시스템: 자동 결제 시스템은 수천 개의 제품을 식별하는 데 의존합니다. 오히려 엔지니어는 수백만 개의 시리얼 박스 이미지를 수집하는 대신 ImageNet 분류기를 활용하여 기본적인 제품 모양과 브랜딩을 인식합니다. 이를 통해 신속한 효율적인 모델 배포 효율적인 모델 배포가 가능합니다.

ImageNet 사전 학습된 모델 사용

개발자는 Ultralytics 라이브러리를 사용하여 ImageNet 사전 학습된 모델에 쉽게 액세스할 수 있습니다. 다음 예제 는 로드하는 방법을 보여줍니다. YOLO11 분류 모델을 로드하는 방법을 보여줍니다, 을 로드하고 이를 사용하여 ImageNet 등급을 예측하는 방법을 보여 줍니다.

from ultralytics import YOLO

# Load a YOLO11 classification model pre-trained on ImageNet
model = YOLO("yolo11n-cls.pt")

# Run inference on an image (e.g., a picture of a goldfish or bus)
# The model will output the top ImageNet classes and probabilities
results = model("https://ultralytics.com/images/bus.jpg")

# Print the top predicted class name
print(f"Prediction: {results[0].names[results[0].probs.top1]}")

ImageNet COCO

ImageNet 다음과 같이 구분하는 것이 중요합니다. COCO (컨텍스트 내 공통 개체) 데이터 세트와 구별하는 것이 중요합니다.

  • ImageNet 은 주로 이미지 분류를 위한 벤치마크이며, 목표는 다음과 같습니다. 전체 이미지에 단일 레이블(예: "얼룩 고양이")을 할당하는 것입니다. 주석은 다음 사항에 중점을 둡니다. 이미지에 무엇이 있는지에 초점을 맞춥니다.
  • COCO 의 표준 벤치마크는 객체 감지인스턴스 세분화를 위한 표준 벤치마크입니다. 전체 이미지 수는 더 적은 수의 이미지를 포함하지만 바운딩 박스 및 픽셀 단위 마스크로 복잡한 주석을 제공합니다. 객체가 있는 위치에 초점을 맞춘 복잡한 주석을 제공합니다.

ImageNet 모델에게 '보는 방법'을 가르치는 데 사용되지만, COCO 같은 데이터 세트는 모델에게 복잡한 장면에서 물체를 찾고 복잡한 장면에서 객체를 분리하는 방법을 가르치는 데 사용됩니다. 종종 모델의 인코더는 ImageNet 사전 학습된 후 탐지 작업을 위해 탐지 작업을 위해 COCO 학습합니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기