Yolo 비전 선전
선전
지금 참여하기

Kaggle 통합을 사용하여 Ultralytics YOLO 모델 훈련하기

Abirami Vina

4분 소요

2024년 12월 25일

원활한 Kaggle 통합을 통해 Ultralytics YOLO 모델을 더 쉽게 교육, 테스트 및 실험할 수 있는 방법을 자세히 살펴보세요.

인공지능(AI) 개발, 특히 컴퓨터 비전 분야를 시작하는 것은 하드웨어 인프라 구축, 적절한 데이터 세트 찾기, 맞춤형 모델 훈련과 같이 복잡한 요소를 수반하는 경우가 많습니다. 하지만 AI 커뮤니티의 가장 큰 장점 중 하나는 AI를 모든 사람이 더 쉽게 접근하고 실행할 수 있도록 끊임없이 노력한다는 점입니다. 이러한 협력 정신 덕분에 비전 AI에 관심 있는 사람이라면 누구나 바로 뛰어들어 실험을 시작할 수 있도록 지원하는 안정적인 도구가 등장했습니다.

Vision AI를 사용하여 워크플로를 최적화하는 방법을 모색하고 있다면 Kaggle 통합은 판도를 바꿀 것입니다. Kaggle은 방대한 데이터 세트 라이브러리와 협업 플랫폼을 제공하는 동시에 Ultralytics YOLO11 모델은 최첨단 컴퓨터 비전 모델을 훈련하고 배포하는 프로세스를 간소화합니다. 이러한 통합은 광범위한 인프라나 고급 기술 전문 지식 없이도 엔지니어 팀이나 개인 애호가가 Vision AI 솔루션을 사용해 보고, 훈련하고, 실험하는 데 적합합니다.

이번 글에서는 Kaggle 통합이 어떻게 작동하는지, 어떻게 더 빠른 실험을 가능하게 하는지, 그리고 AI를 처음 시작하거나 프로젝트에서 AI의 잠재력을 탐색하는 경우 컴퓨터 비전을 적용하는 혁신적인 방법을 찾는 데 어떻게 도움이 되는지 자세히 살펴볼 것입니다.

Kaggle 데이터 세트 및 컴퓨팅 리소스 개요

Anthony GoldbloomBen Hamner가 2010년에 설립한 Kaggle은 선도적인 AI 및 머신 러닝 플랫폼입니다. 데이터 과학자, 연구원 및 AI 애호가가 협업하고, 아이디어를 공유하고, 혁신적인 솔루션을 개발할 수 있도록 설계된 허브입니다. 다양한 산업 분야의 50,000개 이상의 공개 데이터 세트를 통해 Kaggle은 AI 및 머신 러닝 프로젝트를 실험하려는 사람들에게 많은 리소스를 제공합니다.

__wf_reserved_inherit
Fig 1. Kaggle 데이터 세트입니다.

예를 들어, Kaggle은 AI 모델 학습에 필수적인 GPU(그래픽 처리 장치)TPU(Tensor 처리 장치)에 대한 무료 액세스를 제공합니다. 이는 Vision AI를 처음 시작하는 개인이 복잡한 작업을 처리하기 위해 고가의 하드웨어에 투자할 필요가 없음을 의미합니다. 초보자도 하드웨어 비용에 대한 부담 없이 학습, 아이디어 테스트, 프로젝트 구축에 집중할 수 있도록 Kaggle의 클라우드 리소스를 사용하여 AI를 실험할 수 있는 좋은 방법입니다.

마찬가지로, Kaggle API는 사용자가 워크플로를 자동화하고, 다른 도구와 원활하게 통합하고, 개발 작업을 간소화할 수 있도록 지원하여 데이터 세트 관리, 모델 학습 및 실험 실행 프로세스를 간소화합니다. Vision AI를 처음 시작하는 사람들에게 이는 반복적인 작업에 소요되는 시간을 줄이고 모델 구축 및 개선에 더 많은 시간을 집중할 수 있음을 의미합니다. 

Kaggle 통합은 개발을 간소화합니다.

이제 Kaggle이 무엇인지 더 잘 이해했으니, Kaggle 통합이 정확히 무엇을 포함하며 어떻게 적용되는지 살펴보겠습니다. YOLO11 이 Kaggle 플랫폼에서 어떻게 작동하는지 살펴보겠습니다.

YOLO11 객체 감지, 이미지 분류, 인스턴스 분할 등과 같은 비전 AI 작업을 지원하는 컴퓨터 비전 모델입니다. YOLO11 흥미로운 기능 중 하나는 대규모의 다양한 데이터 세트에 대해 사전 학습된 상태로 제공되므로 사용자가 많은 일반적인 애플리케이션에서 즉시 훌륭한 결과를 얻을 수 있다는 것입니다.

그러나 특정 사용 사례에 따라 사용자 지정 데이터 세트를 사용하여 YOLO11 전문화된 작업에 더 잘 맞도록 미세 조정할 수도 있습니다. 

제조 분야의 비전 AI를 예로 들어보겠습니다. YOLO11 조립 라인에서 제품의 결함을 식별하여 품질 관리를 강화하는 데 사용할 수 있습니다. 합격 및 불량품의 예시가 포함된 제품 이미지와 같은 제조 공정에 특화된 맞춤형 데이터 세트로 미세 조정하면 워크플로 고유의 미묘한 불규칙성까지 detect 최적화할 수 있습니다.

AI 모델을 맞춤형으로 학습시키는 것은 흥미롭지만 비용이 많이 들고 기술적으로 구축하기 어려울 수 있습니다. Kaggle 통합은 사용하기 쉬운 도구와 리소스를 제공하여 이 프로세스를 간소화합니다.

 

__wf_reserved_inherit
그림 2. UltralyticsKaggle 통합.

Kaggle의 광범위한 데이터 세트 라이브러리와 강력한 클라우드 인프라에 대한 무료 액세스, 그리고 YOLO11사전 학습된 기능을 통해 사용자는 하드웨어 설정이나 데이터 소싱과 같은 기존의 많은 문제를 건너뛸 수 있습니다. 대신 모델을 개선하고 워크플로우 최적화나 품질 관리 향상과 같은 실제 문제를 해결하는 등 정말 중요한 일에 집중할 수 있습니다.

Kaggle 연동 작동 방식

Kaggle에서 맞춤형 YOLO11 모델을 교육하는 것은 직관적이고 초보자 친화적입니다. 주피터 노트북이나 Google 랩과 유사한 Kaggle YOLO11 노트북은 사용자 친화적이고 사전 구성된 환경을 제공하여 쉽게 시작할 수 있습니다.

Kaggle 계정에 로그인한 후, 사용자는 노트북에서 제공된 코드를 복사하고 편집하는 옵션을 선택할 수 있습니다. 그런 다음 GPU 옵션을 선택하여 학습 과정을 가속화할 수 있습니다. 노트북에는 명확한 단계별 지침이 포함되어 있어 쉽게 따라할 수 있습니다. 이 간소화된 접근 방식은 복잡한 설정이 필요 없으며 사용자가 모델을 효과적으로 훈련하는 데 집중할 수 있도록 해줍니다.

__wf_reserved_inherit
Fig 3. Kaggle 통합에는 빠른 시작 노트북이 포함되어 있습니다.

Kaggle 통합 선택: 그 이유

Kaggle 통합과 관련된 설명서를 탐색하다가 Ultralytics 통합 페이지를 보게 되면 궁금한 점이 생길 수 있습니다: 사용 가능한 통합 옵션이 너무 많은데, Kaggle 통합이 나에게 적합한 선택인지 어떻게 알 수 있나요? 

일부 통합은 중복되는 기능을 제공합니다. 예를 들어, Google Colab 통합은 YOLO 모델 교육을 위한 클라우드 리소스도 제공합니다. 그렇다면 왜 Kaggle일까요? 

Kaggle 통합이 귀하의 요구에 가장 적합한 이유에 대한 몇 가지 이유는 다음과 같습니다.

  • 프로젝트 공유 용이성: Kaggle 플랫폼을 통해 노트북, 결과 및 연구 결과를 쉽게 공유하여 개방성과 학습 문화를 조성할 수 있습니다.
  • 공개 경연대회 및 벤치마크: 공개 경연 대회와의 통합을 통해 사용자는 자신의 YOLO 모델을 다른 사람들과 벤치마킹하고 공유된 피드백과 학습을 통해 성과를 개선할 수 있습니다.
    ↪f_200D↩
  • 잦은 업데이트 및 지원: Kaggle의 적극적인 유지 관리 및 지원을 통해 최신 도구를 사용하고 필요할 때마다 도움을 받을 수 있습니다.

YOLO11 Kaggle 통합의 실제 적용 사례

이제 통합에 대해 살펴봤으니, 실제 애플리케이션에 어떻게 도움이 될 수 있는지 살펴보겠습니다. 소매업의 비전 AI와 관련하여 이미 많은 비즈니스에서 AI를 사용하여 운영을 개선하고 있으며, Kaggle의 도움으로 YOLO11 활용하면 훨씬 더 쉽게 작업할 수 있습니다. 

예를 들어, 소매점 통로에 쌓여 있는 상자를 감지하는 재고 관리 시스템을 구축하고자 한다고 가정해 보겠습니다. 아직 데이터 세트가 없는 경우, Kaggle의 방대한 라이브러리에서 데이터 세트를 사용하여 시작할 수 있습니다. 이 특정 작업의 경우, 데이터 집합은 쌓여 있는 상자의 위치를 나타내는 주석이 달린 소매점 통로의 이미지로 구성될 수 있습니다. 이러한 주석은 YOLO11 환경의 다른 개체와 상자를 정확하게 detect 구별하는 방법을 학습하는 데 도움이 됩니다. 

__wf_reserved_inherit
Fig 4. 컴퓨터 비전을 사용하여 상자를 감지하는 예시입니다.

YOLO11 Kaggle의 조합은 재고 관리 외에도 다음과 같은 다양한 실제 시나리오에 적용할 수 있습니다:

  • 의료 분야의 AI: 엑스레이, MRI 등 의료 영상을 분석하여 이상 징후를 detect 의사가 더 빠르고 정확하게 진단할 수 있도록 지원
    ↪f_200D↩
  • 스마트 시티의 비전 AI: 쓰레기를 감지하고, 보행자 통행을 모니터링하거나, 주차장 점유를 track 도시 계획을 지원하고 도시 서비스를 개선합니다.
    ↪f_200D↩
  • 건설 분야의 컴퓨터 비전: 적절한 장비를 착용하지 않은 작업자를 감지하고, 장비 사용을 모니터링하며, 규정 준수를 보장하여 현장 안전을 강화합니다.

Kaggle 통합의 이점 

Kaggle 통합은 Vision AI를 탐색하는 쉽고 간단한 방법을 제공합니다. 다음은 이 통합의 몇 가지 고유한 이점입니다.

  • 더 큰 프로젝트를 위한 확장성: 필요에 따라 작게 시작하여 확장하고 Kaggle의 리소스를 활용하여 고급 AI 아이디어를 탐색하고 실험해 보세요.
  • 커뮤니티 및 협업: Kaggle은 활발한 커뮤니티의 도움을 받아 통찰력을 공유하고, 다른 사람들로부터 배우며, AI 기술을 연마할 수 있는 협업 환경을 조성합니다.
  • 산업 전반에 걸친 응용 분야: 소매, 제조, 농업 또는 의료 분야의 응용 분야를 탐색하든 통합은 광범위한 실제 사용 사례를 지원합니다.
  • 더 빠른 프로토타입 제작: 사전 구성된 노트북과 GPU 및 TPU에 대한 무료 액세스를 통해 빠른 반복 및 테스트가 가능하므로 설정이 아닌 혁신에 집중할 수 있습니다.

Kaggle 통합 작업 팁

Kaggle을 사용하는 동안 AI 개발을 더 쉽고 효율적으로 만들 수 있는 몇 가지 사항을 알고 있어야 합니다.

예를 들어, GPU 및 TPU 시간 제한과 같은 리소스 제한을 염두에 두면 교육 세션을 보다 효과적으로 계획하는 데 도움이 될 수 있습니다. 더 큰 데이터 세트로 작업하는 경우, 데이터를 분할하거나 외부 저장소 옵션을 탐색해야 할 수도 있으므로 개인 데이터 세트에 대한 Kaggle의 20GB 제한을 염두에 두세요.

사용하는 데이터 세트와 코드를 출처 표시하고, 민감한 데이터가 Kaggle의 개인 정보 보호 정책을 준수하는지 확인하는 것도 좋은 방법입니다. 마지막으로, 사용하지 않는 데이터 세트를 제거하여 작업 공간을 정리하면 워크플로를 간소화할 수 있습니다. 이러한 작은 고려 사항들이 Kaggle을 Vision AI 개발에 더 쉽게 사용할 수 있도록 해줍니다.

주요 내용

Kaggle 통합은 비전 AI 개발을 간소화하고 기술 애호가들이 더 쉽게 접근할 수 있게 해줍니다. Kaggle의 방대한 데이터 세트 및 클라우드 리소스와 Ultralytics YOLO11비전 기능을 결합함으로써 개인은 복잡한 설정이나 고가의 인프라 없이도 AI 모델을 훈련할 수 있습니다.

재고 관리 애플리케이션을 탐색하든, 의료 이미지를 분석하든, 아니면 컴퓨터 비전 프로젝트를 처음 시작하든, 이 통합은 시작하고 영향력을 발휘하는 데 필요한 도구를 제공합니다.

커뮤니티에 참여하여 AI 및 응용 분야에 대해 자세히 알아보세요. GitHub 저장소를 방문하여 AI가 제조농업과 같은 분야에서 어떻게 혁신을 주도하는지 확인하세요.

함께 미래의 AI를 만들어 갑시다!

미래의 머신러닝 여정을 시작하세요

무료로 시작하기