Ultralytics Platform을 사용하여 Ultralytics YOLO 모델을 내보내는 방법
Ultralytics Platform을 사용하여 비전 AI 모델을 쉽게 내보내십시오. 몇 번의 클릭만으로 엣지, 모바일 및 클라우드 배포를 위해 모델을 준비하는 방법을 확인해 보십시오.
지난달, 저희는 전체 컴퓨터 비전 워크플로우를 간소화하기 위해 설계된 통합 작업 공간인 Ultralytics Platform을 출시했습니다. 이 플랫폼은 데이터셋 관리, 어노테이션, 모델 학습, 테스트, 배포 및 모니터링을 포함한 주요 비전 AI 기능을 단일화된 효율적인 인터페이스로 통합합니다.

그림 1. Ultralytics Platform의 모습 (출처)
이러한 엔드투엔드 워크플로우의 일환으로, 배포는 모델을 실험 단계에서 실제 환경으로 옮기는 데 중추적인 역할을 합니다. 이전에 저희는 API를 통한 공유 추론, 확장 가능한 프로덕션 배포를 위한 전용 엔드포인트, 그리고 엣지 디바이스나 외부 인프라에서 실행하기 위한 모델 내보내기를 포함하여 플랫폼에서 사용할 수 있는 다양한 배포 옵션에 대해 살펴보았습니다.
이제 모델 내보내기 기능과 이것이 어떻게 다양한 환경 전반의 배포를 지원하는지 더 자세히 살펴보겠습니다. Ultralytics Platform 관리 인프라 내에서 모델을 실행하는 공유 추론 및 전용 엔드포인트와 달리, 모델 내보내기를 통해 모델을 엣지 디바이스, 모바일 애플리케이션 및 사용자 지정 인프라와 같은 외부 환경에 배포하고 실행할 수 있습니다.
모델이 이러한 환경에서 실행되려면 먼저 타겟 런타임에서 지원하는 형식으로 변환되어야 합니다. 각 배포 설정마다 모바일 및 엣지 디바이스용 경량 형식부터 클라우드 및 GPU 기반 시스템용 고성능 형식에 이르기까지 고유한 요구 사항이 있습니다.
기존에는 이 과정에 스크립트, 종속성, 여러 도구가 포함되어 시간이 많이 소요될 수 있었습니다. Ultralytics Platform을 사용하면 내보내기가 훨씬 간단해집니다. 별도의 추가 설정 없이 몇 번의 클릭만으로 모델을 변환하고 최적화할 수 있습니다.
이 게시물에서는 모델 내보내기의 의미, Ultralytics Platform에서 지원하는 형식, 그리고 사용 사례에 적합한 형식을 선택하는 방법에 대해 알아보겠습니다. 시작해 봅시다!
Link to this section모델 내보내기 개요#
모델 내보내기란 사전 학습되었거나 사용자 지정으로 학습된 모델을 원래 프레임워크 밖에서 사용할 수 있는 형식으로 변환하는 과정을 의미합니다. Ultralytics YOLO 모델은 PyTorch를 사용하여 빌드되며 네이티브 형식으로 저장되는데, 이는 PyTorch 생태계 내에서 학습, 평가 및 실험에 적합합니다.
하지만 배포 환경은 종종 서로 다른 런타임과 하드웨어 요구 사항을 가집니다. 이러한 이유로 학습 중에 사용된 형식이 항상 배포에 적합한 것은 아닙니다.
예를 들어, 모바일 애플리케이션은 낮은 전력 소비에 최적화된 경량 형식을 요구할 수 있으며, 브라우저 기반 앱은 웹 환경에서 효율적으로 실행되는 형식을 필요로 합니다.
카메라나 임베디드 시스템과 같은 엣지 디바이스는 작고 빠른 모델을 사용하면 이점이 있으며, 반면 클라우드 시스템은 고성능 추론을 위해 설계됩니다. 이러한 다양한 시나리오를 지원하려면 모델을 호환 가능한 형식으로 내보내야 합니다.
Link to this section모델 내보내기 옵션이 그 어느 때보다 중요한 이유#
오늘날 컴퓨터 비전 모델은 데이터가 생성되는 곳과 가까운 곳, 특히 엣지 디바이스에 배포되고 있습니다. 스마트폰은 실시간 비전 애플리케이션을 실행하고, CCTV 카메라는 온디바이스 모니터링을 수행하며, 자율 시스템은 즉각적인 의사결정에 의존합니다.
하지만 이러한 환경에서의 배포에는 고유한 과제가 따릅니다. 엣지 디바이스는 제한된 연산 능력, 엄격한 지연 시간 요구 사항, 그리고 메모리 및 에너지 소비에 대한 제약이 있습니다. 충분한 리소스가 있는 학습 환경에서 잘 작동하던 모델이 이러한 제한된 조건에서는 효율적으로 실행되지 않을 수 있습니다.
모델을 올바른 형식으로 내보내면 이러한 문제를 해결하는 데 도움이 될 수 있습니다. 모델을 적절하게 변환함으로써 속도를 위해 최적화하고, 크기를 줄이며, 특정 하드웨어와 호환되도록 만들 수 있습니다.
동시에 내보내기는 유연성을 제공합니다. 동일한 모델을 특정 요구 사항에 따라 여러 형식으로 변환하여 다양한 배포 환경에 맞게 조정할 수 있습니다.

그림 2. Ultralytics Platform에서 사용 가능한 일부 내보내기 형식 (출처)
예를 들어, NCNN 모델 형식은 리소스 사용량이 적은 모바일 및 엣지 디바이스에 최적화되어 있습니다. 반면 OpenVINO 형식은 Intel 하드웨어에 맞춤화되어 있으며 CPU, GPU 및 NPU에서 더 나은 성능을 제공합니다.
대부분의 경우 이러한 수준의 유연성을 달성하려면 수동 변환, 종속성 관리, 여러 도구 사용이 필요하여 프로세스가 복잡하고 시간이 많이 걸렸습니다. Ultralytics Platform은 모델 내보내기를 더욱 접근하기 쉽고 관리하기 편하게 만듦으로써 이러한 워크플로우를 간소화합니다.
Link to this sectionUltralytics Platform이 모델 내보내기를 간소화하는 방법#
일반적으로 모델 내보내기는 컴퓨터 비전 워크플로우에서 분리된 복잡한 단계로 간주됩니다. Ultralytics Platform은 학습부터 배포까지 모든 과정을 포함하는 단일 작업 공간에 모델 내보내기 옵션을 통합함으로써 이를 변화시켰습니다.
주요 장점 중 하나는 노코드(no-code) 내보내기 경험입니다. 스크립트를 작성하거나 환경을 관리하거나 프레임워크별 명령어를 사용할 필요가 없습니다. 직관적인 인터페이스를 통해 단 몇 번의 클릭만으로 모델을 내보낼 수 있습니다.

그림 3. Ultralytics Platform에서 모델을 내보내는 예시 (출처)
백그라운드에서 플랫폼이 까다로운 작업을 처리합니다. 일반적으로 여러 도구와 수동 설정이 필요한 작업이 단일 프로세스로 간소화됩니다. 추가 종속성을 설치하거나 호환성 문제를 해결할 필요가 없어 학습된 모델에서 프로덕션 준비가 완료된 솔루션으로 전환하기가 훨씬 쉬워집니다.
Link to this sectionUltralytics Platform에서 지원하는 모델 내보내기 형식#
Ultralytics Platform은 17가지 내보내기 형식을 지원하여 추가적인 복잡성 없이 다양한 배포 환경을 위해 모델을 쉽게 준비할 수 있게 합니다.
다음은 일반적으로 사용되는 몇 가지 내보내기 형식에 대한 개요입니다.
- 크로스 플랫폼 및 상호 운용성: ONNX와 TorchScript는 서로 다른 프레임워크와 환경에서 모델을 실행하기 위해 널리 사용됩니다. ONNX는 생태계 간의 가교 역할을 하여 도구 간 모델 이동을 쉽게 만들고, TorchScript는 Python 런타임 없이도 프로덕션 환경에서 PyTorch 모델을 실행할 수 있게 합니다.
- GPU에서의 고성능 추론: TensorRT는 NVIDIA GPU용으로 설계되었으며 낮은 지연 시간과 높은 처리량을 위해 모델을 최적화하는 데 중점을 둡니다. 정밀도 감소 및 레이어 융합과 같은 기술을 지원하여 추론 속도를 높이므로 실시간 및 프로덕션 규모의 애플리케이션에 강력한 선택지가 됩니다.
- 모바일 및 엣지 배포: CoreML, LiteRT(TensorFlow Lite), NCNN은 연산 및 메모리가 제한된 디바이스에 최적화되어 있습니다. 이러한 형식은 모델 크기를 줄이고 효율성을 개선하여 스마트폰, 임베디드 시스템 및 엣지 하드웨어에서 원활한 성능을 제공합니다. CoreML은 일반적으로 Apple 생태계에서 사용되며, LiteRT는 Android에서 흔히 사용됩니다.
- 하드웨어 최적화 실행: OpenVINO는 CPU, GPU 및 VPU를 포함한 Intel 하드웨어에 맞춰져 있으며 해당 디바이스에서 추론 속도와 효율성을 개선하는 데 도움을 줍니다. 이와 같은 하드웨어별 형식은 특정 시스템에서 최고의 성능을 얻어야 할 때 유용합니다.
- 프레임워크별 및 특수 런타임: PaddlePaddle 및 ExecuTorch와 같은 형식은 특정 생태계와 배포 요구 사항을 지원하며, 여기에는 엣지 디바이스에서 효율적으로 모델을 실행하거나 특정 딥러닝 스택과 통합하는 것이 포함됩니다.
Link to this sectionUltralytics Platform을 사용하여 모델을 내보내는 방법#
Ultralytics Platform에서 모델을 내보내는 과정은 간단한 UI 기반 프로세스입니다. 전체 워크플로우가 인터페이스를 통해 처리되므로 스크립트나 명령줄 도구가 필요하지 않습니다.
다음은 플랫폼을 사용하여 모델을 내보내는 방법입니다.
- 로그인 및 모델 선택: 프로젝트로 이동하여 내보내려는 학습된 모델을 엽니다.
- 내보내기(Export) 탭으로 이동: 모델 대시보드 내에서 Export 탭을 클릭하여 사용 가능한 내보내기 옵션을 확인합니다.
- 내보내기 형식 선택: 배포 요구 사항에 따라 ONNX, TensorRT 또는 CoreML과 같은 형식을 선택합니다.
- 내보내기 설정 구성(선택 사항): 이미지 크기, 정밀도 또는 배치 크기와 같은 매개변수를 조정하여 성능을 최적화합니다.
- 내보내기 프로세스 시작: "Start Export"를 클릭하여 프로세스를 시작합니다. 플랫폼이 자동으로 변환을 처리합니다.
- 내보낸 모델 다운로드: 내보내기가 완료되면 모델을 다운로드하여 배포 파이프라인에서 사용할 수 있습니다.

그림 4. Ultralytics Platform에서 내보내기 설정을 구성하는 모습
Link to this section올바른 내보내기 형식 선택하기#
Ultralytics Platform에서 지원하는 다양한 내보내기 형식을 살펴보면서 어떤 것을 선택해야 할지 고민될 수 있습니다. 답은 모델을 어디서, 어떻게 사용할 계획인지에 따라 달라집니다.
고려해야 할 몇 가지 요소는 다음과 같습니다.
- 지연 시간 요구 사항: 비디오 분석이나 자율 시스템과 같은 실시간 애플리케이션의 경우 낮은 지연 시간이 중요합니다. TensorRT와 같이 고성능 추론을 위해 최적화된 형식이 종종 더 적합합니다.
- 하드웨어 제약: 휴대폰이나 임베디드 시스템과 같이 메모리와 연산 능력이 제한된 디바이스는 LiteRT나 NCNN과 같은 경량 형식을 요구합니다.
- 모델 크기 및 전력 소비: 엣지 디바이스와 작업할 때는 모델 크기와 전력 소비가 중요해집니다. 더 작고 최적화된 모델은 리소스를 과도하게 사용하지 않으면서 일관된 성능을 보장하는 데 도움이 됩니다.
- 배포 환경: 모델을 다양한 플랫폼에서 실행해야 하는 경우 ONNX와 같은 형식이 유연성을 제공합니다. iOS 앱과 같은 플랫폼별 사용 사례에는 CoreML이 더 나은 선택인 경우가 많습니다.
모든 경우에 적합한 하나의 만능 형식은 없습니다. 성능, 호환성 및 타겟 환경의 제한 사항 사이에서 균형을 맞추는 것이 중요합니다. Ultralytics Platform은 별도의 노력 없이 다양한 형식을 시도하고 비교할 수 있게 하여 이 과정을 더 쉽게 만듭니다.
Link to this section주요 요약#
내보내기는 모델을 다양한 환경에서 실제 사용할 수 있도록 준비하는 중요한 단계입니다. Ultralytics Platform을 사용하면 이 과정이 훨씬 간단해져서 별도의 추가 설정이나 복잡한 작업 없이도 모델을 변환하고 최적화할 수 있습니다. 사용 사례에 적합한 형식을 선택함으로써 모델을 배포하는 어디에서나 효율적으로 실행되도록 보장할 수 있습니다.
성장하는 저희 커뮤니티에 참여하시고, 컴퓨터 비전에 대해 더 알아보려면 GitHub 저장소를 확인해 보세요. 로봇 공학의 AI 및 물류 분야의 컴퓨터 비전과 같은 애플리케이션에 대해 자세히 알아보려면 저희 솔루션 페이지를 살펴보세요. 저희의 라이선스 옵션을 확인하고 비전 AI로 구축을 시작해 보세요!






