Ultralytics 활용하여 확장성 높고 빠르며 유연한 AI 배포를 통해 컴퓨터 비전 모델을 모든 지역에 배포하는 방법을 알아보세요.
Ultralytics 활용하여 확장성 높고 빠르며 유연한 AI 배포를 통해 컴퓨터 비전 모델을 모든 지역에 배포하는 방법을 알아보세요.
이번 주 초, Ultralytics 데이터 준비와 모델 개발부터 배포에 이르는 비전 AI 워크플로의 모든 단계를 간소화하여 컴퓨터 비전(CV) 시스템의 출시 속도를 높이기 위해 설계된 새로운 엔드투엔드 환경인 Ultralytics ( Ultralytics )’을 Ultralytics .
Ultralytics 개발한 주요 동기 중 하나는, 기계가 이미지와 동영상을 분석할 수 있게 해주는 컴퓨터 비전 솔루션을 구상 단계에서부터 실질적인 성과를 내는 단계까지 발전시키는 데에는 단순히 강력한 모델을 구축하는 것 이상의 노력이 필요하다는 점입니다. 모델이 훈련되고 검증 단계를 통과한 후에는, 애플리케이션이 실제 환경에서 이미지를 전송하고 예측 결과를 수신하며 안정적으로 추론을 수행할 수 있도록 해당 모델을 배포해야 합니다.
머신러닝 라이프사이클의 이 단계에서는 컴퓨터 비전 모델이 실험 단계를 넘어 실제 시스템에 적용되기 시작합니다. 데이터셋 준비, 라벨링, 모델 훈련, 테스트와 같은 초기 단계가 순조롭게 진행되더라도, 모델을 배포할 신뢰할 수 있는 방법이 없다면 그 결과들은 실질적인 변화를 가져올 수 없습니다.
많은 컴퓨터 비전 프로젝트에서 실제로 배포는 워크플로우에서 가장 복잡한 단계 중 하나가 될 수 있습니다.
팀들은 종종 추론 API를 구성하고, 컴퓨팅 리소스를 관리하며, 지연 시간을 줄이기 위해 사용자와 가까운 곳에 모델을 배포하고, 시스템이本番 환경에서 가동되면 성능을 모니터링해야 합니다.
Ultralytics 모델 내보내기 형식, 공유 추론 서비스, 전 세계 리전에 걸친 전용 엔드포인트 등 다양한 배포 옵션을 제공함으로써 이 프로세스를 간소화하고 자동화합니다. 관리형 인프라와 내장된 모니터링 기능을 통해 팀은 훈련된 모델을 기반으로 생산 환경에 바로 적용 가능한 컴퓨터 비전 시스템으로 손쉽게 전환할 수 있습니다.

이 글에서는 Ultralytics Platform의 전용 엔드포인트를 활용해 컴퓨터 비전 모델을 모든 지역에 배포하는 방법을 살펴보겠습니다. 시작해 볼까요!
Ultralytics 사용하여 딥러닝 모델을 배포하는 방법을 자세히 살펴보기 전에, 컴퓨터 비전 모델 배포가 실제로 무엇을 의미하는지 먼저 제대로 이해해 봅시다.
컴퓨터 비전 모델 배포란, 훈련된 모델을 실제 환경에서 사용할 수 있도록 준비하는 과정을 말합니다. 모델은 단순히 훈련 환경에서만 실행되는 것이 아니라, 애플리케이션이 이미지나 동영상을 전송하면 그에 대한 예측 결과를 반환받을 수 있도록 구성됩니다.
예를 들어, 모델은 이미지 내의 detect , 이미지 분할을 수행하거나, 창고 내의 물품을 식별하거나, 영상 자료의 패턴을 인식할 수 있습니다. 대부분의 실제 시스템에서는 이러한 작업이 API나 추론 엔드포인트를 통해 이루어집니다.
애플리케이션이 모델에 이미지를 전송하면, 모델이 이를 처리하여 몇 밀리초 내에 예측 결과를 반환합니다. 바로 이러한 과정 덕분에 Ultralytics YOLO 와 같은 컴퓨터 비전 모델들이 실시간 애플리케이션을 가능하게 하는 원리입니다.
모델은 사용 사례에 따라 다양한 환경에 배포될 수 있습니다. 일부는 클라우드(클라우드 플랫폼을 통해)에서 실행되어 여러 애플리케이션이 이를 이용할 수 있는 반면, 다른 모델들은 신속한 로컬 예측이 필요한 온프레미스 카메라, 로봇 또는 임베디드 시스템과 같은 에지 디바이스에서 실행됩니다.
Ultralytics 컴퓨터 비전 분야가 직면한 여러 과제, 특히 모델 배포와 관련된 문제를 해결해 줄 뿐만 아니라, 애플리케이션의 요구 사항에 따라 유연한 방식으로 추론 작업을 수행할 수 있도록 지원합니다.
이 플랫폼에서 사용할 수 있는 모델 배포 옵션을 간략히 살펴보겠습니다:
Ultralytics 사전 학습된 모델이나 사용자 정의 컴퓨터 비전 모델을 프로덕션 환경에서 실행하는 가장 확장성이 뛰어난 방법 중 하나는 전용 엔드포인트를 활용하는 것입니다. 전용 엔드포인트를 사용하면 학습된 모델을 독립적인 서비스로 배포할 수 있으므로, 애플리케이션이 해당 엔드포인트로 이미지를 전송하고 API를 통해 예측 결과를 수신할 수 있습니다.
모델을 단순히 훈련 환경이나 로컬 노트북에서만 실행하는 대신, 엔드포인트로 배포하면 실제 애플리케이션에서 이를 활용할 수 있습니다. 예를 들어, 물류 시스템은 물체 탐지를 위해 패키지 이미지를 전송할 수 있고, 스마트 카메라는 영상 프레임을 분석할 수 있으며, 로봇 시스템은 예측 결과를 바탕으로 동작을 제어할 수 있습니다.
각 전용 엔드포인트는 싱글 테넌트 서비스로 운영되므로, 모델을 실행하는 인프라가 다른 사용자와 공유되지 않습니다. 이를 통해 더 안정적인 성능을 보장할 수 있으며, 프로덕션 환경에서 모델의 동작을 모니터링하기가 더 쉬워집니다.
전용 엔드포인트는 모델을 위한 호스팅 서비스라고 생각하시면 됩니다. Ultralytics 애플리케이션의 진입점 역할을 하는 고유한 엔드포인트 URL을 제공합니다.
애플리케이션이 해당 URL로 요청을 보낼 때, 인증용 API 키와 함께 이미지 및 신뢰도 임계값이나 이미지 크기 같은 선택적 매개변수를 포함합니다.
이 서비스는 사용자의 모델을 사용하여 이미지에 대한 추론을 수행하고, 구조화된 응답 형식으로 예측 결과를 반환합니다. 이러한 구성 덕분에 개발자는 표준 웹 도구를 활용해 컴퓨터 비전 모델을 실제 시스템에 통합할 수 있습니다.
애플리케이션은 Python, JavaScript, cURL 또는 기타 HTTP 클라이언트를 사용하여 요청을 전송할 수 있으므로, 모델을 대시보드, 로봇 시스템 또는 클라우드 애플리케이션에 손쉽게 연결할 수 있습니다. 엔드포인트가 독립적으로 실행되므로 확장, 모니터링 및 글로벌 배포도 지원하여, 팀이 안정적인 상용 컴퓨터 비전 시스템을 구축할 수 있도록 돕습니다.
Ultralytics 전용 엔드포인트가 가진 주요 장점 중 하나는 전 세계 43개 지역에 모델을 배포할 수 있다는 점입니다. 이 지역들은 북미, 남미, 유럽, 아시아 태평양, 중동 및 아프리카를 포함하여 전 세계 여러 지역에 걸쳐 있습니다.

애플리케이션이 실행되는 위치와 더 가까운 리전에 모델을 배포하면, 애플리케이션이 이미지를 전송하고 예측 결과를 수신하는 데 걸리는 시간인 지연 시간을 줄이는 데 도움이 됩니다. 또한 데이터 처리를 데이터 발생지와 더 가까운 곳에서 수행함으로써, 조직이 데이터 개인정보 보호 및 데이터 거주 요건을 충족하는 데도 기여할 수 있습니다.
로봇 시스템, 사물인터넷(IoT) 기기, 산업용 검사 파이프라인, 스마트 시티 인프라 등 실시간 추론에 의존하는 많은 컴퓨터 비전 애플리케이션에서 저지연성은 매우 중요합니다.
예를 들어, 애플리케이션이 주로 유럽에서 사용되는 경우, 모델을 멀리 떨어진 리전이 아닌 유럽 리전에 배포하면 응답 시간을 크게 단축할 수 있습니다.
특정 리전에 모델을 배포하는 것은 간단하며, 보통 몇 분밖에 걸리지 않습니다. 플랫폼에서 인프라 설정을 처리하므로 개발자는 모델을 애플리케이션에 통합하는 데 집중할 수 있습니다. 이제 관련 단계를 하나씩 살펴보겠습니다.
배포하기 전에 프로젝트에 사용 가능한 훈련된 모델이 필요합니다. 이 모델은 Ultralytics 직접 훈련된 모델이거나, 다른 곳에서 훈련한 후 업로드한 모델, 또는 “탐색 탭”에서 찾은 커뮤니티 프로젝트를 복제한 모델일 수 있습니다. “탐색 탭”에서는 다른 사용자가 공유한 공개 프로젝트를 클릭 한 번으로 자신의 계정으로 복사할 수 있습니다.
모델 준비가 완료되면 프로젝트 내의 모델 페이지를 열어 다음 단계를 진행하세요.
모델의 ‘배포’ 탭으로 이동합니다. 플랫폼의 이 섹션에서는 배포를 구성하고 실행할 수 있습니다.
해당 페이지에서는 전 세계의 사용 가능한 배포 위치를 보여주는 지역 표와 대화형 지도를 확인할 수 있습니다. 이 플랫폼은 사용자의 위치에서 측정된 지연 시간을 기준으로 지역을 정렬하여, 가장 적합한 지역을 선택할 수 있도록 도와줍니다.

사용자나 애플리케이션이 위치한 지역을 선택하세요. 요청의 발생지와 가까운 곳에 모델을 배포하면 응답 시간을 크게 단축할 수 있습니다.
지역을 선택하고 구성을 확인한 후, [배포]를 클릭할 수 있습니다.
그런 다음 플랫폼은 배포 환경을 준비하고, 모델 이미지를 가져온 뒤, 서비스를 시작하며, 엔드포인트가 정상적으로 작동하는지 확인하기 위해 상태 점검을 수행합니다. 이 과정은 보통 1~2분 정도 소요됩니다.
배포가 완료되면 플랫폼은 애플리케이션이 추론 요청을 전송하는 데 사용할 수 있는 고유한 엔드포인트 URL을 생성합니다.

엔드포인트가 실행 중이면, 애플리케이션은 제공된 REST API Authorization 헤더에 전달된 API 키를 사용하여 모델로 이미지를 전송하기 시작할 수 있습니다. 엔드포인트는 각 요청을 처리하고, 감지된 객체, 바운딩 박스 또는 기타 작업별 결과와 같은 예측 결과를 반환합니다.
모델 배포와 관련된 자세한 내용은 Ultralytics 공식 문서를 참조하세요 .
컴퓨터 비전 모델이 배포되면, 그 성능을 모니터링하는 것은 시스템의 신뢰성과 견고성을 유지하는 데 있어 중요한 부분이 됩니다. 아무리 잘 훈련된 모델이라 할지라도, 실제 운영 환경에서 지속적으로 신속하게 반응하고, 들어오는 요청을 적절히 처리하며, 정확한 예측 결과를 제공하는지 확인하기 위해 관찰이 필요합니다.
Ultralytics 배포된 엔드포인트의 성능을 팀이 파악할 수 있도록 지원하는 내장형 모니터링 도구를 제공합니다. 플랫폼의 ‘배포(Deploy)’ 페이지는 모니터링 대시보드 역할을 하며, 실행 중인 모든 엔드포인트에 대한 통합된 보기와 함께 track 상태 및 사용 현황을 track 데 도움이 되는 주요 지표를 제공합니다.
플랫폼을 통해 모니터링할 수 있는 주요 지표는 다음과 같습니다:
이러한 지표 외에도, 이 플랫폼은 엔드포인트 상태 점검 및 배포 로그 기능을 제공합니다. 상태 점검은 엔드포인트가 정상적으로 응답하고 있는지 여부를 알려주며, 로그는 최근 요청 및 시스템 활동에 대한 상세 정보를 제공합니다.
컴퓨터 비전 모델을 배포하는 것은 훈련된 모델을 실제 애플리케이션을 구동하는 시스템으로 전환하는 데 있어 핵심적인 단계입니다. Ultralytics 활용하면 팀은 전 세계 43개 지역에 위치한 전용 엔드포인트를 통해 모델을 손쉽게 배포하고, API를 통해 실시간 추론을 실행하며, 단일 환경에서 성능을 모니터링할 수 있습니다. 유연한 배포 옵션, 내장형 모니터링 기능, 확장 가능한 인프라를 결합한 이 플랫폼은 개발자가 훈련된 머신러닝 모델을 신뢰할 수 있는 컴퓨터 비전 애플리케이션으로 더 빠르게 전환할 수 있도록 지원합니다.
점점 성장하는 커뮤니티에 참여하세요! GitHub 저장소에서 AI에 대해 자세히 알아보세요. 컴퓨터 비전 솔루션 구축에 관심이 있다면 라이선스 옵션을 확인해 보세요. 헬스케어 분야의 컴퓨터 비전의 이점을 살펴보고 물류 분야의 AI가 어떻게 변화를 만들어내는지 확인해 보세요!

미래의 머신러닝 여정을 시작하세요