ultralytics
단 몇 번의 클릭만으로 브라우저 테스트 단계부터 프로덕션 엔드포인트까지 훈련된 모델을 배포할 수 있으며, 자동 확장, 실시간 모니터링, 17가지 이상의 내보내기 형식을 지원합니다. 실제 사용 사례 배포를 위한 엔드투엔드 솔루션입니다.

43+
배포 지역
17+
내보내기 형식
500+
현재 진행 중인 배포





전용 엔드포인트는 트래픽 급증 시 자동으로 확장되고, 유휴 상태일 때는 0으로 축소되므로 사용하지 않는 컴퓨팅 리소스에 대한 비용을 지불할 필요가 없습니다.
기본적으로 사용량이 0으로 조정됩니다. 엔드포인트가 요청을 수신하지 않을 때는 비용이 발생하지 않습니다 .
속도 제한 없음. 속도 제한 없음. 공유 추론과 달리, 전용 엔드포인트에는 처리량 상한선이 없으며, 오직 해당 엔드포인트의 리소스 용량에 의해서만 제한됩니다.
구성 가능한 리소스. 모델의 요구 사항과 트래픽 패턴에 맞춰 CPU (1~8개)와 메모리(1~32GB)를 선택하세요 .
Ultralytics 클라우드 및 엣지 배포를 모두 지원합니다. 모든 Ultralytics YOLO 다양한 환경에서 효율적으로 실행되도록 기본적으로 최적화되어 있어, 컴퓨팅 리소스가 제한적인 하드웨어에서도 안정적인 성능을 제공합니다.


모델의 성능을 실시간으로 완벽하게 파악할 수 있습니다. 모델이 배포되면 배포 대시보드를 통해 실행 중인 모든 엔드포인트를 한눈에 확인할 수 있으며, 프레임워크를 안정적으로 운영하기 위해 필요한 메트릭도 함께 제공됩니다.
요청 건수. 지난 24시간 동안 모든 엔드포인트에 대한 총 요청 건수.
P95 지연 시간. track 사용 사례의 성능을 track 위한 응답 시간의 95번째 백분위수.
오류율. 오류율이 5%를 초과할 경우 경고를 강조 표시하며, 심각도별로 필터링된 로그를 통해 문제를 신속하게 진단할 수 있도록 지원합니다.
상태 점검. 엔드포인트 상태가 비정상일 경우 자동으로 재시도하는 실시간 상태 표시기. 각 점검 항목 옆에 응답 지연 시간이 표시됩니다.
배포된 모든 엔드포인트에는 Python, JavaScript 및 cURL용 자동 생성 코드 예제가 포함되어 있으며, 여기에는 사용자의 실제 엔드포인트 URL과 API 키가 미리 입력되어 있습니다. 코드를 복사하여 붙여넣기만 하면 어떤 애플리케이션에서든 추론 요청을 보낼 수 있습니다.

네. 각 모델은 여러 리전에 동시에 배포할 수 있습니다. 이용 가능한 엔드포인트의 총 수는 요금제에 따라 결정되며, Free 요금제는 3개, Pro 요금제는 10개, Enterprise 요금제는 무제한입니다. 이를 통해 각 리전의 저지연 엔드포인트를 활용하여 전 세계 사용자에게 서비스를 제공할 수 있습니다.
전용 엔드포인트는 CPU, 메모리 및 요청량을 기준으로 요금이 부과됩니다. 기본적으로 'scale-to-zero' 기능이 활성화되어 있으므로, 활성 추론 시간에만 요금이 부과되며 엔드포인트가 요청을 수신하지 않을 때는 비용이 발생하지 않습니다. 공유 추론 기능은 플랫폼 요금제에 포함되어 있습니다.
공유 추론 서비스는 3개 리전에 걸쳐 제공되는 멀티 테넌트 서비스로, 분당 20건의 요청으로 속도 제한이 적용됩니다. 이 서비스는 개발 및 신속한 테스트에 가장 적합합니다. 전용 엔드포인트는 43개 리전 중 어디에나 배포 가능한 싱글 테넌트 서비스로, 속도 제한이 없으며 일관된 지연 시간을 제공하며 리소스를 구성할 수 있어 확장 가능한 프로덕션 워크로드에 최적화되어 있습니다.
전용 엔드포인트 배포에는 일반적으로 1~2분이 소요됩니다. 여기에는 컨테이너 프로비저닝, 시작 절차, 그리고 서비스가 준비되었는지 확인하기 위한 초기 상태 점검이 포함됩니다. 엔드포인트가 준비되면 즉시 추론 요청을 수락하기 시작합니다.
모델 배포란, 훈련된 컴퓨터 비전 모델이 실제 데이터를 수신하고 처리할 수 있도록 준비하는 과정을 말합니다. 배포가 완료되면 컴퓨터 비전 애플리케이션은 API를 통해 모델에 이미지와 비디오 프레임을 전송하고 예측 결과를 받아올 수 있으며, 이를 통해 자동화된 품질 검사부터 생산 시스템에서의 실시간 물체 탐지까지 다양한 작업을 수행할 수 있습니다. Ultralytics 배포 기능이 엔드투엔드 훈련 워크플로우에 직접 통합되어 있습니다. 모델 훈련이 완료되면 동일한 작업 공간에서 브라우저를 통해 모델을 테스트하고, 전 세계 43개 지역 중 원하는 곳의 전용 엔드포인트에 배포하며, 성능을 모니터링할 수 있습니다.
자동 확장 및 실시간 모니터링 기능을 통해 훈련된 모델을 전 세계 43개 지역에서 운영 환경에 배포하세요.