Yolo 비전 선전
선전
지금 참여하기

ultralytics

전 세계 43개 지역에 컴퓨터 비전 모델을 배포하세요

몇 번의 클릭만으로 훈련된 모델을 브라우저 테스트 환경부터 프로덕션 엔드포인트까지 배포할 수 있으며, 자동 확장, 실시간 모니터링 및 17가지 이상의 내보내기 형식을 지원합니다.

ONNX, TorchScript, OpenVINO, TensorRT, CoreML, TF , TF SavedModel, TF GraphDef 등 PyTorch 내보내기 옵션을 표시하는 사용자 인터페이스로, 세계 지도에는 녹색으로 표시된 3개의 배포 위치와 여러 개의 빨간색 위치 핀이 표시되어 있습니다.

43+

배포 지역

17+

내보내기 형식

28억 이상

일상적인 용도

전 세계 43개 지역에 배포

미주, 유럽, 아시아태평양 및 중동 지역의 전용 엔드포인트에 모델을 배포하세요. 각 엔드포인트는 고유한 URL, 자동 확장 및 모니터링 기능을 갖추고 있습니다.
미주, 유럽, 아시아·태평양, 중동 지역에 마커로 표시된 배치 지역을 보여주는 세계 지도로, 전 세계적인 인프라 커버리지를 나타냅니다.
파리에 배포된 YOLO26s 분할 모델의 로그 패널과 함께, mAP50 96. mAP50 , mAP50 90.1%, 정밀도 87.2 mAP50 모델 성능 지표를 보여주는 대시보드.

트래픽에 맞춰 자동으로 확장되는 기능

전용 엔드포인트는 트래픽이 급증하면 확장되고, 유휴 상태일 때는 0개로 축소됩니다.

기본적으로 사용량이 0으로 조정됩니다. 엔드포인트가 요청을 수신하지 않을 때는 비용이 발생하지 않습니다 .

속도 제한 없음. 전용 엔드포인트에는 처리량 제한이 없습니다.

구성 가능한 리소스. 워크로드에 맞춰 CPU 1~8코어)와 메모리(1~32GB)를 선택하세요.

17가지 이상의 내보내기 형식. 여러분의 모델. 어떤 환경에서도.

Ultralytics 고성능을 위해 클라우드 및 엣지 배포를 지원합니다. 모든 Ultralytics YOLO 다양한 환경에서 효율적으로 실행되도록 기본적으로 최적화되어 있어, 컴퓨팅 리소스가 제한적인 엣지 디바이스에서도 높은 정확도와 안정적인 성능, 그리고 호환성을 제공합니다.

ONNX, TorchScript, OpenVINO, TensorRT GPU, CoreML, TF 등을 포함한 PyTorch 내보내기 형식 목록과 각 형식의 아이콘 및 코드.
지난 24시간 동안 총 13,959건의 요청, 3건의 활성 배포, 0%의 오류율, 14ms의 P95 지연 시간을 보여주는 대시보드.

프로덕션 환경의 모든 것을 모니터링합니다

모델 성능에 대한 완벽한 실시간 가시성을 확보하세요. 모델이 배포되면 배포 대시보드를 통해 실행 중인 모든 엔드포인트를 한눈에 확인할 수 있으며, 프레임워크를 안정적으로 운영하고 최적화하는 데 필요한 메트릭과 도구 모음을 제공합니다.

요청 건수. 지난 24시간 동안 모든 엔드포인트에 대한 요청 건수.

P95 지연 시간. track 사용 사례의 성능을 track 위한 응답 시간의 95번째 백분위수.

오류율. 오류율이 5%를 초과할 경우 경고를 표시하며 , 심각도별로 필터링된 로그를 통해 문제를 신속하게 진단할 수 있습니다.

상태 점검. 자동 재시도 기능이 포함된 실시간 엔드포인트 모니터링. 점검별 지연 시간 표시.

몇 분 만에 통합하세요

배포된 모든 엔드포인트에는 Python, JavaScript 및 cURL용 자동 생성 코드 예제가 포함되어 있으며, 여기에는 사용자의 실제 엔드포인트 URL과 API 키가 미리 입력되어 있습니다. 코드를 복사하여 붙여넣기만 하면 어떤 애플리케이션에서든 추론 요청을 보낼 수 있습니다.

인증 및 추론 매개변수를 사용하여 requests 라이브러리를 통해 이미지를 배포 엔드포인트로 전송하는 Python 예제.

먼저 모델을 학습시켜야 하나요?

Ultralytics 주석 달기, 훈련, 배포를 하나의 플랫폼에서 통합합니다.

1

주석 달기

2

훈련

3

배포

자주 묻는 질문

동일한 모델을 여러 리전에 배포할 수 있나요?

네. 각 모델은 여러 리전에 동시에 배포할 수 있습니다. 이용 가능한 엔드포인트의 총 수는 요금제에 따라 결정되며, Free 요금제는 3개, Pro 요금제는 10개, Enterprise 요금제는 무제한입니다. 이를 통해 각 리전의 저지연 엔드포인트를 활용하여 전 세계 사용자에게 서비스를 제공할 수 있습니다.

배치 비용은 얼마인가요?

전용 엔드포인트는 CPU, 메모리 및 요청량을 기준으로 요금이 부과됩니다. 기본적으로 'scale-to-zero' 기능이 활성화되어 있으므로, 활성 추론 시간에만 요금이 부과되며 엔드포인트가 요청을 수신하지 않을 때는 비용이 발생하지 않습니다. 공유 추론 기능은 플랫폼 요금제에 포함되어 있습니다.

공유 추론과 전용 추론의 차이점은 무엇인가요?

공유 추론 서비스는 3개 리전에 걸쳐 제공되는 멀티 테넌트 서비스로, 분당 20건의 요청으로 속도 제한이 적용됩니다. 이 서비스는 개발 및 신속한 테스트에 가장 적합합니다. 전용 엔드포인트는 43개 리전 중 어디에나 배포 가능한 싱글 테넌트 서비스로, 속도 제한이 없으며 일관된 지연 시간을 제공하며 리소스를 구성할 수 있어 확장 가능한 프로덕션 워크로드에 최적화되어 있습니다.

배포에는 얼마나 걸리나요?

전용 엔드포인트 배포에는 일반적으로 1~2분이 소요됩니다. 여기에는 컨테이너 프로비저닝, 시작 절차, 그리고 서비스가 준비되었는지 확인하기 위한 초기 상태 점검이 포함됩니다. 엔드포인트가 준비되면 즉시 추론 요청을 수락하기 시작합니다.

모델 배포란 무엇인가요?

모델 배포란, 훈련된 컴퓨터 비전 모델이 실제 데이터를 수신하고 처리할 수 있도록 준비하는 과정을 말합니다. 배포가 완료되면 컴퓨터 비전 애플리케이션은 API를 통해 모델에 이미지와 비디오 프레임을 전송하고 예측 결과를 받아올 수 있으며, 이를 통해 자동화된 품질 검사부터 생산 시스템에서의 실시간 물체 탐지까지 다양한 작업을 수행할 수 있습니다. Ultralytics 배포 기능이 엔드투엔드 훈련 워크플로우에 직접 통합되어 있습니다. 모델 훈련이 완료되면 동일한 작업 공간에서 브라우저를 통해 모델을 테스트하고, 전 세계 43개 지역 중 원하는 곳의 전용 엔드포인트에 배포하며, 성능을 모니터링할 수 있습니다.

지금 바로 배포를 시작하세요!

자동 확장 및 실시간 모니터링 기능을 통해 훈련된 모델을 전 세계 43개 지역에서 운영 환경에 배포하세요.