동일한 모델을 여러 지역에 배포할 수 있습니까?

네. 각 모델은 동시에 여러 지역에 배포할 수 있습니다. 플랜에 따라 사용 가능한 총 엔드포인트 수가 결정됩니다(무료 3개, Pro 10개, Enterprise 무제한). 이를 통해 각 지역에서 지연 시간이 짧은 엔드포인트로 전 세계 사용자에게 서비스를 제공할 수 있습니다.

배포 비용은 얼마입니까?

전용 엔드포인트는 CPU, 메모리 및 요청 볼륨에 따라 비용이 청구됩니다. 기본적으로 scale-to-zero 기능이 활성화되어 있어 활성 추론 시간에 대해서만 비용을 지불합니다. 엔드포인트가 요청을 받지 않는 동안에는 비용이 발생하지 않습니다. 공유 추론은 플랫폼 플랜에 포함되어 있습니다.

공유 추론과 전용 추론의 차이점은 무엇입니까?

공유 추론은 3개 지역에서 멀티 테넌트 서비스로 실행되며 분당 20개의 요청으로 속도가 제한됩니다. 개발 및 빠른 테스트에 가장 적합합니다. 전용 엔드포인트는 속도 제한 없이 43개 지역 어디에나 배포되는 단일 테넌트 서비스로, 일관된 지연 시간과 구성 가능한 리소스를 제공하며 확장 가능한 프로덕션 워크로드를 위해 구축되었습니다.

배포하는 데 얼마나 걸립니까?

전용 엔드포인트 배포에는 일반적으로 1\2분이 소요됩니다. 여기에는 컨테이너 프로비저닝, 시작 및 서비스가 준비되었는지 확인하는 초기 상태 검사가 포함됩니다. 엔드포인트가 준비되면 즉시 추론 요청 수락을 시작합니다.

모델 배포란 무엇입니까?

모델 배포는 학습된 컴퓨터 비전 모델이 실세계 데이터를 수신하고 처리할 수 있게 만드는 과정입니다. 배포가 완료되면 컴퓨터 비전 애플리케이션은 API를 통해 이미지와 비디오 프레임을 모델로 보내고 예측값을 받을 수 있어 자동 품질 검사부터 프로덕션 시스템의 실시간 객체 탐지까지 모든 것을 구현할 수 있습니다. Ultralytics Platform에서 배포는 엔드투엔드 학습 워크플로우에 직접 통합됩니다. 모델 학습이 완료되면 브라우저에서 테스트하고, 43개의 글로벌 지역 중 어디든 전용 엔드포인트에 배포하고, 동일한 워크스페이스에서 성능을 모니터링할 수 있습니다.

Ultralytics 플랫폼

42개 글로벌 리전에 컴퓨터 비전 모델을 배포하십시오

자동 확장, 실시간 모니터링, 20개의 내보내기 형식을 갖추어 브라우저 테스트부터 프로덕션 엔드포인트까지 클릭 몇 번으로 학습된 모델을 배포할 수 있습니다.

라이선스 요청 브라우저 추론 체험하기

글로벌 프로덕션 규모로 배포

전 세계적인 가용성, 광범위한 내보내기 지원, Ultralytics 생태계에서 검증된 사용량을 바탕으로 학습된 모델을 프로덕션으로 전환하십시오.

42+

배포 지역

19+

내보내기 형식

—

일일 사용량

전 세계 42개 리전에 배포하십시오

아메리카, 유럽, 아시아 태평양, 중동 지역의 전용 엔드포인트에 모델을 배포하십시오. 각 엔드포인트는 고유한 URL, 자동 확장 및 모니터링 기능을 갖추고 있습니다.

트래픽에 맞춘 자동 확장

전용 엔드포인트는 트래픽 급증 시 확장되고 유휴 상태일 때는 0으로 축소됩니다.

기본적으로 0으로 확장(Scale to zero): 엔드포인트가 요청을 받지 않을 때는 비용이 발생하지 않습니다.
속도 제한 없음: 전용 엔드포인트에는 처리량 제한이 없습니다.
구성 가능한 리소스: 워크로드에 맞춰 CPU(1-8코어)와 메모리(1-32GB)를 선택하십시오.

ONNX, TensorRT, CoreML, LiteRT 및 기타 형식을 위한 모델 내보내기 형식 선택기입니다.

20개의 내보내기 형식. 사용자의 모델. 모든 환경.

Ultralytics Platform은 고성능을 위한 클라우드 및 엣지 배포를 지원합니다. 모든 Ultralytics YOLO 모델은 다양한 환경에서 효율적으로 실행되도록 기본적으로 최적화되어 있으며, 컴퓨팅 리소스가 제한된 엣지 장치에서도 높은 정확도, 안정적인 성능 및 호환성을 제공합니다.

프로덕션의 모든 것을 모니터링하십시오

모델 성능에 대한 완전한 실시간 가시성을 확보하십시오. 모델이 라이브 상태가 되면 배포 대시보드를 통해 실행 중인 모든 엔드포인트에 대한 중앙 집중식 개요와 프레임워크를 최적화하고 안정적으로 유지하는 데 필요한 메트릭 및 툴킷을 제공받을 수 있습니다.

요청 볼륨: 지난 24시간 동안 모든 엔드포인트에 걸친 총 요청 수.
P95 지연 시간: 실제 사용 사례 성능을 추적하기 위한 95번째 백분위수 응답 시간.
오류율: 오류율이 5%를 초과할 때 명확한 알림을 제공하며, 문제를 빠르게 진단하기 위해 심각도별로 필터링된 로그를 지원합니다.
상태 확인: 자동 재시도를 포함한 실시간 엔드포인트 모니터링. 확인당 지연 시간이 표시됩니다.

몇 분 만에 통합

배포된 모든 엔드포인트는 실제 엔드포인트 URL과 API 키가 미리 입력된 Python, JavaScript 및 cURL 형식의 자동 생성된 코드 예제를 제공합니다. 복사하여 붙여넣고 어떤 애플리케이션에서든 추론 요청을 시작하십시오.

브라우저에서 모델 테스트하기

모든 학습된 모델에는 내장된 Predict 탭 기능이 포함되어 있습니다. 이미지를 업로드하거나 카메라를 열면 즉시 BBox가 나타납니다.

이미지를 업로드하거나 파라미터를 변경하면 추론이 자동으로 최상의 모델 성능으로 실행됩니다.

신뢰도 임계값, IoU 설정 및 이미지 크기를 미세 조정하여 실시간으로 예측에 어떤 영향을 미치는지 확인하십시오.

Detection, instance segmentation, semantic segmentation, classification, pose estimation 및 OBB가 사용자의 작업에 맞춰 명확하게 제시됩니다.

YOLO26 추론 테스트

이미지를 드래그 앤 드롭하여 실시간 객체 감지를 확인하십시오

라이브 데모

입력 이미지

이미지를 업로드하거나 예시를 선택하여 테스트하십시오 yolo26n. 예측 문서

여기에 이미지를 드롭하십시오

또는 클릭하여 탐색

JPEG, PNG, WebP, AVIF, HEIC, JP2, TIFF, BMP 등을 지원합니다 (최대 10MB)

또는 예시 테스트

신뢰도

0.25

IoU

0.70

이미지 크기

640

API 문서

모델을 배포하여 API 키 인증이 포함된 전용 추론 엔드포인트를 확보하십시오. 그 후 아래의 자리 표시자 URL과 키를 배포 값으로 교체하십시오. 배포 문서

참고: 이것은 예제 코드입니다. 먼저 모델을 배포하여 엔드포인트 URL과 API 키를 받으십시오.

import requests

# Replace with your deployment URL and API key
url = "https://your-deployment-url.run.app/predict"
api_key = "YOUR_API_KEY"

# Optional inference parameters (conf, iou, imgsz)
args = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

with open("image.jpg", "rb") as f:
    response = requests.post(
        url,
        headers={"Authorization": f"Bearer {api_key}"},
        data=args,
        files={"file": f},
    )

print(response.json())

배포 방법을 알아보십시오!

학습된 모델을 테스트하고, 글로벌 엔드포인트에 배포하며, 성능을 모니터링하는 방법을 시청하십시오.

산업 솔루션 탐색

팀들이 프로덕션 환경에서 어떻게 Ultralytics 컴퓨터 비전을 적용하는지 확인해 보십시오.

로봇 공학에서의 AI

Ultralytics YOLO 모델로 더 스마트한 기기를 구동하십시오. 로봇 공학의 비전 AI는 자율 주행, 인식, 객체 추적 및 실시간 제어를 촉진합니다.

42개 글로벌 리전에 컴퓨터 비전 모델을 배포하십시오

글로벌 프로덕션 규모로 배포

전 세계 42개 리전에 배포하십시오

트래픽에 맞춘 자동 확장

20개의 내보내기 형식. 사용자의 모델. 모든 환경.

프로덕션의 모든 것을 모니터링하십시오

몇 분 만에 통합

브라우저에서 모델 테스트하기

YOLO26 추론 테스트

배포 방법을 알아보십시오!

산업 솔루션 탐색

로봇 공학에서의 AI

물류 분야의 AI

소매업에서의 AI

의료 분야의 AI

제조 분야의 AI

자동차 분야의 AI

농업 분야의 AI

로봇 공학에서의 AI

물류 분야의 AI

소매업에서의 AI

의료 분야의 AI

제조 분야의 AI

자동차 분야의 AI

농업 분야의 AI

로봇 공학에서의 AI

물류 분야의 AI

소매업에서의 AI

의료 분야의 AI

제조 분야의 AI

자동차 분야의 AI

농업 분야의 AI

자주 묻는 질문

오늘 배포를 시작하십시오!