Posso implantar o mesmo modelo em várias regiões?

Sim. Cada modelo pode ser implantado em várias regiões simultaneamente. Seu plano determina o número total de endpoints disponíveis: 3 para o Gratuito, 10 para o Pro e ilimitado para o Enterprise. Isso permite que você atenda usuários globalmente com endpoints de baixa latência em cada região.

Quanto custa a implantação?

Endpoints dedicados são cobrados com base em CPU, memória e volume de solicitações. Com o dimensionamento para zero ativado por padrão, você paga apenas pelo tempo de inferência ativo. Não há custo quando seu endpoint não está recebendo solicitações. A inferência compartilhada está incluída no seu plano de plataforma.

Qual a diferença entre inferência compartilhada e dedicada?

A inferência compartilhada é executada em um serviço multilocatário em 3 regiões e tem taxa limitada a 20 solicitações por minuto. É melhor para desenvolvimento e testes rápidos. Endpoints dedicados são serviços de locatário único implantados em qualquer uma das 43 regiões sem limites de taxa, latência consistente e recursos configuráveis, criados para cargas de trabalho de produção escaláveis.

Quanto tempo leva a implantação?

A implantação de endpoint dedicado normalmente leva de um a dois minutos. Isso inclui provisionamento de contêiner, inicialização e uma verificação de integridade inicial para validar se o serviço está pronto. Assim que o endpoint estiver pronto, ele começa a aceitar solicitações de inferência imediatamente.

O que é a implantação de modelo?

A implantação de modelo é o processo de tornar um modelo de visão computacional treinado disponível para receber e processar dados do mundo real. Uma vez implantadas, as aplicações de visão computacional podem enviar imagens e quadros de vídeo para o modelo via API e receber previsões, permitindo tudo, desde inspeção de qualidade automatizada até detecção de objetos em tempo real em sistemas de produção. Na Ultralytics Platform, a implantação é integrada diretamente ao fluxo de trabalho de treinamento de ponta a ponta. Depois que seu modelo for treinado, você pode testá-lo no navegador, implantá-lo em um endpoint dedicado em qualquer uma das 43 regiões globais e monitorar seu desempenho, tudo a partir do mesmo espaço de trabalho.

Plataforma Ultralytics

Implementa modelos de visão computacional em 42 regiões globais

Os teus modelos treinados desde os testes no navegador até aos pontos finais de produção em poucos cliques com dimensionamento automático, monitorização em tempo real e 20 formatos de exportação.

Solicitar licença Experimente a inferência no navegador

Interface de implementação do Ultralytics mostrando as opções de implementação de modelos.

Implante em escala de produção global

Leve modelos treinados para produção com disponibilidade mundial, amplo suporte a exportação e o volume de uso comprovado pelo ecossistema Ultralytics.

42+

Regiões de implantação

19+

Formatos de exportação

—

Usos diários

Cartão de implementação Ultralytics para um modelo de visão computacional treinado.

Implementa em 42 regiões em todo o mundo

Implemente seus modelos em endpoints dedicados nas Américas, Europa, Ásia-Pacífico e Oriente Médio. Cada endpoint possui sua própria URL, escalonamento automático e monitoramento.

Visualização de implementação com escalonamento automático para endpoints de inferência do Ultralytics.

Escalonamento automático que acompanha o seu tráfego

Endpoints dedicados aumentam a capacidade em picos de tráfego e reduzem a zero quando ociosos.

Escalonar para zero por padrão: Sem custo quando seu endpoint não estiver recebendo solicitações.
Sem limites de taxa: Endpoints dedicados não possuem limites de throughput.
Recursos configuráveis: Escolha CPU (1-8 núcleos) e memória (1-32 GB) para atender à sua carga de trabalho.

Seletor de formato de exportação de modelo para ONNX, TensorRT, CoreML, LiteRT e outros formatos.

20 formatos de exportação. O teu modelo. Qualquer ambiente.

A Ultralytics Platform suporta implementação em nuvem e edge para alto desempenho. Todos os modelos YOLO da Ultralytics são nativamente otimizados para executar com eficiência em diversos ambientes, oferecendo alta precisão, desempenho confiável e compatibilidade até mesmo em dispositivos de edge com recursos de computação limitados.

Painel de monitoramento Ultralytics para inferência de modelos implementados.

Monitore tudo em produção

Visibilidade total e em tempo real do desempenho dos seus modelos. Assim que seus modelos estiverem ativos, o painel de implementações oferece uma visão geral centralizada de cada endpoint em execução, com as métricas e ferramentas necessárias para otimizar e manter suas estruturas funcionando de forma confiável.

Volume de solicitações: Total de solicitações em todos os endpoints nas últimas 24 horas.
Latência P95: Tempo de resposta do 95º percentil para acompanhar o desempenho em casos de uso do mundo real.
Taxas de erro: Alertas claros quando as taxas de erro excedem 5%, com logs filtrados por gravidade para diagnosticar problemas rapidamente.
Verificações de integridade: Monitoramento de endpoint em tempo real com repetição automática. Latência exibida por verificação.

Trecho de código Python para enviar uma imagem a um endpoint de implementação.

Integre em minutos

Cada endpoint implementado vem com exemplos de código gerados automaticamente em Python, JavaScript e cURL, pré-preenchidos com a URL do seu endpoint e sua API key. Copie, cole e comece a enviar solicitações de inferência de qualquer aplicação.

Teste seu modelo no navegador

Todo modelo treinado inclui uma funcionalidade integrada na aba Predict. Faça upload de uma imagem ou abra sua câmera; as caixas delimitadoras aparecem instantaneamente.

A inferência executa o desempenho máximo do modelo automaticamente quando você faz upload de uma imagem ou altera um parâmetro.

Ajuste os limiares de confiança, configurações de IoU e tamanho da imagem para ver como eles afetam as predições em tempo real.

Deteção, segmentação de instâncias, segmentação semântica, classificação, estimativa de pose e OBB são claramente descritas para a tua tarefa.

Aba de implementação de endpoint na nuvem na Ultralytics Platform.

Experimente a inferência do YOLO26

Arraste e solte uma imagem para ver a detecção de objetos em tempo real

Demonstração ao vivo

Imagem de entrada

Envie uma imagem ou selecione um exemplo para testar yolo26n. Documentação de previsão

Solte uma imagem aqui

ou clique para procurar

Suporta JPEG, PNG, WebP, AVIF, HEIC, JP2, TIFF, BMP e mais (máximo de 10 MB)

Ou experimente um exemplo

Confiança

0.25

IoU

0.70

Tamanho da Imagem

640

Documentação da API

Implementa o teu modelo para obter um endpoint de inferência dedicado com autenticação por chave de API — depois substitui o URL e a chave abaixo pelos teus valores de implementação. Documentação de implementação

Nota: Este é um código de exemplo. Implementa primeiro o teu modelo para obteres o teu URL de endpoint e chave de API.

import requests

# Replace with your deployment URL and API key
url = "https://your-deployment-url.run.app/predict"
api_key = "YOUR_API_KEY"

# Optional inference parameters (conf, iou, imgsz)
args = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

with open("image.jpg", "rb") as f:
    response = requests.post(
        url,
        headers={"Authorization": f"Bearer {api_key}"},
        data=args,
        files={"file": f},
    )

print(response.json())

Aprenda a implementar!

Veja como testar um modelo treinado, implementá-lo em um endpoint global e monitorar o desempenho.

Explore soluções para o setor

Veja como as equipes aplicam a visão computacional da Ultralytics em ambientes de produção.

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Implementa modelos de visão computacional em 42 regiões globais

Implante em escala de produção global

Implementa em 42 regiões em todo o mundo

Escalonamento automático que acompanha o seu tráfego

20 formatos de exportação. O teu modelo. Qualquer ambiente.

Monitore tudo em produção

Integre em minutos

Teste seu modelo no navegador

Experimente a inferência do YOLO26

Aprenda a implementar!

Explore soluções para o setor

IA em robótica

IA na Logística

IA no varejo

IA na Saúde

IA na Fabricação

IA no Setor Automóvel

IA na Agricultura

IA em robótica

IA na Logística

IA no varejo

IA na Saúde

IA na Fabricação

IA no Setor Automóvel

IA na Agricultura

IA em robótica

IA na Logística

IA no varejo

IA na Saúde

IA na Fabricação

IA no Setor Automóvel

IA na Agricultura

Perguntas frequentes

Começa a implementar hoje!