Yolo Vision Shenzhen
Shenzhen
Junte-se agora

ultralytics

Implemente modelos de IA de visão em 43 regiões globais

Os seus modelos treinados, desde os testes no navegador até aos pontos finais de produção, com apenas alguns cliques, com autoescalabilidade, monitorização em tempo real e mais de 17 formatos de exportação. A solução completa para a implementação de casos de utilização no mundo real.

Interface de utilizador que apresenta opções de exportação para PyTorch , incluindo ONNX, TorchScript, OpenVINO, TensorRT, CoreML, TF , TF SavedModel e TF GraphDef, com um mapa mundial que mostra três implementações a verde e vários marcadores de localização a vermelho.

43+

Regiões de implementação

17+

Formatos de exportação

500+

Implementações ativas

Implementar em 43 regiões em todo o mundo

Implemente os seus modelos em pontos de extremidade dedicados em 43 regiões globais, abrangendo as Américas, a Europa, a Ásia-Pacífico e o Médio Oriente. Cada ponto de extremidade é um serviço de uso exclusivo, com o seu próprio URL, dimensionamento automático e monitorização independente.
Mapa-múndi que mostra vários locais assinalados com alfinetes coloridos na América do Norte, Europa e Ásia.
Painel que apresenta métricas de desempenho do modelo, com mAP50 96,2%, mAP50 a 90,1% e Precisão a 87,2%, juntamente com um painel de registos do modelo de segmentação YOLO26s implementado em Paris.

Escalabilidade automática que se adapta ao seu tráfego

Os terminais dedicados aumentam automaticamente a sua capacidade para lidar com picos de tráfego e reduzem-se a zero quando estão inativos, pelo que nunca paga por recursos de computação que não está a utilizar.

Escalagem para zero por predefinição. Sem custos quando o seu ponto de extremidade não recebe pedidos.

Sem limites de taxa. Sem limites de taxa. Ao contrário da inferência partilhada, os pontos de extremidade dedicados não têm limites de débito, sendo limitados apenas pelos recursos do seu ponto de extremidade.

Recursos configuráveis. Escolha o número de CPU (1–8) e a memória (1–32 GB) de acordo com os requisitos do seu modelo e os padrões de tráfego.

Mais de 17 formatos de exportação. O seu modelo. Qualquer ambiente.

Ultralytics suporta implementações tanto na nuvem como no perímetro. TodosYOLO Ultralytics estão otimizados de forma nativa para funcionar com eficiência em todos os ambientes, proporcionando um desempenho fiável mesmo em hardware com recursos computacionais limitados.

Lista de formatos de exportação para PyTorch , incluindo ONNX, TorchScript, OpenVINO, TensorRT GPU, CoreML e TF , com os respetivos ícones e códigos de formato.
Painel que mostra um total de 13 959 pedidos, 3 implementações ativas, uma taxa de erro de 0% e uma latência P95 de 14 ms nas últimas 24 horas.

Monitorizar tudo o que está em produção

Visibilidade total em tempo real do desempenho dos seus modelos. Assim que os seus modelos estiverem em produção, o painel de implementações oferece-lhe uma visão geral centralizada de todos os pontos finais em execução, com as métricas necessárias para garantir o funcionamento fiável das suas estruturas.

Volume de pedidos. Total de pedidos em todos os pontos de extremidade nas últimas 24 horas.

Latência P95. Tempo de resposta no percentil 95 para track o desempenho em cenários de utilização track .

Taxas de erro. Alertas destacados quando as taxas de erro excedem os 5%, com registos filtrados por gravidade para o ajudar a diagnosticar problemas rapidamente.

Verificações de integridade. Indicadores de estado em tempo real com nova tentativa automática quando os pontos finais apresentam falhas. A latência de resposta é apresentada junto a cada verificação.

Integre em poucos minutos

Cada ponto de extremidade implementado inclui exemplos de código gerados automaticamente em Python, JavaScript e cURL, já preenchidos com o URL real do seu ponto de extremidade e a sua chave API. Basta copiar, colar e começar a enviar pedidos de inferência a partir de qualquer aplicação.

Trecho Python para enviar uma imagem para um ponto final de implementação utilizando a biblioteca requests, com parâmetros de autorização e inferência.

É preciso treinar um modelo primeiro?

Ultralytics integra a anotação, a formação e a implementação numa única plataforma.

Perguntas mais frequentes

Posso implementar o mesmo modelo em várias regiões?

Sim. Cada modelo pode ser implementado em várias regiões simultaneamente . O seu plano determina o número total de pontos de extremidade disponíveis: 3 na versão Gratuita, 10 na versão Pro e ilimitados na versão Enterprise. Isto permite-lhe atender utilizadores em todo o mundo com pontos de extremidade de baixa latência em cada região.

Quanto custa a implementação?

Os pontos de extremidade dedicados são faturados com base na CPU, na memória e no volume de pedidos. Com a funcionalidade «scale-to-zero» ativada por predefinição, só paga pelo tempo de inferência ativo; não há custos quando o seu ponto de extremidade não está a receber pedidos. A inferência partilhada está incluída no seu plano de plataforma.

Qual é a diferença entre inferência partilhada e inferência dedicada?

A inferência partilhada é executada num serviço multitenant em 3 regiões e está limitada a 20 pedidos por minuto. É ideal para desenvolvimento e testes rápidos. Os pontos de extremidade dedicados são serviços single-tenant implementados em qualquer uma das 43 regiões, sem limites de taxa, com latência consistente e recursos configuráveis, concebidos para cargas de trabalho de produção escaláveis.

Quanto tempo demora a implementação?

A implementação de um ponto de extremidade dedicado demora normalmente entre um a dois minutos. Este processo inclui o aprovisionamento do contentor, o arranque e uma verificação inicial do estado para confirmar que o serviço está pronto. Assim que o ponto de extremidade estiver pronto, começa imediatamente a aceitar pedidos de inferência .

O que é implantação de modelo?

A implementação de modelos é o processo de disponibilizar um modelo de visão computacional treinado para receber e processar dados do mundo real. Uma vez implementadas, as aplicações de visão computacional podem enviar imagens e fotogramas de vídeo para o modelo através de uma API e receber previsões, permitindo desde a inspeção automatizada da qualidade até à deteção de objetos em tempo real em sistemas de produção. Na Ultralytics , a implementação está integrada diretamente no fluxo de trabalho de treino de ponta a ponta. Assim que o seu modelo estiver treinado, pode testá-lo no navegador, implementá-lo num ponto final dedicado em qualquer uma das 43 regiões globais e monitorizar o seu desempenho, tudo a partir do mesmo espaço de trabalho.

Comece a implementar hoje mesmo

Leve os seus modelos treinados para produção em 43 regiões globais com autoescalabilidade e monitorização em tempo real.