ultralytics
Os seus modelos treinados, desde os testes no navegador até aos terminais de produção, com apenas alguns cliques, com autoescalonamento, monitorização em tempo real e mais de 17 formatos de exportação.

43+
Regiões de implementação
17+
Formatos de exportação
Mais de 2,7 mil milhões
Usos diários





Os terminais dedicados aumentam a sua capacidade para fazer face a picos de tráfego e reduzem-se a zero quando estão inativos.
Escalagem para zero por predefinição. Sem custos quando o seu ponto de extremidade não recebe pedidos.
Sem limites de taxa. Os pontos de extremidade dedicados não têm limites de largura de banda.
Recursos configuráveis. Escolha CPU 1 a 8 núcleos) e a memória (1 a 32 GB) de acordo com a sua carga de trabalho.
Ultralytics suporta implementações na nuvem e na periferia para um desempenho de alto nível. TodosYOLO Ultralytics estão otimizados de forma nativa para funcionar com eficiência em diversos ambientes, proporcionando alta precisão, desempenho fiável e compatibilidade, mesmo em dispositivos periféricos com recursos computacionais limitados.


Visibilidade completa em tempo real do desempenho dos seus modelos. Assim que os seus modelos estiverem em produção, o painel de implementações oferece-lhe uma visão geral centralizada de todos os pontos finais em execução, com as métricas e as ferramentas necessárias para otimizar e manter as suas estruturas a funcionar de forma fiável.
Volume de pedidos. Total de pedidos em todos os pontos de extremidade nas últimas 24 horas.
Latência P95. Tempo de resposta no percentil 95 para track o desempenho em cenários de utilização track .
Taxas de erro. Alertas claros quando as taxas de erro excedem os 5 %, com registos filtrados por gravidade para diagnosticar rapidamente os problemas.
Verificações de integridade. Monitorização em tempo real dos pontos finais com repetição automática. Latência apresentada por verificação.
Cada ponto de extremidade implementado inclui exemplos de código gerados automaticamente em Python, JavaScript e cURL, já preenchidos com o URL real do seu ponto de extremidade e a sua chave API. Basta copiar, colar e começar a enviar pedidos de inferência a partir de qualquer aplicação.

1
Anotar
2
Trem
3
Implante
Sim. Cada modelo pode ser implementado em várias regiões simultaneamente . O seu plano determina o número total de pontos de extremidade disponíveis: 3 na versão Gratuita, 10 na versão Pro e ilimitados na versão Enterprise. Isto permite-lhe atender utilizadores em todo o mundo com pontos de extremidade de baixa latência em cada região.
Os pontos de extremidade dedicados são faturados com base na CPU, na memória e no volume de pedidos. Com a funcionalidade «scale-to-zero» ativada por predefinição, só paga pelo tempo de inferência ativo; não há custos quando o seu ponto de extremidade não está a receber pedidos. A inferência partilhada está incluída no seu plano de plataforma.
A inferência partilhada é executada num serviço multitenant em 3 regiões e está limitada a 20 pedidos por minuto. É ideal para desenvolvimento e testes rápidos. Os pontos de extremidade dedicados são serviços single-tenant implementados em qualquer uma das 43 regiões, sem limites de taxa, com latência consistente e recursos configuráveis, concebidos para cargas de trabalho de produção escaláveis.
A implementação de um ponto de extremidade dedicado demora normalmente entre um a dois minutos. Este processo inclui o aprovisionamento do contentor, o arranque e uma verificação inicial do estado para confirmar que o serviço está pronto. Assim que o ponto de extremidade estiver pronto, começa imediatamente a aceitar pedidos de inferência .
A implementação de modelos é o processo de disponibilizar um modelo de visão computacional treinado para receber e processar dados do mundo real. Uma vez implementadas, as aplicações de visão computacional podem enviar imagens e fotogramas de vídeo para o modelo através de uma API e receber previsões, permitindo desde a inspeção automatizada da qualidade até à deteção de objetos em tempo real em sistemas de produção. Na Ultralytics , a implementação está integrada diretamente no fluxo de trabalho de treino de ponta a ponta. Assim que o seu modelo estiver treinado, pode testá-lo no navegador, implementá-lo num ponto final dedicado em qualquer uma das 43 regiões globais e monitorizar o seu desempenho, tudo a partir do mesmo espaço de trabalho.
Leve os seus modelos treinados para produção em 43 regiões globais com autoescalabilidade e monitorização em tempo real.