ultralytics
Os seus modelos treinados, desde os testes no navegador até aos pontos finais de produção, com apenas alguns cliques, com autoescalabilidade, monitorização em tempo real e mais de 17 formatos de exportação. A solução completa para a implementação de casos de utilização no mundo real.

43+
Regiões de implementação
17+
Formatos de exportação
500+
Implementações ativas





Os terminais dedicados aumentam automaticamente a sua capacidade para lidar com picos de tráfego e reduzem-se a zero quando estão inativos, pelo que nunca paga por recursos de computação que não está a utilizar.
Escalagem para zero por predefinição. Sem custos quando o seu ponto de extremidade não recebe pedidos.
Sem limites de taxa. Sem limites de taxa. Ao contrário da inferência partilhada, os pontos de extremidade dedicados não têm limites de débito, sendo limitados apenas pelos recursos do seu ponto de extremidade.
Recursos configuráveis. Escolha o número de CPU (1–8) e a memória (1–32 GB) de acordo com os requisitos do seu modelo e os padrões de tráfego.
Ultralytics suporta implementações tanto na nuvem como no perímetro. TodosYOLO Ultralytics estão otimizados de forma nativa para funcionar com eficiência em todos os ambientes, proporcionando um desempenho fiável mesmo em hardware com recursos computacionais limitados.


Visibilidade total em tempo real do desempenho dos seus modelos. Assim que os seus modelos estiverem em produção, o painel de implementações oferece-lhe uma visão geral centralizada de todos os pontos finais em execução, com as métricas necessárias para garantir o funcionamento fiável das suas estruturas.
Volume de pedidos. Total de pedidos em todos os pontos de extremidade nas últimas 24 horas.
Latência P95. Tempo de resposta no percentil 95 para track o desempenho em cenários de utilização track .
Taxas de erro. Alertas destacados quando as taxas de erro excedem os 5%, com registos filtrados por gravidade para o ajudar a diagnosticar problemas rapidamente.
Verificações de integridade. Indicadores de estado em tempo real com nova tentativa automática quando os pontos finais apresentam falhas. A latência de resposta é apresentada junto a cada verificação.
Cada ponto de extremidade implementado inclui exemplos de código gerados automaticamente em Python, JavaScript e cURL, já preenchidos com o URL real do seu ponto de extremidade e a sua chave API. Basta copiar, colar e começar a enviar pedidos de inferência a partir de qualquer aplicação.

Sim. Cada modelo pode ser implementado em várias regiões simultaneamente . O seu plano determina o número total de pontos de extremidade disponíveis: 3 na versão Gratuita, 10 na versão Pro e ilimitados na versão Enterprise. Isto permite-lhe atender utilizadores em todo o mundo com pontos de extremidade de baixa latência em cada região.
Os pontos de extremidade dedicados são faturados com base na CPU, na memória e no volume de pedidos. Com a funcionalidade «scale-to-zero» ativada por predefinição, só paga pelo tempo de inferência ativo; não há custos quando o seu ponto de extremidade não está a receber pedidos. A inferência partilhada está incluída no seu plano de plataforma.
A inferência partilhada é executada num serviço multitenant em 3 regiões e está limitada a 20 pedidos por minuto. É ideal para desenvolvimento e testes rápidos. Os pontos de extremidade dedicados são serviços single-tenant implementados em qualquer uma das 43 regiões, sem limites de taxa, com latência consistente e recursos configuráveis, concebidos para cargas de trabalho de produção escaláveis.
A implementação de um ponto de extremidade dedicado demora normalmente entre um a dois minutos. Este processo inclui o aprovisionamento do contentor, o arranque e uma verificação inicial do estado para confirmar que o serviço está pronto. Assim que o ponto de extremidade estiver pronto, começa imediatamente a aceitar pedidos de inferência .
A implementação de modelos é o processo de disponibilizar um modelo de visão computacional treinado para receber e processar dados do mundo real. Uma vez implementadas, as aplicações de visão computacional podem enviar imagens e fotogramas de vídeo para o modelo através de uma API e receber previsões, permitindo desde a inspeção automatizada da qualidade até à deteção de objetos em tempo real em sistemas de produção. Na Ultralytics , a implementação está integrada diretamente no fluxo de trabalho de treino de ponta a ponta. Assim que o seu modelo estiver treinado, pode testá-lo no navegador, implementá-lo num ponto final dedicado em qualquer uma das 43 regiões globais e monitorizar o seu desempenho, tudo a partir do mesmo espaço de trabalho.
Leve os seus modelos treinados para produção em 43 regiões globais com autoescalabilidade e monitorização em tempo real.