Como exportar modelos do Ultralytics YOLO usando a Ultralytics Platform
Exporta modelos de visão computacional com facilidade usando a Ultralytics Platform. Descobre como preparar modelos em poucos cliques para implantação em borda, dispositivos móveis e nuvem.
No mês passado, lançamos a Ultralytics Platform, um espaço de trabalho unificado projetado para simplificar todo o fluxo de trabalho de visão computacional. Ela reúne os principais recursos de IA de visão, incluindo gerenciamento de datasets, anotação, treinamento de modelos, testes, implantação e monitoramento, em uma interface única e otimizada.

Fig 1. Uma visão da Ultralytics Platform (Fonte)
Como parte desse fluxo de trabalho de ponta a ponta, a implantação desempenha um papel crucial para levar os modelos da experimentação ao uso no mundo real. Anteriormente, exploramos as diferentes opções de implantação disponíveis na plataforma, incluindo inferência compartilhada via APIs, endpoints dedicados para implantações de produção escaláveis e exportação de modelos para execução em dispositivos de borda ou infraestrutura externa.
Agora, vamos analisar mais de perto a exportação de modelos e como ela oferece suporte à implantação em diferentes ambientes. Ao contrário da inferência compartilhada e endpoints dedicados, que executam modelos dentro da infraestrutura gerenciada pela Ultralytics Platform, a exportação de modelos permite que eles sejam implantados e executados em ambientes externos, como dispositivos de borda, aplicativos móveis e infraestruturas personalizadas.
Antes que os modelos possam ser executados nesses ambientes, eles precisam ser convertidos para formatos suportados pelo tempo de execução de destino. Cada configuração de implantação tem seus próprios requisitos, desde formatos leves para dispositivos móveis e de borda até formatos de alto desempenho para nuvem e sistemas baseados em GPU.
Tradicionalmente, esse processo pode ser demorado, envolvendo scripts, dependências e várias ferramentas. Com a Ultralytics Platform, a exportação é muito mais simples. Os modelos podem ser convertidos e otimizados com apenas alguns cliques, sem configurações extras.
Neste artigo, vamos explicar o que significa exportação de modelo, quais formatos são suportados pela Ultralytics Platform e como escolher o certo para o seu caso de uso. Vamos começar!
Link to this sectionUma visão geral da exportação de um modelo#
Exportar um modelo envolve converter um modelo pré-treinado ou treinado sob medida em um formato utilizável fora de sua estrutura original. Os modelos YOLO da Ultralytics são criados usando PyTorch e armazenados em seu formato nativo, que funciona bem para treinamento, avaliação e experimentação dentro do ecossistema PyTorch.
No entanto, os ambientes de implantação geralmente têm tempos de execução e requisitos de hardware diferentes. Por causa disso, o formato usado durante o treinamento nem sempre é adequado para a implantação.
Por exemplo, um aplicativo móvel pode exigir um formato leve otimizado para baixo consumo de energia, enquanto um aplicativo baseado em navegador precisa de um formato que seja executado com eficiência em ambientes web.
Dispositivos de borda, como câmeras e sistemas embarcados, beneficiam-se de modelos compactos e rápidos, enquanto sistemas de nuvem são projetados para inferência de alto desempenho. Para suportar esses diferentes cenários, os modelos precisam ser exportados para formatos compatíveis.
Link to this sectionPor que a opção de exportar modelos é mais importante do que nunca#
Hoje, modelos de visão computacional estão sendo implantados mais próximos de onde os dados são gerados, especialmente em dispositivos de borda. Smartphones executam aplicativos de visão em tempo real, câmeras de CFTV realizam monitoramento no dispositivo e sistemas autônomos dependem de tomada de decisão instantânea.
No entanto, a implantação nesses ambientes traz seus próprios desafios. Dispositivos de borda têm poder computacional limitado, requisitos de latência rigorosos e restrições de memória e consumo de energia. Um modelo que tem um bom desempenho durante o treinamento com recursos suficientes pode não ser executado com eficiência nessas condições restritas.
Exportar um modelo para o formato correto pode ajudar a resolver esses desafios. Ao converter o modelo adequadamente, ele pode ser otimizado para velocidade, reduzido em tamanho e tornado compatível com hardware específico.
Ao mesmo tempo, a exportação oferece flexibilidade. O mesmo modelo pode ser adaptado para diferentes ambientes de implantação, convertendo-o em vários formatos com base em requisitos específicos.

Fig 2. Alguns dos formatos de exportação disponíveis na Ultralytics Platform (Fonte)
Por exemplo, o formato de modelo NCNN é otimizado para dispositivos móveis e de borda com baixo uso de recursos. Já o formato OpenVINO é feito sob medida para hardware Intel e oferece melhor desempenho em unidades de processamento central (CPUs), unidades de processamento gráfico (GPUs) e unidades de processamento neural (NPUs).
Na maioria dos casos, alcançar esse nível de flexibilidade significava lidar com conversão manual, dependências e várias ferramentas, tornando o processo demorado e complexo. A Ultralytics Platform simplifica esse fluxo de trabalho tornando a exportação de modelos mais acessível e fácil de gerenciar.
Link to this sectionComo a Ultralytics Platform simplifica a exportação de modelos#
Normalmente, a exportação de um modelo é tratada como uma etapa separada e complexa nos fluxos de trabalho de visão computacional. A Ultralytics Platform muda isso integrando a opção de exportar um modelo diretamente em um único espaço de trabalho que cobre tudo, desde o treinamento até a implantação.
Uma de suas principais vantagens é a experiência de exportação sem código (no-code). Não há necessidade de escrever scripts, gerenciar ambientes ou usar comandos específicos da estrutura. Os modelos podem ser exportados com apenas alguns cliques por meio de uma interface direta.

Fig 3. Um exemplo de exportação de um modelo da Ultralytics Platform (Fonte)
Nos bastidores, a plataforma cuida do trabalho pesado. Tarefas que normalmente exigiriam várias ferramentas e configuração manual são simplificadas em um único processo. Você não precisa instalar dependências extras ou lidar com problemas de compatibilidade, tornando muito mais fácil ir de um modelo treinado para uma solução pronta para produção.
Link to this sectionFormatos de exportação de modelo suportados pela Ultralytics Platform#
A Ultralytics Platform suporta 17 formatos de exportação, tornando fácil preparar modelos para uma ampla gama de ambientes de implantação sem complexidade adicional.
Aqui está uma visão geral de alguns dos formatos de exportação comumente usados:
- Multiplataforma e interoperabilidade: ONNX e TorchScript são amplamente usados para executar modelos em diferentes estruturas e ambientes. O ONNX atua como uma ponte entre ecossistemas, facilitando a movimentação de modelos entre ferramentas, enquanto o TorchScript permite executar modelos PyTorch em produção sem exigir um tempo de execução Python.
- Inferência de alto desempenho em GPUs: O TensorRT é projetado para GPUs NVIDIA e se concentra em otimizar modelos para baixa latência e alta taxa de transferência. Ele suporta técnicas como redução de precisão e fusão de camadas para acelerar a inferência, tornando-o uma escolha sólida para aplicativos em tempo real e em escala de produção.
- Implantação móvel e de borda: CoreML, LiteRT (TensorFlow Lite) e NCNN são otimizados para dispositivos com computação e memória limitadas. Esses formatos reduzem o tamanho do modelo e melhoram a eficiência, permitindo um desempenho suave em smartphones, sistemas embarcados e hardware de borda. O CoreML é normalmente usado em ecossistemas Apple, enquanto o LiteRT é comum para Android.
- Execução otimizada por hardware: O OpenVINO é feito sob medida para hardware Intel, incluindo CPUs, GPUs e VPUs, e ajuda a melhorar a velocidade e a eficiência da inferência nesses dispositivos. Formatos específicos de hardware como este são úteis quando você precisa obter o melhor desempenho de um sistema específico.
- Tempos de execução especializados e específicos de estrutura: Formatos como PaddlePaddle e ExecuTorch suportam ecossistemas específicos e necessidades de implantação, incluindo a execução eficiente de modelos em dispositivos de borda ou a integração com pilhas específicas de aprendizado profundo.
Link to this sectionComo exportar um modelo usando a Ultralytics Platform#
Exportar um modelo na Ultralytics Platform é um processo simples, baseado na interface do usuário (UI). Todo o fluxo de trabalho é tratado por meio da interface, sem a necessidade de scripts ou ferramentas de linha de comando.
Veja como você pode exportar um modelo usando a plataforma:
- Faça login e escolha seu modelo: Vá para o seu projeto e abra o modelo treinado que você deseja exportar.
- Vá para a aba Exportar: Dentro do painel do modelo, clique na aba Exportar para visualizar as opções de exportação disponíveis.
- Selecione um formato de exportação: Escolha um formato como ONNX, TensorRT ou CoreML com base nas suas necessidades de implantação.
- Configure as configurações de exportação (opcional): Ajuste parâmetros como tamanho da imagem, precisão ou tamanho do lote para otimizar o desempenho.
- Inicie o processo de exportação: Clique em "Iniciar Exportação" para começar o processo. A plataforma lida com a conversão automaticamente.
- Baixe o modelo exportado: Assim que a exportação for concluída, você pode baixar o modelo e usá-lo em seu pipeline de implantação.

Fig 4. Uma olhada na configuração das configurações de exportação na Ultralytics Platform
Link to this sectionEscolhendo o formato de exportação correto#
Ao explorar os diferentes formatos de exportação suportados pela Ultralytics Platform, você pode se perguntar qual escolher. A resposta depende realmente de onde e como você planeja usar seu modelo.
Aqui estão alguns fatores a considerar:
- Requisitos de latência: Para aplicativos em tempo real, como análise de vídeo ou sistemas autônomos, a baixa latência é crítica. Formatos otimizados para inferência de alto desempenho, como o TensorRT, são frequentemente mais adequados.
- Restrições de hardware: Dispositivos com memória e poder de processamento limitados, como telefones celulares ou sistemas embarcados, exigem formatos leves como LiteRT ou NCNN.
- Tamanho do modelo e consumo de energia: Ao trabalhar com dispositivos de borda, o tamanho do modelo e o consumo de energia tornam-se importantes. Modelos menores e otimizados ajudam a garantir um desempenho consistente sem drenar recursos.
- Ambiente de implantação: Se seu modelo precisa ser executado em diferentes plataformas, formatos como ONNX oferecem flexibilidade. Para casos de uso específicos de plataforma, como aplicativos iOS, o CoreML costuma ser a melhor escolha.
Não existe um formato único. Tudo se resume a equilibrar desempenho, compatibilidade e as limitações do seu ambiente de destino. A Ultralytics Platform torna isso mais fácil, permitindo que você experimente e compare diferentes formatos sem esforço extra.
Link to this sectionPrincipais conclusões#
A exportação é um passo vital para preparar seu modelo para o uso no mundo real em diferentes ambientes. Com a Ultralytics Platform, esse processo torna-se muito mais simples, permitindo que você converta e otimize modelos sem configurações ou complexidade extras. Ao escolher o formato certo para seu caso de uso, você pode garantir que seu modelo seja executado com eficiência onde quer que você o implante.
Junte-se à nossa crescente comunidade e confira nosso repositório no GitHub para saber mais sobre visão computacional. Explore nossas páginas de soluções para saber mais sobre aplicações como IA em robótica e visão computacional em logística. Descubra nossas opções de licenciamento e comece a criar com IA de visão!






