Yolo Vision Shenzhen
Shenzhen
Junte-se agora
Voltar para as histórias de clientes

A Prezent recorre aos modelos YOLO da Ultralytics para detetar elementos de deslizamento

Problema

A Prezent precisava de uma solução de Visão de IA para detectar automaticamente as estruturas dos slides, porque as ferramentas tradicionais eram lentas, não confiáveis e frequentemente não conseguiam preservar o design.

Solução

Com os modelos YOLO da Ultralytics, a Prezent melhorou a precisão de 65% para 87%, reduziu o tempo de treino de 3 dias para 1 e diminuiu o processamento de slides para menos de 10 segundos.

As apresentações são fundamentais para uma comunicação clara em reuniões de negócios, mas redesenhá-las para serem impactantes e informativas pode ser um desafio. O Prezent usa IA para detectar e entender elementos de slides como títulos, textos, imagens e gráficos, garantindo que os slides redesenhados permaneçam claros, visualmente atraentes e fáceis de seguir.

Ao testar várias ferramentas para detecção de elementos de slides, a Prezent descobriu que muitas interrompiam layouts e hierarquias de informações, tornando as apresentações menos coesas. Ao integrar modelos Ultralytics YOLO, a Prezent agiliza o processo, tornando a detecção de elementos de slides mais rápida, suave e profissional com o mínimo de esforço.

Tornando o redesign de slides mais rápido e inteligente com IA

A Prezent ajuda executivos de alto nível e equipes de negócios a criar apresentações claras e profissionais, automatizando o processo de redesign. Originalmente, isso dependia de modelos manuais e esforço humano, o que era lento e ineficiente. 

Para melhorar a eficiência, a Prezent recorreu à IA e à visão computacional para automatizar a formatação de slides, preservando o layout original. Ao usar modelos de detecção de objetos, sua plataforma agora pode detectar e organizar automaticamente o conteúdo dos slides para um processo de redesign mais rápido e contínuo, com o mínimo de intervenção do usuário. Ao fazer isso, a Prezent garante que as apresentações permaneçam claras, visualmente atraentes e fáceis de seguir.

O obstáculo no redesign de slides com IA

Uma ótima apresentação não se trata apenas de informações - trata-se de clareza, estrutura e impacto. No entanto, redesenhar slides manualmente para torná-los mais envolventes leva tempo e esforço. Para executivos de alto escalão e equipes de negócios, que frequentemente dependem de apresentações para reuniões, o processo de redesenho lento e frustrante era um grande desafio.

A Prezent decidiu automatizar o redesign de slides, mas havia um obstáculo fundamental: como detectar e reorganizar os elementos do slide, mantendo tudo no lugar? As ferramentas tradicionais conseguiam extrair o texto, mas não reconheciam como os títulos, imagens e gráficos estavam dispostos, muitas vezes interrompendo o layout.

Inicialmente, a Prezent usava modelos de detecção de objetos de código aberto, mas esses métodos tinham limitações: baixa precisão (60-65%), tempos de processamento lentos e layouts que ainda precisavam de correções manuais. Para automatizar verdadeiramente o processo, a Prezent precisava de uma solução de Visão de IA mais rápida e inteligente que pudesse detectar com precisão os elementos do slide e redesenhá-los sem comprometer a estrutura. Foi então que eles recorreram à visão computacional e à IA para tornar o processo contínuo.

Solução de IA de visão da Prezent para detecção de elementos de slides

Para automatizar o redesenho de slides, mantendo os layouts intactos, a Prezent integrou modelos YOLO da Ultralytics em sua plataforma. Os modelos YOLO da Ultralytics suportam várias tarefas de visão computacional, incluindo detecção de objetos. Os slides são convertidos em imagens e o YOLO detecta elementos-chave - títulos, caixas de texto, imagens e gráficos - mantendo o layout original intacto. 

O YOLO desempenha um papel crucial na extração de layout, ajudando o Prezent a preservar a estrutura e a hierarquia de cada slide, permitindo, ao mesmo tempo, redesenhos rápidos e automatizados. Ao reconhecer elementos de texto e visuais, o YOLO ajuda a garantir que as apresentações mantenham a sua funcionalidade e um design refinado. Com alta precisão e processamento rápido, o YOLO permite que o Prezent automatize a deteção de elementos de slides, reduzindo a necessidade de ajustes manuais.

Por que escolher os modelos Ultralytics YOLO?

A Prezent escolheu os modelos YOLO da Ultralytics porque eles podem ser treinados mais rapidamente, são mais precisos e têm menor latência em comparação com outros modelos de Visão de IA. A Prezent descobriu que a maioria dos modelos levava de dois a três dias para treinar, retardando iterações e melhorias. 

"Normalmente, treinar um modelo de machine learning leva muito tempo, e muitas vezes você tem que esperar dois ou três dias pela inferência e, então, decidir se a precisão é boa o suficiente. Mas com o YOLO, podemos treinar o modelo em um único dia, tomar decisões rapidamente e aprender rapidamente com os resultados", diz o Cientista de Dados Principal da Prezent.

Com o YOLO, a precisão da Prezent aumentou de 65% para 87% e foi possível refinar rapidamente os modelos e melhorar o desempenho. Além disso, as rápidas velocidades de inferência do YOLO permitem o processamento de slides em menos de 10 segundos, garantindo a automação em tempo real e uma experiência de utilizador perfeita. Ao integrar o YOLO, a Prezent encontrou uma solução fiável e escalável para um redesign de slides eficiente e preciso.

Processando slides em menos de 10 segundos com YOLO

Ao aproveitar os modelos Ultralytics YOLO, a Prezent redefiniu seu processo de redesign de slides para ser mais rápido, eficiente e altamente preciso. A capacidade de detectar e organizar automaticamente os elementos do slide garantiu que as apresentações mantivessem sua estrutura original, clareza e apelo visual sem intervenção manual.

"Usando o Ultralytics YOLO, a velocidade de processamento também é superior, pois podemos fornecer aos nossos clientes slides totalmente processados em menos de 10 segundos. O rápido tempo de treinamento e a baixa latência têm sido fundamentais para otimizar nosso fluxo de trabalho e melhorar a qualidade de nossos redesigns", compartilhou o Cientista de Dados Principal da Prezent.

Com as capacidades de processamento em tempo real do YOLO, a Prezent conseguiu automatizar totalmente a deteção do layout dos slides, eliminando as ineficiências do redesign manual. Os executivos de topo e as equipas de negócios podem gerar apresentações polidas e profissionais instantaneamente, melhorando a eficiência do fluxo de trabalho e a experiência do utilizador. Ao integrar a visão computacional e a IA, a Prezent construiu uma solução escalável e automatizada que melhora tanto a produtividade quanto a qualidade da apresentação.

O futuro da visão computacional na análise de documentos

A Prezent gostaria de ver os modelos de visão computacional melhorarem em sua capacidade de lidar com layouts mais complexos e fornecer insights mais profundos sobre as estruturas dos documentos. Isso permitiria redesigns de slides mais refinados e precisos.

Uma melhoria potencial é a capacidade de agrupar elementos relacionados em subcategorias. Tais insights ajudariam os modelos de Visão de IA a entender a hierarquia e as relações entre os componentes dos slides. Como resultado, os slides redesenhados seriam mais bem estruturados, visualmente coesos e mais fáceis de seguir.

No geral, a Prezent acredita que, à medida que a procura por automação e soluções orientadas por IA aumenta, os modelos de visão computacional continuarão a evoluir para lidar com tarefas mais complexas com maior precisão e velocidade. 

Quer saber como a Visão de IA pode melhorar o seu negócio? Visite o nosso repositório GitHub para consultar as soluções de IA da Ultralytics para diferentes setores, como a visão computacional na área da saúde e a manufatura. Descubra como os nossos modelos YOLO e as opções de licença podem ajudá-lo a começar hoje mesmo!

Nossa solução para o seu setor

Ver tudo

Perguntas mais frequentes

O que são os modelos Ultralytics YOLO?

Os modelos Ultralytics YOLO são arquiteturas de visão computacional desenvolvidas para analisar dados visuais de imagens e entradas de vídeo. Esses modelos podem ser treinados para tarefas que incluem detecção de objetos, classificação, estimativa de pose, rastreamento e segmentação de instâncias. Os modelos Ultralytics YOLO incluem:

  • Ultralytics YOLOv5
  • Ultralytics YOLOv8
  • Ultralytics YOLO11

Qual é a diferença entre os modelos Ultralytics YOLO?

Ultralytics YOLO11 é a versão mais recente de nossos modelos de Visão Computacional. Assim como suas versões anteriores, ele suporta todas as tarefas de visão computacional que a comunidade Vision AI tanto aprecia no YOLOv8. O novo YOLO11, no entanto, vem com maior desempenho e precisão, tornando-o uma ferramenta poderosa e o aliado perfeito para os desafios da indústria no mundo real.

Qual modelo Ultralytics YOLO devo escolher para o meu projeto?

O modelo que escolher usar depende dos requisitos específicos do seu projeto. É fundamental ter em conta fatores como desempenho, precisão e necessidades de implementação. Aqui está uma visão geral rápida:

  • Algumas das principais características do Ultralytics YOLOv8:
  1. Maturidade e Estabilidade: YOLOv8 é uma estrutura comprovada e estável, com extensa documentação e compatibilidade com versões anteriores do YOLO, tornando-o ideal para integrar em fluxos de trabalho existentes.
  2. Facilidade de uso: Com sua configuração amigável para iniciantes e instalação direta, o YOLOv8 é perfeito para equipes de todos os níveis de habilidade.
  3. Custo-Benefício: Requer menos recursos computacionais, tornando-o uma ótima opção para projetos com orçamento limitado.
  • Algumas das principais características do Ultralytics YOLO11:
  1. Maior Precisão: O YOLO11 supera o YOLOv8 em benchmarks, alcançando melhor precisão com menos parâmetros.
  2. Funcionalidades Avançadas: Suporta tarefas de ponta como estimativa de pose, rastreamento de objetos e caixas delimitadoras orientadas (OBB), oferecendo versatilidade incomparável.
  3. Eficiência em Tempo Real: Otimizado para aplicações em tempo real, o YOLO11 oferece tempos de inferência mais rápidos e se destaca em dispositivos de borda e tarefas sensíveis à latência.
  4. Adaptabilidade: Com ampla compatibilidade de hardware, o YOLO11 é adequado para implantação em dispositivos de borda, plataformas de nuvem e GPUs NVIDIA.

De qual licença preciso?

Os repositórios Ultralytics YOLO, como YOLOv5 e YOLO11, são distribuídos sob a licença AGPL-3.0 por padrão. Esta licença aprovada pela OSI foi projetada para estudantes, pesquisadores e entusiastas, promovendo a colaboração aberta e exigindo que qualquer software que use componentes AGPL-3.0 também seja de código aberto. Embora isso garanta a transparência e promova a inovação, pode não estar alinhado com casos de uso comercial.
Se o seu projeto envolve a incorporação de software e modelos de IA da Ultralytics em produtos ou serviços comerciais e você deseja ignorar os requisitos de código aberto da AGPL-3.0, uma Licença Empresarial é ideal.

Os benefícios da licença Enterprise incluem:

  • Flexibilidade Comercial: Modifique e incorpore o código fonte e os modelos Ultralytics YOLO em produtos proprietários sem aderir ao requisito AGPL-3.0 de código aberto para o seu projeto.
  • Desenvolvimento Proprietário: Obtenha total liberdade para desenvolver e distribuir aplicações comerciais que incluam código e modelos Ultralytics YOLO.

Para garantir uma integração perfeita e evitar restrições AGPL-3.0, solicite uma Licença Empresarial Ultralytics usando o formulário fornecido. Nossa equipe o ajudará a adaptar a licença às suas necessidades específicas.

Aumente o poder com Ultralytics YOLO

Obtenha visão de IA avançada para seus projetos. Encontre a licença certa para seus objetivos hoje.

Explore as opções de licenciamento
Link copiado para a área de transferência