De visualizações a informações comerciais com visão computacional

Abirami Vina

5 min. de leitura

19 de setembro de 2024

Saiba como transformar visuais de visão por computador em informações comerciais significativas. Descubra como ligar os pontos entre imagens e dados para tomar melhores decisões.

A visão por computador é um subcampo da inteligência artificial (IA) que permite às máquinas interpretar e tomar decisões com base em dados visuais. Quando uma aplicação de visão computacional é apresentada, normalmente inclui vários resultados visuais, como imagens ou vídeos, anotados com caixas delimitadoras ou máscaras de segmentação para destacar objectos de interesse. Embora estes visuais sejam impressionantes, nem sempre dão uma imagem clara das informações acionáveis que podem fornecer.

Tomemos como exemplo uma loja de retalho. Um modelo de visão computacional como o Ultralytics YOLOv8 pode ser utilizado para criar um mapa de calor que mostre onde os clientes passam a maior parte do seu tempo. A visualização pode parecer um mapa colorido que indica onde a maioria dos clientes tende a caminhar ou a demorar. No entanto, a verdadeira informação obtida é a capacidade de identificar secções da loja com um desempenho inferior. Os retalhistas podem utilizar esta informação acionável para reorganizar a colocação dos produtos, otimizar o espaço nas prateleiras ou ajustar os expositores promocionais para aumentar o envolvimento dos clientes e as vendas. 

__wf_reserved_inherit
Fig. 1. Exemplo de um mapa de calor criado para uma loja de retalho utilizando o YOLOv8.

O valor real da visão computacional reside na tradução desses resultados visuais em percepções comerciais significativas que podem melhorar e otimizar diretamente as operações para impulsionar o crescimento e a eficiência. Neste artigo, analisaremos o que a visão computacional pode oferecer às empresas e como ela pode causar um impacto real em suas operações. Também discutiremos estratégias para ir além dos resultados visuais e aproveitar os insights acionáveis que geram resultados reais. Vamos começar!

Visualização Vs. conhecimentos em IA: o equívoco comum

Comecemos por compreender a diferença entre visualizações e conhecimentos. Na visão por computador, as visualizações como caixas delimitadoras e mapas de calor são importantes para compreender o resultado do modelo. Estes resultados visuais funcionam como um ponto de partida para ilustrar o que a visão por computador pode ou não fazer. Os insights, no entanto, vão para além destas visualizações e oferecem informações valiosas que podem ser utilizadas para tomar decisões informadas, melhorar processos ou compreender padrões mais profundamente. Eles transformam dados visuais brutos em conclusões significativas que ajudam a descobrir tendências, prever resultados ou otimizar estratégias.

Por exemplo, um sistema de monitorização de exercício físico com visão computacional pode utilizar a estimativa de pose e modelos como o YOLOv8 para seguir os movimentos do corpo, identificando pontos-chave como as articulações e os membros. O resultado visual, como esqueletos animados que mostram como uma pessoa se move, pode ser interessante de observar. No entanto, o verdadeiro valor vem das informações quantificáveis que estes dados fornecem - como o número de flexões ou agachamentos efectuados, a duração de cada exercício, a consistência das repetições e a qualidade da forma mantida ao longo da sessão. 

Os formadores podem utilizar estas informações para analisar as formas de exercício dos seus clientes, detetar movimentos incorrectos que possam causar lesões, acompanhar o desempenho ao longo do tempo e compreender os hábitos de treino. Estas informações ajudam os formadores a dar um melhor feedback, a conceber planos de treino mais eficazes e a ajudar os clientes a atingir os seus objectivos de fitness de forma mais segura e eficiente.

__wf_reserved_inherit
Fig. 2. Utilização do YOLOv8 para registar os movimentos do corpo.

Criação de valor comercial com visão computacional

À medida que a tecnologia avança, as empresas estão sempre procurando maneiras de ficar à frente da concorrência, e a visão computacional é uma ótima maneira de fazer isso. Ao incorporar percepções da visão computacional em seus fluxos de trabalho existentes, eles podem ver resultados reais e mensuráveis.

Estes conhecimentos podem oferecer informações valiosas em várias áreas da empresa, tais como:

  • Métricas de desempenho: Dados quantitativos que destacam os principais indicadores e padrões de desempenho.
  • Análise de tendências: Compreender as tendências emergentes e as mudanças no comportamento do cliente ou nas condições de mercado ao longo do tempo.
  • Percepções preditivas: Previsão de resultados futuros ou identificação de potenciais problemas utilizando dados passados e em tempo real.
  • Alertas em tempo real: Notificações instantâneas para eventos importantes, anomalias ou alterações que necessitem de atenção.

Por exemplo, na indústria do petróleo e do gás, a deteção de incêndios ou fugas de gás em fornos era tradicionalmente efectuada através de monitorização manual ou de sistemas de sensores básicos. Esses métodos geralmente não têm a velocidade e a precisão necessárias para detetar perigos potenciais logo no início. A visão por computador pode melhorar este processo através da utilização de câmaras e modelos de deteção de objectos como o YOLOv8 para monitorizar continuamente fornos e detetar rapidamente problemas como chamas invulgares, excesso de fumo ou fugas de gás. 

O resultado visual desta aplicação pode aparecer como caixas delimitadoras em imagens que destacam áreas onde é detectado um incêndio. No entanto, o verdadeiro benefício vem da transformação destas pistas visuais em informações acionáveis. Estas informações podem ajudar a identificar a causa de um incêndio, prever problemas no equipamento e planear a manutenção para evitar problemas futuros. Ao utilizar estas informações, as empresas industriais podem responder rapidamente a potenciais incêndios, evitar danos dispendiosos, reduzir o tempo de inatividade e melhorar a segurança e a eficiência.

__wf_reserved_inherit
Fig 3. Utilização do YOLOv8 para detetar incêndios.

Tomada de decisões baseada em dados com IA

Os resultados visuais de um modelo treinado podem ser transformados em informações que são organizadas em dashboards e bases de dados para uma análise mais profunda. Os painéis de controlo, em particular, podem ajudar a fornecer aos proprietários de empresas uma visão clara das métricas de desempenho, ajudar a detetar anomalias e apoiar decisões baseadas em dados com base em informações em tempo real.

Por exemplo, na monitorização do tráfego, um modelo de visão por computador como o YOLOv8 pode ser utilizado para analisar imagens de tráfego em direto para detetar e seguir diferentes veículos, como carros, carrinhas e autocarros, na estrada. A visualização de saída pode mostrar veículos etiquetados e seguir o número de veículos que entram e saem de áreas específicas. Estas informações também podem ser apresentadas num painel de controlo que fornece uma repartição das contagens de veículos por zona e calcula métricas importantes como a contagem total de veículos e a velocidade média. 

__wf_reserved_inherit
Fig. 4. Utilização do YOLOv8 para detetar e seguir o tráfego.

Estas informações ajudam as equipas de gestão de tráfego a compreender o fluxo de tráfego, a identificar pontos de congestionamento, a prever engarrafamentos e a ajustar os sinais de trânsito ou as rotas para manter a fluidez. Ao transformar dados visuais em informações acionáveis, este sistema ajuda os responsáveis pelo planeamento urbano a tomar decisões inteligentes para melhorar o fluxo de tráfego e reduzir os problemas na estrada.

Colmatar o fosso entre a IA e as necessidades das empresas

Agora que já discutimos o impacto comercial das informações acionáveis da visão por computador, vamos analisar as estratégias para colmatar a lacuna entre a visualização de dados e as informações comerciais. Ao desenvolver soluções de IA, essas considerações são vitais porque ajudam a ir além das simples tarefas de visão computacional para entender o contexto e as relações dentro dos dados. Uma análise aprofundada permite a criação de conhecimentos que são mais significativos e mais relevantes para as necessidades do negócio.

Para começar, é essencial melhorar a comunicação entre os programadores de IA e os líderes empresariais. Os programadores de IA podem ter discussões abertas com as partes interessadas do negócio para compreender os seus objectivos, desafios e o que esperam alcançar. Ao pensar na perspetiva do proprietário da empresa, é mais fácil determinar como a visão computacional pode abordar diretamente problemas específicos. Em vez de desenvolver soluções genéricas, os programadores podem concentrar-se na criação de aplicações de visão por computador que resolvam necessidades comerciais reais. 

Por exemplo, no cenário de petróleo e gás que discutimos anteriormente, falar diretamente com um interveniente empresarial pode ajudar um programador a compreender necessidades específicas, como o envio de alertas com base na dimensão e gravidade de um incêndio detectado. O conhecimento destes pormenores ajuda os programadores a personalizar a solução para dar prioridade aos alertas críticos, garantindo tempos de resposta mais rápidos e reduzindo os riscos, o que aumenta a segurança e a eficiência.

__wf_reserved_inherit
Fig. 5. A comunicação é essencial. Fonte da imagem: Envato Elements.

Uma vez estabelecida uma comunicação clara, o passo seguinte é concentrar-se na qualidade e no processamento dos dados. Os programadores podem certificar-se de que os dados utilizados para formação e análise são limpos, consistentes e relevantes para as necessidades do cliente. A racionalização do processamento de dados pode ajudar a reduzir atrasos e fornecer percepções precisas e oportunas. Além disso, a integração de sistemas de visão computacional com ferramentas comerciais existentes pode melhorar a tomada de decisões e permitir que as empresas respondam rapidamente a informações importantes.

Eis mais alguns factores a considerar:

  • Visualização de fácil utilização: Assegurar que os resultados visuais são simples e fáceis de interpretar para as partes interessadas não técnicas.
  • Escalabilidade: Conceber soluções de IA que possam ser escaladas com as crescentes necessidades de dados e alterações operacionais da empresa.
  • Análise em tempo real: Incorporar o processamento de dados em tempo real para fornecer informações oportunas que podem levar a uma ação imediata.
  • Segurança e privacidade: Proteger a integridade e a confidencialidade dos dados, especialmente quando se trata de informações sensíveis.
  • Aprendizagem e adaptação contínuas: Implementar mecanismos de aprendizagem contínua e actualizações de modelos para se adaptar a ambientes empresariais e padrões de dados em constante mudança.

O futuro da visão computacional para as empresas

Embora os resultados visuais, como caixas delimitadoras e máscaras, demonstrem as capacidades da visão computacional, as empresas exigem mais do que apenas representações visuais; elas precisam de percepções acionáveis que possam conduzir à tomada de decisões e a melhorias operacionais. Ao compreender os objectivos comerciais e aplicar a visão por computador a problemas do mundo real, os programadores podem fornecer informações que melhoram as operações, melhoram as experiências dos clientes e reduzem os custos. 

Para preencher a lacuna entre a visualização e os insights acionáveis, os desenvolvedores podem se comunicar claramente com as partes interessadas, usar dados de alta qualidade e melhorar o processamento de dados. Estes passos ajudam as empresas a tirar o máximo partido da tecnologia de visão por computador, transformando os conhecimentos em benefícios reais.

Vamos aprender e explorar juntos! Consulte o nosso repositório GitHub para ver as nossas contribuições para a IA e não se esqueça de participar na nossa comunidade. Descubra como estamos a redefinir sectores como o fabrico e os cuidados de saúde com tecnologia de IA de ponta.

Vamos construir juntos o futuro
da IA!

Comece a sua viagem com o futuro da aprendizagem automática

Comece gratuitamente
Ligação copiada para a área de transferência