Ao clicar em “Aceitar todos os cookies”, concorda com o armazenamento de cookies no seu dispositivo para melhorar a navegação no site, analisar a utilização do site e ajudar nos nossos esforços de marketing. Mais informações
Definições de cookies
Ao clicar em “Aceitar todos os cookies”, concorda com o armazenamento de cookies no seu dispositivo para melhorar a navegação no site, analisar a utilização do site e ajudar nos nossos esforços de marketing. Mais informações
Aprenda como transformar visuais de visão computacional em insights de negócios significativos. Descubra como conectar os pontos entre imagens e dados para tomar melhores decisões.
Visão computacional é um subcampo da inteligência artificial (IA) que permite que as máquinas interpretem e tomem decisões com base em dados visuais. Quando uma aplicação de visão computacional é demonstrada, normalmente inclui várias saídas visuais, como imagens ou vídeos, anotadas com bounding boxes ou máscaras de segmentação para destacar objetos de interesse. Embora esses recursos visuais sejam impressionantes, nem sempre fornecem uma imagem clara de quais insights acionáveis eles podem fornecer.
Tomemos como exemplo uma loja de retalho. Um modelo de visão computacional como o Ultralytics YOLOv8 pode ser utilizado para criar um mapa de calor que mostre onde os clientes passam a maior parte do seu tempo. A visualização pode parecer um mapa colorido que indica onde a maioria dos clientes tende a caminhar ou a demorar. No entanto, a verdadeira informação obtida é a capacidade de identificar secções da loja com um desempenho inferior. Os retalhistas podem utilizar esta informação acionável para reorganizar a colocação dos produtos, otimizar o espaço nas prateleiras ou ajustar os expositores promocionais para aumentar o envolvimento dos clientes e as vendas.
Fig. 1. Exemplo de um mapa de calor criado para uma loja de retalho utilizando YOLOv8.
O valor real da visão computacional reside na tradução dessas saídas visuais em insights de negócios significativos que podem aprimorar e otimizar diretamente as operações para impulsionar o crescimento e a eficiência. Neste artigo, veremos o que a visão computacional pode oferecer às empresas e como ela pode causar um impacto real em suas operações. Também discutiremos estratégias para ir além das saídas visuais para aproveitar insights acionáveis que geram resultados reais. Vamos começar!
Visualização vs. insights em IA: A ideia errada comum
Vamos começar entendendo a diferença entre visualizações e insights. Em visão computacional, visualizações como bounding boxes e mapas de calor são importantes para entender a saída do modelo. Essas saídas visuais atuam como um trampolim para ilustrar o que a visão computacional pode e não pode fazer. Os insights, no entanto, vão além desses recursos visuais e oferecem informações valiosas que podem ser usadas para tomar decisões informadas, melhorar processos ou entender padrões mais profundamente. Eles transformam dados visuais brutos em conclusões significativas que ajudam a descobrir tendências, prever resultados ou otimizar estratégias.
Por exemplo, um sistema de visão computacional de monitorização de exercícios pode utilizar a estimativa de pose e modelos como YOLOv8 para track os movimentos do corpo, identificando pontos-chave como as articulações e os membros. O resultado visual, como esqueletos animados que mostram como uma pessoa se move, pode ser interessante de observar. No entanto, o verdadeiro valor vem das informações quantificáveis que estes dados fornecem - como o número de flexões ou agachamentos efectuados, a duração de cada exercício, a consistência das repetições e a qualidade da forma mantida ao longo da sessão.
Os formadores podem utilizar estas informações para analisar as formas de exercício dos seus clientes, detetar movimentos incorrectos que possam causar lesões, track o desempenho ao longo do tempo e compreender os hábitos de treino. Estas informações ajudam os formadores a dar um melhor feedback, a conceber planos de treino mais eficazes e a ajudar os clientes a atingir os seus objectivos de fitness de forma mais segura e eficiente.
Fig. 2. Utilização do YOLOv8 para registar os movimentos do corpo.
Entregando valor de negócio com visão computacional
À medida que a tecnologia avança, as empresas estão sempre procurando maneiras de ficar à frente da concorrência, e a visão computacional é uma ótima maneira de fazer isso. Ao incorporar insights da visão computacional em seus fluxos de trabalho existentes, elas podem ver resultados reais e mensuráveis.
Esses insights podem oferecer informações valiosas em várias áreas da empresa, como:
Métricas de desempenho: Dados quantitativos que destacam os principais indicadores de desempenho e padrões.
Análise de tendências: Compreensão das tendências emergentes e mudanças no comportamento do cliente ou nas condições de mercado ao longo do tempo.
Insights preditivos: Previsão de resultados futuros ou identificação de possíveis problemas usando dados passados e em tempo real.
Alertas em tempo real: Notificações instantâneas para eventos importantes, anomalias ou alterações que precisam de atenção.
Por exemplo, na indústria do petróleo e do gás, a deteção de incêndios ou fugas de gás em fornos era tradicionalmente efectuada através de monitorização manual ou de sistemas de sensores básicos. Esses métodos geralmente não têm a velocidade e a precisão necessárias para detetar perigos potenciais logo no início. A visão por computador pode melhorar este processo através da utilização de câmaras e modelos de deteção de objectos como o YOLOv8 para monitorizar continuamente fornos e detetar rapidamente problemas como chamas invulgares, excesso de fumo ou fugas de gás.
A saída visual desta aplicação pode aparecer como bounding boxes em imagens que destacam áreas onde um incêndio é detectado. O verdadeiro benefício, no entanto, vem da transformação dessas pistas visuais em insights acionáveis. Esses insights podem ajudar a identificar a causa de um incêndio, prever problemas com equipamentos e planejar a manutenção para evitar problemas futuros. Ao usar esses insights, as empresas industriais podem responder rapidamente a possíveis incêndios, evitar danos dispendiosos, reduzir o tempo de inatividade e melhorar a segurança e a eficiência.
Fig 3. Utilização do YOLOv8 para detetar incêndios.
Tomada de decisão orientada por dados com IA
As saídas visuais de um modelo treinado podem ser transformadas em insights que são organizados em painéis e bancos de dados para uma análise mais profunda. Os painéis, em particular, podem ajudar a fornecer aos proprietários de empresas uma visão clara das métricas de desempenho, ajudar a identificar anomalias e apoiar decisões orientadas por dados com base em informações em tempo real.
Por exemplo, na monitorização do tráfego, um modelo de visão por computador como o YOLOv8 pode ser utilizado para analisar imagens de tráfego em direto para detect e track diferentes veículos, como carros, carrinhas e autocarros, na estrada. A visualização de saída pode mostrar veículos etiquetados e track o número de veículos que entram e saem de áreas específicas. Estas informações também podem ser apresentadas num painel de controlo que fornece uma repartição das contagens de veículos por zona e calcula métricas importantes como a contagem total de veículos e a velocidade média.
Fig. 4. Utilização do YOLOv8 para detetar e seguir o tráfego.
Esses insights ajudam as equipes de gerenciamento de tráfego a entender o fluxo de tráfego, identificar pontos de congestionamento, prever engarrafamentos e ajustar os sinais de trânsito ou rotas para manter as coisas funcionando sem problemas. Ao transformar dados visuais em insights acionáveis, este sistema ajuda os planejadores urbanos a tomar decisões inteligentes para melhorar o fluxo de tráfego e reduzir problemas na estrada.
Preenchendo a lacuna entre a IA e as necessidades de negócios
Agora que discutimos o impacto comercial das percepções acionáveis da visão computacional, vamos analisar as estratégias para preencher a lacuna entre a visualização de dados e os insights de negócios. Ao desenvolver soluções de IA, essas considerações são vitais porque ajudam a ir além de simples tarefas de visão computacional para entender o contexto e os relacionamentos dentro dos dados. A análise aprofundada permite a criação de insights mais significativos e relevantes para as necessidades de negócios.
Para começar, melhorar a comunicação entre os desenvolvedores de IA e os líderes de negócios é essencial. Os desenvolvedores de IA podem ter discussões abertas com as partes interessadas de negócios para entender seus objetivos, desafios e o que eles esperam alcançar. Ao pensar da perspectiva do proprietário da empresa, é mais fácil determinar como a visão computacional pode abordar diretamente problemas específicos. Em vez de desenvolver soluções genéricas, os desenvolvedores podem se concentrar na criação de aplicações de visão computacional que resolvam necessidades reais de negócios.
Por exemplo, no cenário de petróleo e gás que discutimos anteriormente, falar diretamente com uma parte interessada de negócios pode ajudar um desenvolvedor a entender necessidades específicas, como enviar alertas com base no tamanho e na gravidade de um incêndio detectado. Conhecer esses detalhes ajuda os desenvolvedores a personalizar a solução para priorizar alertas críticos, garantindo tempos de resposta mais rápidos e reduzindo riscos, o que aumenta a segurança e a eficiência.
Fig 5. A comunicação é essencial. Fonte da imagem: Envato Elements.
Uma vez estabelecida uma comunicação clara, o próximo passo é focar na qualidade e no processamento dos dados. Os desenvolvedores podem garantir que os dados usados para treinamento e análise sejam limpos, consistentes e relevantes para as necessidades do cliente. Simplificar o processamento de dados pode ajudar a reduzir atrasos e fornecer insights precisos e oportunos. Além disso, integrar sistemas de visão computacional com as ferramentas de negócios existentes pode melhorar a tomada de decisões e permitir que as empresas respondam rapidamente a insights importantes.
Aqui estão alguns fatores adicionais a serem considerados:
Visualização amigável: Garanta que as saídas visuais sejam simples e fáceis de interpretar para as partes interessadas não técnicas.
Escalabilidade: Projete soluções de IA que possam ser escaladas com as crescentes necessidades de dados e mudanças operacionais da empresa.
Análise em tempo real: Incorpore o processamento de dados em tempo real para fornecer insights oportunos que podem levar a ações imediatas.
Segurança e privacidade: Proteja a integridade e a confidencialidade dos dados, especialmente ao lidar com informações confidenciais.
Aprendizado contínuo e adaptação: Implemente mecanismos para aprendizado contínuo e atualizações de modelo para se adaptar às mudanças nos ambientes de negócios e nos padrões de dados.
O futuro da visão computacional para negócios
Embora as saídas visuais, como caixas delimitadoras e máscaras, demonstrem as capacidades da visão computacional, as empresas exigem mais do que apenas representações visuais; elas precisam de insights acionáveis que possam impulsionar a tomada de decisões e melhorias operacionais. Ao entender os objetivos de negócios e aplicar a visão computacional a problemas do mundo real, os desenvolvedores podem fornecer insights que melhoram as operações, aprimoram as experiências do cliente e reduzem os custos.
Para preencher a lacuna entre a visualização e os insights acionáveis, os desenvolvedores podem se comunicar claramente com as partes interessadas, usar dados de alta qualidade e melhorar o processamento de dados. Essas etapas ajudam as empresas a obter o máximo da tecnologia de visão computacional, transformando insights em benefícios reais.
Vamos aprender e explorar juntos! Consulte nosso repositório no GitHub para ver nossas contribuições para a IA e não se esqueça de interagir com nossa comunidade. Descubra como estamos redefinindo setores como manufatura e saúde com tecnologia de IA de ponta.