Ao clicar em “Aceitar todos os cookies”, concorda com o armazenamento de cookies no seu dispositivo para melhorar a navegação no site, analisar a utilização do site e ajudar nos nossos esforços de marketing. Mais informações
Definições de cookies
Ao clicar em “Aceitar todos os cookies”, concorda com o armazenamento de cookies no seu dispositivo para melhorar a navegação no site, analisar a utilização do site e ajudar nos nossos esforços de marketing. Mais informações
Saiba mais sobre sete tendências futuras de deteção de objectos que impulsionam os avanços na visão computacional, permitindo sistemas alimentados por IA mais rápidos, mais inteligentes e mais fiáveis.
Os robôs-eixo andam agora pelas ruas de São Francisco e as pessoas passaram da procura de respostas online para a conversação com a IA como parte das suas rotinas diárias. Estas mudanças tornam claro que a inteligência artificial (IA) está a avançar mais rapidamente do que nunca e a tornar-se parte da vida quotidiana.
Por exemplo, uma das áreas que está a avançar a um ritmo incrível é a tecnologia de visão por computador. Também conhecida como IA de visão, é um subcampo da IA que se centra em ajudar as máquinas a interpretar e compreender dados visuais.
A visão computacional já está a aparecer em todo o lado, desde as caixas automáticas até aos drones que inspeccionam linhas eléctricas. No centro de muitos destes sistemas está a deteção de objectos, uma tarefa central da visão por computador que permite às máquinas reconhecer e localizar objectos específicos em imagens e vídeos.
À medida que a adoção da IA acelera, o mesmo acontece com a procura de uma deteção de objectos que seja rápida e precisa. Modelos de IA de visão como o Ultralytics YOLO11 e o futuro Ultralytics YOLO26 foram criados com isto em mente, tornando a deteção de objectos em tempo real mais fiável e acessível do que nunca.
Fig. 1. Um exemplo de utilização do YOLO11 para a deteção de objectos.
Com este rápido progresso, o campo está a evoluir rapidamente e várias tendências emergentes estão a moldar o aspeto da próxima geração de deteção de objectos. Neste artigo, vamos explorar sete tendências-chave que estão a definir o futuro da deteção de objectos.
Entendendo como funciona a detecção de objetos
Antes de nos debruçarmos sobre as futuras tendências de deteção de objectos, vamos recuar e ver o que é a deteção de objectos, como funciona nos bastidores e como se desenvolveu ao longo dos anos.
A deteção de objectos é uma parte essencial da visão por computador que permite aos sistemas de IA identificar o que está numa imagem e determinar exatamente onde cada item aparece. Para aprender isto, os modelos são treinados em grandes conjuntos de dados rotulados que mostram objectos em muitas condições diferentes, como vários ângulos, iluminação, tamanhos e disposições.
Com o tempo, o modelo capta os padrões e as pistas visuais que separam um objeto de outro. Uma vez treinados, os modelos de IA de visão como o Ultralytics YOLO podem digitalizar uma imagem inteira numa única passagem, desenhando instantaneamente caixas delimitadoras e atribuindo etiquetas. Esta velocidade e precisão são o que torna a deteção de objectos impactante nas aplicações do mundo real.
Fig. 2. Deteção de um raio-X usando um modelo YOLO11 .(Fonte)
Um caso de utilização real da deteção de objectos em ação
Por exemplo, na análise de documentos, empresas como a Prezent utilizam a deteção de objectos para automatizar a difícil tarefa de redesenhar diapositivos de apresentações. Tradicionalmente, este processo exigia horas de ajustes manuais, identificação de títulos, reposicionamento de caixas de texto, alinhamento de imagens e reconstrução de gráficos, tudo isto enquanto se tentava manter uma disposição limpa e consistente.
Ao converter cada diapositivo numa imagem, os modelosYOLO Ultralytics podem detect títulos, caixas de texto, imagens e gráficos, preservando a estrutura original. Isto dá ao sistema uma compreensão exacta da forma como cada elemento está organizado. Com essas informações, todo o processo de reformulação, que antes era lento e tedioso, pode agora ser automatizado em apenas alguns segundos.
Evolução da deteção de objectos na visão por computador
Eis um breve olhar sobre a evolução da deteção de objectos ao longo dos anos:
Os primeiros tempos (anos 1960-1970): As primeiras metodologias de deteção de objectos provinham do processamento tradicional de imagens e baseavam-se frequentemente na correspondência de modelos. Nesta abordagem, os computadores comparavam partes de uma imagem (pixéis) com padrões de referência predefinidos, ou modelos, para procurar semelhanças. Como estes modelos eram fixos e não se podiam adaptar às mudanças, o método só funcionava em condições ideais. Mesmo pequenas variações na iluminação, escala, rotação ou aparência do objeto eram suficientes para o fazer falhar.
Deteção baseada em caraterísticas (anos 1990-2000): Os investigadores mudaram então para a ideia de caraterísticas artesanais e extração de caraterísticas, em que os humanos definiam manualmente as pistas visuais que um computador devia procurar, tais como arestas, cantos, formas ou alterações de brilho. Técnicas como as cascatas de Haar (um método que procura padrões visuais simples, frequentemente utilizado para a deteção de rostos) e HOG (uma técnica que capta a direção das arestas e contornos numa imagem), que foram frequentemente associadas a classificadores SVM (um modelo de aprendizagem automática que separa os objectos em categorias), tornaram o reconhecimento de objectos mais preciso e mais rápido. Mesmo com estas melhorias, os sistemas continuavam a ter dificuldades em funcionar com rapidez suficiente para serem utilizados em tempo real.
A revolução dos modelos de aprendizagem profunda (anos 2010): A aprendizagem profunda e as redes neurais convolucionais (CNN), que são modelos concebidos para aprender padrões visuais através da análise de imagens em pequenas regiões de cada vez, redefiniram a deteção de objectos. Modelos como o R-CNN, o Fast R-CNN e o Faster R-CNN aprenderam padrões visuais diretamente a partir de grandes quantidades de dados. Isto levou a resultados com elevada precisão, mas estes modelos continuaram a enfrentar problemas de latência.
Deteção em tempo real com YOLO (meados da década de 2010): YOLO (You Only Look Once) marcou um grande avanço na deteção de objectos ao prever todas as caixas delimitadoras e etiquetas de classe numa única passagem pela rede. Esta abordagem unificada aumentou drasticamente a velocidade de deteção e abriu caminho para aplicações em tempo real. Na mesma altura, outros modelos de deteção única, como o SSD (Single Shot Detetor), também melhoraram o desempenho ao removerem os passos de proposta de regiões, tornando a deteção de objectos mais rápida e eficiente.
Avanços recentes (década de 2020): Graças a grandes melhorias na conceção e otimização de modelos, a década de 2020 trouxe sistemas e estruturas de deteção de objectos de última geração mais rápidos e precisos. Ultralytics YOLO11 introduziu actualizações arquitectónicas que melhoraram a velocidade de processamento, a precisão e o desempenho geral em tempo real. Com base neste impulso, o próximo YOLO26 apresenta um design ainda mais eficiente e leve, tornando-o adequado para uma vasta gama de aplicações práticas.
7 tendências de deteção de objectos que moldam o futuro
Em seguida, vamos explorar sete tendências emergentes de deteção de objectos que estão a chamar a atenção e a criar agitação no espaço da visão computacional.
1. Tarefas de deteção de objectos mais inteligentes com computação periférica
Os controlos manuais tradicionais podem abrandar as linhas de produção e deixar espaço para defeitos não detectados. Para resolver este problema, muitas empresas estão a recorrer a sistemas de controlo de qualidade orientados para a IA, alimentados pela deteção de objectos.
De facto, os estudos mostram que a inspeção visual baseada em IA pode aumentar significativamente a produtividade, por vezes até 50%, e aumentar as taxas de deteção de defeitos até 90% em comparação com a inspeção manual. Curiosamente, a nova tendência que está a fazer ondas neste espaço e noutras aplicações de IA de visão é a forma como esta análise está agora a acontecer diretamente nos próprios dispositivos através da computação periférica.
Com a computação periférica, a inteligência aproxima-se do local onde os dados são captados. As câmaras e os sensores podem executar modelos de deteção de objectos no local, identificando instantaneamente os objectos e determinando a sua localização sem depender do processamento na nuvem. Isto permite-lhes analisar fotogramas em tempo real.
Também reduz os atrasos na rede, diminui a utilização da largura de banda e garante que os sistemas continuam a funcionar mesmo que a ligação à Internet seja instável ou não esteja disponível. Para ambientes de ritmo acelerado como o fabrico, esta mudança para o processamento no dispositivo proporciona respostas mais rápidas, operações mais suaves e resultados muito mais fiáveis.
2. Diagnósticos baseados na visão nos cuidados de saúde
Os médicos passam frequentemente muito tempo a rever imagens médicas para se certificarem de que nada passa despercebido. Atualmente, muitos hospitais estão a começar a explorar tecnologia de ponta de deteção de objectos para ajudar a acelerar o processo. Isto reflecte uma tendência mais ampla nos cuidados de saúde, em que a IA de visão está a ser cada vez mais utilizada para apoiar uma deteção mais precoce, um diagnóstico mais rápido e uma análise de imagem mais consistente.
A deteção de objectos pode ser utilizada para destacar rapidamente áreas que possam necessitar de atenção, melhorando a tomada de decisões e os resultados dos doentes. Por exemplo, modelos como o YOLO11 podem ajudar os médicos a detetar tumores cerebrais em exames de ressonância magnética.
Fig. 3. Deteção e localização de tumores cerebrais em exames de ressonância magnética com a ajuda do YOLO11.(Fonte)
Uma vez que YOLO11 consegue reconhecer padrões subtis em exames de ressonância magnética, pode ajudar a identificar tumores pequenos ou em fase inicial com maior precisão. Enquanto os médicos fazem o diagnóstico final, ferramentas como o YOLO11 podem ajudar a simplificar a sua análise, revelando mais cedo potenciais preocupações e ajudando a garantir que nada de importante passa despercebido.
3. Veículos autónomos e visão em tempo real para uma mobilidade mais segura
Nas ruas movimentadas das cidades, os carros autónomos dependem de câmaras e sensores para monitorizar continuamente o ambiente que os rodeia. Estes sistemas detect peões, veículos, faixas de rodagem e sinais de trânsito em tempo real. Com a ajuda da visão por computador e dos algoritmos de deteção de objectos, um automóvel autónomo pode interpretar o que se passa à sua volta e tomar decisões de condução autónoma mais seguras.
Em regiões com diversos padrões de tráfego e uma mistura de veículos, estes sistemas deparam-se com uma complexidade acrescida. Por exemplo, um estudo recente avaliou Ultralytics YOLOv8 em dados de tráfego recolhidos em Hyderabad e Bangalore, onde uma variedade de veículos, como carros, autocarros, motociclos, bicicletas e auto-riquixás, partilham a estrada de forma dinâmica e muitas vezes imprevisível.
Os resultados mostraram que YOLOv8 teve um bom desempenho nestes cenários desafiantes, detectando com precisão uma vasta gama de objectos, mesmo em condições de tráfego denso e não estruturado. Isto realça uma tendência crescente na mobilidade autónoma: Os modelos de IA de visão estão a tornar-se cada vez mais capazes de lidar com ambientes complexos do mundo real que outrora representavam grandes desafios para os sistemas automatizados.
4. Automação e robótica inteligentes utilizando a visão por computador
Manusear pequenos objectos, separar objectos e materiais detectados ou navegar em espaços desordenados sempre foi um desafio para os robôs. Estas tarefas requerem uma adaptação rápida e movimentos precisos, algo que os sistemas de automação tradicionais têm frequentemente dificuldade em fazer em ambientes imprevisíveis.
Uma tendência crescente na robótica é a utilização da IA de visão para dar aos robôs a capacidade de perceber e responder ao que os rodeia em tempo real. Para explorar esta mudança, um grupo de investigadores desenvolveu recentemente um robô doméstico capaz de reconhecer e ordenar objectos à medida que se deslocava em espaços interiores.
Utilizando modelos como o YOLO11 para a deteção de objectos, juntamente com uma câmara de profundidade e uma pinça flexível, o robô foi capaz de identificar objectos de diferentes formas e tamanhos e colocá-los nos locais corretos por si próprio. Esta experiência mostra como a combinação da visão por computador com sistemas robóticos pode melhorar a consciência espacial e a capacidade de resposta.
Fig. 4. Um robô que utiliza YOLO11 e a deteção de profundidade para tomar decisões inteligentes.(Fonte)
Demonstra também como as técnicas de IA de ponta ajudam os robots a adaptarem-se a ambientes desconhecidos, aprendendo com os padrões visuais ao longo do tempo. Com estes avanços, os robôs estão a tornar-se mais capazes e mais integrados nas tarefas quotidianas, desde a assistência doméstica à logística de armazéns e ao apoio aos cuidados de saúde.
5. Sistemas proactivos de vigilância e segurança
Os sistemas de vigilância inteligentes estão a adotar rapidamente a inteligência artificial para detetar actividades invulgares ou inseguras. Com modelos de deteção de objectos, as câmaras podem reconhecer potenciais problemas em tempo real e alertar imediatamente as equipas de segurança, ajudando a melhorar a prevenção e a resposta.
Por exemplo, em instalações de fabrico onde a utilização de smartphones é restrita por razões de segurança, os sistemas de IA podem detect automaticamente os telefones no momento em que aparecem e track o seu movimento utilizando o YOLO e outros modelos de visão. Isto reflecte uma tendência mais ampla na segurança, em que a IA de visão está a ser utilizada para monitorizar ambientes de forma mais proactiva e responder mais rapidamente a potenciais riscos.
Para além da deteção, estes sistemas estão cada vez mais a ser combinados com outras tecnologias para criar uma solução de segurança mais completa. Os dispositivos de ponta permitem que as filmagens sejam processadas localmente, reduzindo os atrasos e mantendo o desempenho fiável, enquanto ferramentas como os sistemas de controlo de acesso ou o reconhecimento facial podem acrescentar uma camada extra de verificação. Juntas, essas tecnologias trabalham para criar redes de vigilância mais inteligentes e conectadas que podem responder de forma rápida e eficaz a situações do mundo real.
6. Realidade aumentada e deteção de objectos na vida quotidiana
Em armazéns movimentados e grandes espaços comerciais, os trabalhadores têm frequentemente de gerir muitas tarefas ao mesmo tempo. A realidade aumentada ajuda, colocando a orientação digital diretamente no mundo real. Quando combinados com a deteção de objectos, os sistemas de RA podem identificar itens, track onde se encontram e apresentar informações úteis em tempo real. Isto torna as tarefas diárias mais fáceis, mais rápidas e mais intuitivas para as pessoas que as utilizam.
Uma tendência crescente neste espaço é a utilização da IA de visão para transformar dispositivos quotidianos em assistentes inteligentes capazes de compreender o que os rodeia. À medida que a RA e a deteção de objectos continuam a fundir-se, os locais de trabalho começam a adotar ferramentas imersivas que suportam a orientação mãos-livres e fluxos de trabalho mais eficientes.
Um bom exemplo são os óculos AR com IA da Amazon, que estão atualmente a ser desenvolvidos e testados. Estes óculos utilizam a deteção de objectos e a classificação de imagens para reconhecer pacotes, orientar os trabalhadores ao longo do percurso correto e registar a prova de entrega. Isto cria uma experiência mais segura e mãos-livres que ajuda os trabalhadores a manterem-se concentrados e eficientes ao longo do dia.
7. Dispositivos inteligentes orientados para a IoT para sistemas de visão em tempo real
Os dispositivos inteligentes tornaram-se sistemas inteligentes que podem ver, compreender e reagir ao que os rodeia. A Internet das Coisas (IoT) impulsiona esta mudança ao ligar câmaras, sensores, máquinas e aplicações inteligentes em redes que recolhem e processam os dados em tempo real.
Quando a IoT trabalha em conjunto com a deteção de objectos e a computação periférica, os dispositivos podem interpretar informações visuais, detetar anomalias e responder instantaneamente sem envolvimento humano. Isto cria sistemas adaptativos e eficientes que alimentam casas inteligentes, indústrias e cidades inteiras.
Por exemplo, um estudo recente mostrou como um sistema de proteção da vida selvagem baseado na IoT utiliza YOLOv8 para detect animais que se aproximam das terras agrícolas. Uma vez detectado, o sistema utiliza a tomada de decisões com base em IA para acionar dissuasores suaves, como luzes ou sons, guiando os animais para longe em segurança. Isto ajuda a evitar danos nas colheitas, ao mesmo tempo que apoia a coexistência pacífica com a vida selvagem local, mostrando como a IoT e a visão computacional podem tornar a agricultura mais sustentável.
Outras tendências interessantes da IA na visão
Para além destas sete tendências de deteção de objectos, eis alguns desenvolvimentos dignos de nota que moldam o futuro da IA de visão:
Investigação sobre aprendizagem auto-supervisionada: Novos métodos baseados em aprendizagem profunda estão a permitir que os modelos aprendam caraterísticas visuais úteis a partir de grandes conjuntos de imagens não rotuladas, ajudando os sistemas de deteção de objetos a melhorar sem depender muito de anotações manuais.
Aumento da deteção de objectos com base em transformadores: Os transformadores estão a tornar-se mais comuns porque captam relações de longo alcance dentro das imagens, dando aos modelos uma melhor compreensão contextual e melhorando a precisão da deteção.
Integração da deteção de luz e alcance (LiDAR) para uma perceção 3D mais rica: A combinação do LiDAR com a deteção de objectos baseada na câmara fornece informações de profundidade precisas, reforçando a perceção 3D para aplicações como a navegação, a robótica e a condução autónoma.
Principais conclusões
A deteção de objectos foi muito além do reconhecimento básico de imagens e é agora utilizada para alimentar sistemas inteligentes capazes de tomar decisões em tempo real. Olhando para o futuro, os modelos futuros irão provavelmente atingir uma precisão ainda maior e uma compreensão mais profunda do contexto, permitindo que a IA de visão se torne ainda mais fiável e versátil em todas as indústrias. À medida que estas tecnologias continuam a avançar, darão forma a uma nova geração de sistemas de visão computacional mais inteligentes e adaptáveis.