Glossário

Visão por computador (CV)

Liberte o potencial da IA com a Visão por Computador! Explore o seu papel na deteção de objectos, cuidados de saúde, carros autónomos e muito mais. Saiba mais agora!

A Visão por Computador (CV) é um domínio especializado da Inteligência Artificial (IA) que permite aos computadores e sistemas obter informações significativas a partir de imagens digitais, vídeos e outros dados visuais. Essencialmente, o seu objetivo é replicar a compreensão visual humana, permitindo que as máquinas "vejam", interpretem e tomem decisões com base em dados visuais. Isto envolve o processamento de informações visuais utilizando algoritmos complexos e modelos de aprendizagem profunda (DL) para reconhecer objectos, compreender cenas e extrair conhecimentos de alto nível. Ao contrário do processamento simples de imagens, que se concentra principalmente em melhorar ou manipular os dados da imagem (como ajustar o brilho ou aplicar filtros), a visão computacional procura compreender o conteúdo e o contexto das imagens.

Importância da IA e da aprendizagem automática

A Visão por Computador é fundamental para muitos sistemas modernos de IA e Aprendizagem Automática (AM), fornecendo as capacidades necessárias para as máquinas interagirem e compreenderem o mundo físico através da perceção visual. O advento de técnicas como as Redes Neuronais Convolucionais (CNN), inspiradas no córtex visual humano, revolucionou a CV. Estas redes permitem que os modelos aprendam automaticamente caraterísticas hierárquicas a partir de grandes quantidades de dados visuais, conduzindo a melhorias significativas na precisão de várias tarefas de visão por computador. Este progresso permite aplicações sofisticadas que anteriormente eram inatingíveis, tornando a CV uma pedra angular do atual desenvolvimento da IA e um motor essencial para casos de utilização de IA que transformam o nosso futuro.

Conceitos-chave e tarefas

A visão computacional engloba uma vasta gama de tarefas destinadas a extrair diferentes tipos de informação de dados visuais. Algumas das principais tarefas incluem:

Visão computacional vs. áreas afins

É útil distinguir a Visão por Computador das disciplinas relacionadas:

  • Processamento de imagem: Concentra-se na manipulação de imagens a um nível inferior, frequentemente como um passo de pré-processamento para CV. As tarefas incluem a redução do ruído, o aumento do contraste e a filtragem utilizando bibliotecas como a OpenCV. O processamento de imagens modifica os pixéis, mas não interpreta necessariamente o conteúdo da imagem. Leia mais sobre as principais diferenças entre a Visão por Computador e o Processamento de Imagem.
  • Visão artificial (VM): Embora se sobreponha à CV, a VM refere-se normalmente à aplicação da tecnologia de visão em ambientes industriais para inspeção automatizada, controlo de processos e orientação de robôs. Os sistemas MV funcionam frequentemente em ambientes controlados com iluminação específica e configurações de câmara, concentrando-se na fiabilidade e velocidade para tarefas específicas como a inspeção de qualidade no fabrico. Mais sobre Visão mecânica.

Tecnologias e estruturas

O desenvolvimento de aplicações de visão computacional depende de várias ferramentas, bibliotecas e estruturas:

  • Bibliotecas: A OpenCV (Open Source Computer Vision Library) é uma biblioteca fundamental que oferece uma vasta coleção de algoritmos para processamento de imagens e tarefas clássicas de CV. Outras bibliotecas incluem Pillow para manipulação de imagens em Python e Scikit-image para algoritmos de processamento de imagens.
  • Estruturas de aprendizagem profunda: PyTorch e TensorFlow são as principais estruturas para construir e treinar modelos de aprendizagem profunda, incluindo os utilizados no CV.
  • Modelos: Os modelos mais avançados, como o YOLO (You Only Look Once), permitem uma deteção eficiente de objectos em tempo real. Arquitecturas como a ResNet são os pilares comuns, e os Transformadores de Visão (ViT) representam uma nova classe de modelos que está a ganhar destaque. Compare diferentes desempenhos de modelos YOLO.
  • Plataformas: Ferramentas como o Ultralytics HUB simplificam o processo de formação, implementação e gestão de modelos CV, oferecendo funcionalidades como a formação na nuvem e a gestão de conjuntos de dados. Outras plataformas, como Roboflow e Weights & Biases, oferecem ferramentas complementares para anotação de dados e acompanhamento de experiências.

Aplicações no mundo real

As aplicações de visão computacional estão cada vez mais presentes em vários sectores:

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Ligue-se, colabore e cresça com inovadores globais

Aderir agora
Ligação copiada para a área de transferência