Descubra como as Redes Neurais Convolucionais (CNNs) revolucionam a visão computacional, impulsionando a IA na área da saúde, carros autônomos e muito mais.
Uma rede neural convolucional (CNN) é uma arquitetura especializada de aprendizagem profunda projetada para processar dados com uma topologia semelhante a uma grelha, principalmente imagens digitais. Inspiradas na estrutura biológica do córtex visual, as CNNs são capazes de preservar relações espaciais dentro dos dados de entrada. Ao contrário das redes neurais tradicionais, que achatam uma imagem numa longa lista de números, as CNNs analisam pequenas regiões sobrepostas de uma imagem para aprender automaticamente hierarquias de características — desde bordas e texturas simples até formas e objetos complexos. Essa capacidade torna-as a tecnologia fundamental por trás dos modernos sistemas de visão computacional (CV).
O poder de uma CNN reside na sua capacidade de reduzir uma imagem complexa a uma forma mais fácil de processar, sem perder características essenciais para obter uma boa previsão. Isto é conseguido através de um pipeline de camadas distintas que transformam o volume de entrada numa classe ou valor de saída:
As CNNs transformaram indústrias ao automatizar tarefas visuais com precisão sobre-humana .
Embora as CNNs tenham sido por muito tempo o padrão para tarefas de visão, surgiu uma arquitetura mais recente chamada Vision Transformer (ViT).
As bibliotecas modernas facilitam a utilização de modelos baseados em CNN. O ultralytics O pacote fornece acesso
a modelos de última geração, como o YOLO26, que apresentam arquiteturas CNN altamente otimizadas para inferência rápida.
O exemplo a seguir demonstra como carregar um modelo CNN pré-treinado e executar uma previsão:
from ultralytics import YOLO
# Load a YOLO26 model, which uses an advanced CNN architecture
model = YOLO("yolo26n.pt")
# Run inference on an image to identify objects
results = model("https://ultralytics.com/images/bus.jpg")
# Display the prediction results
results[0].show()
O desenvolvimento de CNNs é apoiado por um ecossistema robusto de ferramentas de código aberto. Os engenheiros normalmente utilizam frameworks como PyTorch ou TensorFlow para construir arquiteturas personalizadas. Essas bibliotecas fornecem as tensor de baixo nível necessárias para convolução e retropropagação.
Para equipas que procuram otimizar o ciclo de vida de projetos de visão computacional — desde a recolha de dados até à implementação —, Ultralytics oferece uma solução abrangente. Ela simplifica fluxos de trabalho complexos, permitindo que os programadores se concentrem na aplicação de CNNs para resolver problemas de negócios, em vez de gerenciar a infraestrutura. Além disso, os modelos podem ser exportados para formatos como ONNX ou TensorRT para implementação de alto desempenho em dispositivos de ponta .