Sintonize na YOLO Vision 2025!
25 de setembro de 2025
10:00 — 18:00 BST
Evento híbrido
Yolo Vision 2024
Glossário

Rede Neural Convolucional (CNN)

Descubra como as Redes Neurais Convolucionais (CNNs) revolucionam a visão computacional, impulsionando a IA na área da saúde, carros autônomos e muito mais.

Uma Rede Neural Convolucional (CNN) é um tipo especializado de rede neural (NN) que é altamente eficaz para processar dados com uma topologia semelhante a uma grade, como imagens. Inspiradas no córtex visual humano, as CNNs aprendem automaticamente e adaptativamente hierarquias espaciais de características a partir de dados de entrada. Isso as torna a arquitetura fundamental para a maioria das tarefas modernas de visão computacional (CV), onde alcançaram resultados de última geração em tudo, desde classificação de imagem até detecção de objetos.

Como as CNNs Funcionam

Ao contrário de uma rede neural padrão, onde cada neurônio em uma camada está conectado a cada neurônio na camada seguinte, as CNNs usam uma operação matemática especial chamada convolução. Isso permite que a rede aprenda características em um campo receptivo local, preservando as relações espaciais entre os pixels.

Uma arquitetura CNN típica consiste em várias camadas principais:

  1. Camada Convolucional: Este é o bloco de construção central onde um filtro, ou kernel, desliza sobre a imagem de entrada para produzir mapas de características. Esses mapas destacam padrões como bordas, cantos e texturas. O tamanho desses filtros e os padrões que eles detectam são aprendidos durante o treinamento do modelo.
  2. Camada de Ativação: Após cada convolução, uma função de ativação como ReLU é aplicada para introduzir não linearidade, permitindo que o modelo aprenda padrões mais complexos.
  3. Camada de Pooling (Subamostragem): Esta camada reduz as dimensões espaciais (largura e altura) dos mapas de características, o que diminui a carga computacional e ajuda a tornar as características detectadas mais robustas a mudanças de posição e orientação. Um artigo clássico sobre o tema é Classificação ImageNet com Redes Neurais Convolucionais Profundas.
  4. Camada Totalmente Conectada: Após várias camadas convolucionais e de pooling, as características de alto nível são achatadas e passadas para uma camada totalmente conectada, que realiza a classificação com base nas características aprendidas.

CNNs vs. Outras Arquiteturas

Embora as CNNs sejam um tipo de modelo de deep learning, elas diferem significativamente de outras arquiteturas.

  • Redes Neurais (NNs): Uma NN padrão trata os dados de entrada como um vetor plano, perdendo toda a informação espacial. As CNNs preservam esta informação, tornando-as ideais para a análise de imagens.
  • Vision Transformers (ViTs): Ao contrário das CNNs, que têm um forte viés indutivo para a localidade espacial, ViTs tratar uma imagem como uma sequência de patches e usar um autoatenção mecanismo para aprender relações globais. Os ViTs geralmente exigem mais dados para treinar, mas podem se destacar em tarefas onde o contexto de longo alcance é importante. Muitos modelos modernos, como RT-DETR, use uma abordagem híbrida, combinando uma CNN backbone com base em Transformer detection head.

Aplicações no Mundo Real

As CNNs são a força motriz por trás de inúmeras aplicações no mundo real:

Ferramentas e Frameworks

O desenvolvimento e a implementação de CNNs são suportados por ferramentas e frameworks poderosos:

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Conecte-se, colabore e cresça com inovadores globais

Junte-se agora
Link copiado para a área de transferência