Conheça o YOLO26: IA de visão de próxima geração.
Ultralytics
Voltar para o Glossário da Ultralytics

Convolution

Explora os fundamentos da convolução em visão computacional e aprendizagem profunda. Aprende como kernels e mapas de características impulsionam o Ultralytics YOLO26 para tarefas em tempo real.

A convolução é uma operação matemática fundamental que serve como o bloco de construção central de sistemas modernos de visão computacional (CV) e aprendizado profundo (DL). No contexto do processamento de imagens, a convolução envolve deslizar um pequeno filtro — frequentemente chamado de kernel — sobre uma imagem de entrada para criar um mapa de características significativas. Esse processo permite que modelos de inteligência artificial (AI) aprendam e identifiquem automaticamente padrões como bordas, texturas e formas sem intervenção humana. Diferente do aprendizado de máquina (ML) tradicional, que muitas vezes exige a extração de características manual, a convolução permite que redes construam uma compreensão hierárquica de dados visuais, começando por linhas simples e progredindo para objetos complexos como rostos ou veículos.

Link to this sectionComo a convolução funciona#

A operação funciona passando um filtro sobre os dados de entrada, realizando uma multiplicação elemento a elemento e somando os resultados para produzir um único valor para cada posição. Esse resultado é conhecido como um mapa de características.

  • O Kernel: Esta é uma pequena matriz de números (pesos) que detecta características específicas. Por exemplo, um operador de Sobel é um tipo específico de kernel usado para detectar bordas verticais ou horizontais.
  • Janela deslizante (Sliding Window): O kernel move-se pela imagem usando um tamanho de passo definido chamado "stride". Esse processo de filtragem espacial preserva a relação entre pixels, o que é crucial para entender imagens.
  • Hierarquia de camadas: Em arquiteturas profundas como Redes Neurais Convolucionais (CNNs), as camadas iniciais capturam detalhes de baixo nível, enquanto as camadas mais profundas combinam esses detalhes em conceitos de alto nível.

Link to this sectionConvolução vs. Conceitos relacionados#

Para entender completamente a convolução, é útil distingui-la de termos semelhantes frequentemente encontrados na literatura sobre redes neurais (NN):

  • Correlação cruzada vs. Convolução: Matematicamente, a verdadeira convolução envolve inverter o kernel antes de aplicá-lo. No entanto, a maioria dos frameworks de deep learning, incluindo a biblioteca PyTorch, implementa correlação cruzada (deslizar sem inverter), mas rotula como "convolução" porque os pesos são aprendidos durante o treinamento, tornando a distinção da inversão irrelevante para o desempenho.
  • Convolução vs. Atenção: Enquanto a convolução processa informações localmente (pixels vizinhos), o mecanismo de atenção permite que um modelo relacione partes distantes de uma imagem simultaneamente. Arquiteturas modernas como o YOLO26 frequentemente utilizam camadas convolucionais altamente otimizadas para manter velocidades de inferência em tempo real, já que as camadas de atenção podem ser computacionalmente mais pesadas.

Link to this sectionAplicações no Mundo Real#

A eficiência da convolução permitiu que a IA revolucionasse várias indústrias ao impulsionar sistemas de percepção robustos:

  1. Diagnóstico médico: No campo da IA na saúde, a convolução ajuda a analisar exames de ressonância magnética de alta resolução. Ao usar kernels específicos projetados para destacar anomalias, modelos podem detectar sinais precoces de tumores ou fraturas com uma precisão que rivaliza com especialistas humanos.

  2. Navegação autônoma: Veículos autônomos dependem da convolução para detecção de objetos em tempo real. À medida que o carro se move, camadas convolucionais processam fluxos de vídeo para identificar instantaneamente pedestres, faixas de trânsito e sinalização, um componente crítico da segurança em IA automotiva.

Link to this sectionExemplo em Python com Ultralytics#

Você pode inspecionar camadas convolucionais dentro de modelos de última geração usando Python. O exemplo a seguir carrega o modelo YOLO26 e verifica se sua camada inicial utiliza uma operação de convolução padrão, que é implementada via torch.nn.

import torch.nn as nn
from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Access the first layer of the model's backbone
first_layer = model.model.model[0]

# Verify it is a Convolutional layer
if isinstance(first_layer.conv, nn.Conv2d):
    print("Success: The first layer is a standard convolution.")
    print(f"Kernel size: {first_layer.conv.kernel_size}")

Link to this sectionPor que a convolução é importante para Edge AI#

As operações convolucionais são altamente otimizáveis, tornando-as ideais para implementações de Edge AI onde os recursos computacionais são limitados. Como o mesmo kernel é compartilhado por toda a imagem (compartilhamento de parâmetros), o modelo requer significativamente menos memória do que arquiteturas totalmente conectadas mais antigas. Essa eficiência permite que modelos avançados rodem em smartphones e dispositivos IoT.

Para equipes que desejam aproveitar essas operações em conjuntos de dados personalizados, a Plataforma Ultralytics oferece um ambiente contínuo para anotar imagens e treinar modelos baseados em convolução sem precisar gerenciar infraestrutura complexa. Ao usar aprendizado por transferência, podes ajustar pesos convolucionais pré-treinados para reconhecer novos objetos com o mínimo de dados de treinamento.

Explore solutions

Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais

Vamos construir o futuro da IA juntos!

Começa a tua jornada com o futuro da aprendizagem automática