Conheça o YOLO26: IA de visão de próxima geração.
Ultralytics
Voltar para o Glossário da Ultralytics

Stochastic Gradient Descent (SGD)

Aprende como o Stochastic Gradient Descent (SGD) otimiza modelos de machine learning. Descobre como o SGD impulsiona o Ultralytics YOLO26 para um treino de IA mais rápido e eficiente.

O Stochastic Gradient Descent (SGD) é um poderoso algoritmo de otimização amplamente utilizado em machine learning para treinar modelos de forma eficiente, particularmente ao trabalhar com grandes conjuntos de dados. Em sua essência, o SGD é uma variação do método tradicional de gradiente descendente, projetado para acelerar o processo de aprendizado ao atualizar os parâmetros do modelo com mais frequência. Em vez de calcular o erro para todo o conjunto de dados antes de fazer uma única atualização — como é feito no gradiente descendente em lote tradicional — o SGD atualiza os pesos do modelo usando apenas um exemplo de treinamento selecionado aleatoriamente de cada vez. Essa natureza "estocástica" ou aleatória introduz ruído no caminho de otimização, o que pode ajudar o modelo a escapar de soluções subótimas e convergir mais rapidamente em conjuntos de dados massivos onde o processamento de todos os dados de uma só vez é computacionalmente proibitivo.

Link to this sectionComo funciona o Stochastic Gradient Descent#

O objetivo principal de qualquer processo de treinamento é minimizar uma função de perda, que quantifica a diferença entre as previsões do modelo e os valores-alvo reais. O SGD alcança isso por meio de um ciclo iterativo. Primeiro, o algoritmo seleciona um ponto de dados aleatório dos dados de treinamento. Em seguida, ele executa uma passagem direta para gerar uma previsão e calcula o erro. Usando backpropagation, o algoritmo calcula o gradiente — essencialmente a inclinação da paisagem de erro — com base nesse único exemplo. Finalmente, ele atualiza os pesos do modelo na direção oposta ao gradiente para reduzir o erro.

Este processo é repetido por muitas iterações, frequentemente agrupadas em épocas, até que o desempenho do modelo se estabilize. A magnitude dessas atualizações é controlada por um hiperparâmetro conhecido como taxa de aprendizado. Como cada etapa é baseada em apenas uma amostra, o caminho até o mínimo é frequentemente em ziguezague ou ruidoso em comparação com a trajetória suave do gradiente descendente em lote. No entanto, esse ruído é frequentemente vantajoso em deep learning, pois pode impedir que o modelo fique preso em um mínimo local, potencialmente levando a uma melhor solução global.

Link to this sectionSGD vs. outros algoritmos de otimização#

Entender as distinções entre o SGD e algoritmos de otimização relacionados é crucial para selecionar a estratégia de treinamento correta.

  • Batch Gradient Descent: Este método tradicional calcula o gradiente usando todo o conjunto de dados para cada atualização. Embora forneça um caminho estável e direto para o mínimo, é extremamente lento e consome muita memória para tarefas de machine learning (ML) em grande escala.
  • Mini-Batch Gradient Descent: Na prática, a maioria das estruturas modernas de deep learning, incluindo PyTorch, implementa uma abordagem híbrida frequentemente referida como SGD, mas tecnicamente chamada de "Mini-Batch SGD". Este método atualiza os parâmetros usando um pequeno grupo de amostras (um lote) em vez de apenas uma. Ele equilibra a eficiência computacional do SGD puro com a estabilidade do gradiente descendente em lote, tornando-se o padrão para treinar modelos como o YOLO26.
  • Otimizador Adam: O Adam é um algoritmo de otimização com taxa de aprendizado adaptativa que se baseia no SGD. Ele ajusta a taxa de aprendizado para cada parâmetro individualmente com base em estimativas de momento. Embora o Adam frequentemente convirja mais rápido, o SGD com momento ainda é frequentemente usado em visão computacional (CV) por sua capacidade de encontrar soluções mais generalizáveis em certos cenários.

Link to this sectionAplicações no Mundo Real#

O SGD e suas variantes são os motores por trás de muitas tecnologias de IA transformadoras usadas hoje.

  1. Veículos autônomos: No desenvolvimento de veículos autônomos, os modelos devem processar vastos fluxos de dados visuais para identificar pedestres, sinais de trânsito e obstáculos. Treinar essas sofisticadas redes de detecção de objetos requer uma otimização eficiente para lidar com milhões de imagens de estradas. O SGD permite que engenheiros refinem iterativamente a precisão do modelo, garantindo que sistemas críticos de segurança em IA automotiva possam tomar decisões confiáveis em tempo real.

  2. Diagnóstico médico: O campo da análise de imagens médicas depende fortemente de deep learning para detectar anomalias como tumores em exames de ressonância magnética ou raios-X. Como os conjuntos de dados médicos podem ser massivos e de alta resolução, o SGD permite o treinamento de complexas redes neurais convolucionais (CNNs) sem sobrecarregar os recursos de memória. Isso facilita a criação de ferramentas de diagnóstico de alta precisão que auxiliam médicos em IA na saúde.

Link to this sectionExemplo de Código Python#

Embora bibliotecas de alto nível como a ultralytics lidem com a otimização internamente durante o comando train(), você pode ver como um otimizador SGD é inicializado e usado em um fluxo de trabalho PyTorch de nível inferior. Este trecho demonstra como definir um otimizador SGD simples para um tensor.

import torch
import torch.nn as nn
import torch.optim as optim

# Define a simple linear model
model = nn.Linear(10, 1)

# Initialize Stochastic Gradient Descent (SGD) optimizer
# 'lr' is the learning rate, and 'momentum' helps accelerate gradients in the right direction
optimizer = optim.SGD(model.parameters(), lr=0.01, momentum=0.9)

# Create a dummy input and target
data = torch.randn(1, 10)
target = torch.randn(1, 1)

# Forward pass
output = model(data)
loss = nn.MSELoss()(output, target)

# Backward pass and optimization step
optimizer.zero_grad()  # Clear previous gradients
loss.backward()  # Calculate gradients
optimizer.step()  # Update model parameters
print("Model parameters updated using SGD.")

Link to this sectionDesafios e soluções#

Apesar de sua popularidade, o SGD traz desafios. O problema principal é o ruído nas etapas do gradiente, que pode fazer com que a perda flutue drasticamente em vez de convergir suavemente. Para mitigar isso, profissionais costumam usar o momento, uma técnica que ajuda a acelerar o SGD na direção relevante e amortece oscilações, semelhante a uma bola pesada rolando colina abaixo. Além disso, encontrar a taxa de aprendizado correta é crítico; se for muito alta, o modelo pode ultrapassar o mínimo (gradiente explosivo) e, se for muito baixa, o treinamento será dolorosamente lento. Ferramentas como a Ultralytics Platform ajudam a automatizar esse processo gerenciando o ajuste de hiperparâmetros e fornecendo visualização para métricas de treinamento. Avanços como o otimizador Adam essencialmente automatizam o ajuste da taxa de aprendizado, resolvendo algumas das dificuldades inerentes ao SGD.

Explore solutions

Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.
Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.
Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.
Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.
Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.
Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.
Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.
Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.
Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.
Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.
Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.
Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.
Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.
Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.
Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.
Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.
Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.
Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.
Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.
Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.
Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.
Sabe mais

Vamos construir o futuro da IA juntos!

Começa a tua jornada com o futuro da aprendizagem automática