Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Volver al glosario de Ultralytics

Stochastic Gradient Descent (SGD)

Aprende cómo el descenso de gradiente estocástico (SGD) optimiza los modelos de aprendizaje automático. Descubre cómo el SGD potencia a Ultralytics YOLO26 para un entrenamiento de IA más rápido y eficiente.

El descenso de gradiente estocástico (SGD) es un potente algoritmo de optimización ampliamente utilizado en el aprendizaje automático para entrenar modelos de forma eficiente, especialmente al trabajar con grandes conjuntos de datos. En esencia, el SGD es una variante del método de descenso de gradiente estándar, diseñado para acelerar el proceso de aprendizaje mediante la actualización más frecuente de los parámetros del modelo. En lugar de calcular el error de todo el conjunto de datos antes de realizar una única actualización —como se hace en el descenso de gradiente por lotes tradicional—, el SGD actualiza los pesos del modelo utilizando solo un ejemplo de entrenamiento seleccionado aleatoriamente a la vez. Esta naturaleza "estocástica" o aleatoria introduce ruido en la ruta de optimización, lo que puede ayudar al modelo a escapar de soluciones subóptimas y converger más rápido en conjuntos de datos masivos donde procesar todos los datos a la vez resulta computacionalmente prohibitivo.

Link to this sectionCómo funciona el descenso de gradiente estocástico#

El objetivo principal de cualquier proceso de entrenamiento es minimizar una función de pérdida, que cuantifica la diferencia entre las predicciones del modelo y los valores objetivo reales. El SGD logra esto mediante un ciclo iterativo. Primero, el algoritmo selecciona un punto de datos aleatorio de los datos de entrenamiento. Luego, realiza una pasada hacia adelante (forward pass) para generar una predicción y calcula el error. Utilizando retropropagación, el algoritmo calcula el gradiente —esencialmente la pendiente del panorama de error— basado en ese único ejemplo. Finalmente, actualiza los pesos del modelo en la dirección opuesta al gradiente para reducir el error.

Este proceso se repite durante muchas iteraciones, a menudo agrupadas en épocas, hasta que el rendimiento del modelo se estabiliza. La magnitud de estas actualizaciones está controlada por un hiperparámetro conocido como tasa de aprendizaje. Dado que cada paso se basa en una sola muestra, el camino hacia el mínimo suele ser en zigzag o ruidoso en comparación con la trayectoria suave del descenso de gradiente por lotes. Sin embargo, este ruido suele ser ventajoso en el aprendizaje profundo, ya que puede evitar que el modelo se quede atascado en un mínimo local, lo que potencialmente conduce a una mejor solución global.

Link to this sectionSGD frente a otros algoritmos de optimización#

Comprender las diferencias entre el SGD y los algoritmos de optimización relacionados es crucial para seleccionar la estrategia de entrenamiento correcta.

  • Descenso de gradiente por lotes: Este método tradicional calcula el gradiente utilizando todo el conjunto de datos para cada actualización. Aunque proporciona una ruta estable y directa hacia el mínimo, es extremadamente lento y consume mucha memoria para tareas de aprendizaje automático (ML) a gran escala.
  • Descenso de gradiente de mini lotes: En la práctica, la mayoría de los marcos de aprendizaje profundo modernos, incluido PyTorch, implementan un enfoque híbrido a menudo denominado SGD, pero técnicamente se trata de un "SGD de mini lotes". Este método actualiza los parámetros utilizando un pequeño grupo de muestras (un lote) en lugar de una sola. Equilibra la eficiencia computacional del SGD puro con la estabilidad del descenso de gradiente por lotes, convirtiéndolo en el estándar para entrenar modelos como YOLO26.
  • Optimizador Adam: Adam es un algoritmo de optimización de tasa de aprendizaje adaptativo que se basa en el SGD. Ajusta la tasa de aprendizaje para cada parámetro individualmente basándose en estimaciones de momentos. Aunque Adam a menudo converge más rápido, el SGD con momentum se sigue utilizando frecuentemente en visión artificial (CV) por su capacidad para encontrar soluciones más generalizables en ciertos escenarios.

Link to this sectionAplicaciones en el mundo real#

El SGD y sus variantes son los motores detrás de muchas tecnologías de IA transformadoras utilizadas hoy en día.

  1. Vehículos autónomos: En el desarrollo de vehículos autónomos, los modelos deben procesar vastos flujos de datos visuales para identificar peatones, señales de tráfico y obstáculos. Entrenar estas sofisticadas redes de detección de objetos requiere una optimización eficiente para manejar millones de imágenes de carretera. El SGD permite a los ingenieros refinar iterativamente la precisión del modelo, asegurando que los sistemas críticos para la seguridad en IA en automoción puedan tomar decisiones fiables en tiempo real.

  2. Diagnóstico médico: El campo del análisis de imágenes médicas depende en gran medida del aprendizaje profundo para detectar anomalías como tumores en resonancias magnéticas o radiografías. Dado que los conjuntos de datos médicos pueden ser masivos y de alta resolución, el SGD permite el entrenamiento de complejas redes neuronales convolucionales (CNN) sin abrumar los recursos de memoria. Esto facilita la creación de herramientas de diagnóstico de alta precisión que ayudan a los médicos en IA en el cuidado de la salud.

Link to this sectionEjemplo de código en Python#

Aunque las bibliotecas de alto nivel como ultralytics manejan la optimización internamente durante el comando train(), puedes ver cómo se inicializa y utiliza un optimizador SGD dentro de un flujo de trabajo de PyTorch de bajo nivel. Este fragmento demuestra cómo definir un optimizador SGD simple para un tensor.

import torch
import torch.nn as nn
import torch.optim as optim

# Define a simple linear model
model = nn.Linear(10, 1)

# Initialize Stochastic Gradient Descent (SGD) optimizer
# 'lr' is the learning rate, and 'momentum' helps accelerate gradients in the right direction
optimizer = optim.SGD(model.parameters(), lr=0.01, momentum=0.9)

# Create a dummy input and target
data = torch.randn(1, 10)
target = torch.randn(1, 1)

# Forward pass
output = model(data)
loss = nn.MSELoss()(output, target)

# Backward pass and optimization step
optimizer.zero_grad()  # Clear previous gradients
loss.backward()  # Calculate gradients
optimizer.step()  # Update model parameters
print("Model parameters updated using SGD.")

Link to this sectionDesafíos y soluciones#

A pesar de su popularidad, el SGD conlleva desafíos. El problema principal es el ruido en los pasos del gradiente, lo que puede causar que la pérdida fluctúe drásticamente en lugar de converger suavemente. Para mitigar esto, los profesionales a menudo utilizan momentum, una técnica que ayuda a acelerar el SGD en la dirección relevante y amortigua las oscilaciones, similar a una bola pesada rodando cuesta abajo. Además, encontrar la tasa de aprendizaje correcta es crítico; si es demasiado alta, el modelo puede sobrepasar el mínimo (gradiente explosivo), y si es demasiado baja, el entrenamiento será dolorosamente lento. Herramientas como Ultralytics Platform ayudan a automatizar este proceso gestionando el ajuste de hiperparámetros y proporcionando visualización para las métricas de entrenamiento. Avances como el optimizador Adam automatizan esencialmente el ajuste de la tasa de aprendizaje, abordando algunas de las dificultades inherentes al SGD.

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático