Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Volver al glosario de Ultralytics

Backpropagation

Explora los fundamentos de la retropropagación. Aprende cómo este algoritmo esencial entrena redes neuronales, optimiza YOLO26 de Ultralytics y potencia los sistemas de IA modernos.

La retropropagación, abreviatura de "propagación hacia atrás de los errores", es el algoritmo fundamental que permite a los sistemas modernos de inteligencia artificial aprender de los datos. Actúa como el mensajero matemático durante el proceso de entrenamiento de modelos, calculando exactamente cuánto contribuyó cada parámetro en una red neuronal a una predicción incorrecta. Al determinar el gradiente de la función de pérdida con respecto a cada peso, la retropropagación proporciona la retroalimentación necesaria que permite a la red ajustarse por sí misma y mejorar su precisión con el tiempo. Sin este método eficiente de cálculo de derivadas, el entrenamiento de modelos complejos y profundos sería computacionalmente inviable.

Link to this sectionLa mecánica del aprendizaje#

Para entender la retropropagación, resulta útil verla como parte de un ciclo. Cuando una red neuronal procesa una imagen o un texto, realiza un "paso hacia adelante" (forward pass) para generar una predicción. A continuación, el sistema compara esta predicción con la respuesta correcta utilizando una función de pérdida, que cuantifica el error.

La retropropagación comienza en la capa de salida y se mueve hacia atrás a través de las capas de la red. Utiliza la regla de la cadena del cálculo para calcular los gradientes. Estos gradientes le indican eficazmente al sistema: "Para reducir el error, aumenta ligeramente este peso" o "disminuye significativamente ese sesgo". Esta información es esencial para arquitecturas profundas, como las Redes Neuronales Convolucionales (CNNs), donde millones de parámetros deben ajustarse simultáneamente.

Link to this sectionRetropropagación vs. Optimización#

Es común que los principiantes confundan la retropropagación con el paso de optimización, pero son procesos distintos dentro del ciclo de entrenamiento.

  • La retropropagación es la herramienta de diagnóstico. Calcula los gradientes, dibujando efectivamente un mapa que muestra la pendiente del panorama de error. Responde a la pregunta: "¿En qué dirección debemos movernos para reducir el error?"
  • La optimización es la acción. Algoritmos como Descenso de Gradiente Estocástico (SGD) o el optimizador Adam toman los gradientes proporcionados por la retropropagación y actualizan los pesos. Si la retropropagación es el mapa, el optimizador es el excursionista que da los pasos.

Link to this sectionAplicaciones en el mundo real en IA#

La retropropagación es el mecanismo subyacente de prácticamente todos los éxitos modernos de la IA, permitiendo que los modelos se generalicen a partir de datos de entrenamiento hacia nuevas entradas no vistas.

  • Visión artificial: En tareas de detección de objetos utilizando modelos como YOLO26, la retropropagación permite a la red aprender jerarquías espaciales. Ayuda al modelo a entender que ciertos bordes forman formas, y que esas formas forman objetos como coches o peatones. Mirando hacia el futuro, la Plataforma Ultralytics aprovecha estas técnicas de entrenamiento para ayudar a los usuarios a crear modelos personalizados que puedan identificar con precisión defectos en la fabricación o controlar la salud de los cultivos en la agricultura.
  • Procesamiento de Lenguaje Natural (NLP): Para Modelos de Lenguaje Extensos (LLMs) como los desarrollados por OpenAI, la retropropagación permite al sistema aprender la probabilidad de la siguiente palabra en una oración. Al propagar errores de predicciones de texto incorrectas, el modelo aprende gramática y contexto matizados, esenciales para aplicaciones como la traducción automática.

Link to this sectionDesafíos en redes profundas#

Aunque es potente, el algoritmo enfrenta desafíos en redes muy profundas. El problema del gradiente desvaneciente ocurre cuando los gradientes se vuelven demasiado pequeños a medida que se desplazan hacia atrás, provocando que las primeras capas dejen de aprender. Por el contrario, un gradiente explosivo implica que los gradientes se acumulan hasta alcanzar valores muy inestables. A menudo se emplean técnicas como la Normalización por lotes y arquitecturas especializadas como ResNet para mitigar estos problemas.

Link to this sectionEjemplo de código en Python#

Si bien las bibliotecas de alto nivel como ultralytics abstraen este proceso durante el entrenamiento, el framework PyTorch subyacente te permite ver el mecanismo directamente. El método .backward() activa el proceso de retropropagación, calculando derivadas para cualquier tensor donde requires_grad=True.

import torch

# Create a tensor that tracks operations for backpropagation
w = torch.tensor([2.0], requires_grad=True)
x = torch.tensor([3.0])

# Forward pass: compute prediction and loss (simple example)
# Let's assume the target value is 10.0
loss = (w * x - 10.0) ** 2

# Backward pass: This command executes backpropagation
loss.backward()

# The gradient is now stored in w.grad, showing how to adjust 'w'
# This tells us the slope of the loss with respect to w
print(f"Gradient (dL/dw): {w.grad.item()}")

Link to this sectionLecturas adicionales#

Para entender cómo encaja la retropropagación en el ámbito más amplio del desarrollo de la IA, es beneficioso explorar el concepto de aumento de datos, ya que proporciona los diversos ejemplos necesarios para que el algoritmo se generalice eficazmente. Además, comprender las métricas específicas utilizadas para evaluar el éxito del entrenamiento, como la precisión media media (mAP), ayuda a interpretar qué tan bien está optimizando el modelo el proceso de retropropagación. Para una inmersión teórica más profunda, las notas del curso CS231n de Stanford ofrecen un excelente desglose técnico del cálculo involucrado.

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático