Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Pesos del Modelo

Descubra la importancia de los pesos de los modelos en el aprendizaje automático, su papel en las predicciones y cómo Ultralytics YOLO simplifica su uso para las tareas de IA.

Los pesos del modelo son los parámetros numéricos aprendibles dentro de una red neuronal que definen cómo el sistema procesa los datos de entrada para generar predicciones. Funcionando de manera similar a las fuerzas sinápticas en un cerebro biológico, estos valores determinan la influencia de características específicas, como el borde de una forma o la textura de una superficie, en el resultado final. Cuando un modelo realiza tareas de visión por computadora (CV), los datos de la imagen de entrada se multiplican por estas ponderaciones capa por capa. El resultado acumulativo de estas operaciones matemáticas permite al modelo realizar tareas complejas, que van desde la clasificación de imágenes hasta la traducción de idiomas en tiempo real .

Cómo se aprende a levantar pesas

Los pesos no son valores estáticos, sino parámetros dinámicos optimizados durante el proceso de entrenamiento. Inicialmente, un modelo comienza con pesos aleatorios , lo que significa que sus primeras predicciones son esencialmente conjeturas estadísticas. A través de un proceso denominado aprendizaje supervisado, el modelo analiza un conjunto de datos de entrenamiento etiquetados y compara su resultado con la verdad fundamental correcta. Una fórmula matemática conocida como función de pérdida cuantifica el error entre la predicción y el objetivo real.

Para reducir este error, el sistema emplea un algoritmo de optimización como Adam o el descenso estocástico de gradiente (SGD). Mediante una técnica denominada retropropagación, el algoritmo calcula gradientes para determinar exactamente cómo ajustar cada peso —aumentándolo o disminuyéndolo ligeramente— para mejorar la precisión. Este ciclo se repite a lo largo de muchas épocas hasta que los pesos convergen, lo que da como resultado un modelo capaz de realizar inferencias muy precisas sobre datos no vistos.

Distinguir conceptos relacionados

En el aprendizaje profundo (DL), es crucial distinguir los pesos del modelo de otros componentes estructurales:

  • Sesgos frente a pesos: mientras que los pesos determinan la pendiente o la escala de la activación, los sesgos permiten que la función de activación se desplace hacia la izquierda o hacia la derecha. Juntos, permiten que la red se adapte a patrones no lineales.
  • Hiperparámetros: Los pesos se aprenden a partir de los datos durante el entrenamiento. Por el contrario, los hiperparámetros (como la tasa de aprendizaje o el tamaño del lote) son ajustes estructurales configurados por los ingenieros antes de que comience el entrenamiento.
  • Weights & Biases plataforma): También es importante no confundir el concepto matemático con la herramienta para desarrolladores Weights & Biases W&B), que es una plataforma utilizada para el seguimiento de experimentos.

Aprendizaje por transferencia y pesos preentrenados

Entrenar una arquitectura compleja desde cero requiere conjuntos de datos masivos y una potencia computacional significativa. Para resolver esto, los desarrolladores utilizan pesos preentrenados. Esto implica tomar un modelo de última generación como YOLO26, que ya ha aprendido representaciones de características ricas a partir de un conjunto de datos masivo como ImageNet o COCO, y aplicarlo a un nuevo problema.

Esta técnica, conocida como aprendizaje por transferencia, permite a los usuarios ajustar el modelo en un conjunto de datos más pequeño y personalizado. Los pesos preentrenados proporcionan una «ventaja inicial», lo que permite al modelo reconocer elementos visuales fundamentales de forma inmediata.

El siguiente Python muestra cómo cargar pesos preentrenados en un YOLO . La extensión del archivo .pt (PyTorch) o .onxx normalmente contiene estos valores de peso guardados.

from ultralytics import YOLO

# Load the YOLO26n model with pre-trained weights
# 'yolo26n.pt' contains the learned parameters from the COCO dataset
model = YOLO("yolo26n.pt")

# The weights are now frozen or ready for fine-tuning
# Verify the model has loaded correctly by checking model info
model.info()

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

Aplicaciones en el mundo real

La utilidad práctica de los pesos optimizados del modelo es evidente en diversos sectores:

Optimización para la implementación

A medida que los modelos se hacen más grandes, gestionar el tamaño de los archivos de los pesos de los modelos se vuelve crítico para la IA en el borde. Técnicas como la cuantificación de modelos reducen la precisión de los pesos (por ejemplo, de 32 bits en coma flotante a enteros de 8 bits) para disminuir el uso de memoria y mejorar la latencia de inferencia. Las herramientas avanzadas de Ultralytics ayudan a los equipos a gestionar estas versiones, garantizando que se implementen los pesos más eficientes en los dispositivos de producción.

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora