Model Weights
Aprende cómo los pesos del modelo actúan como el conocimiento de la IA. Explora cómo Ultralytics YOLO26 utiliza pesos optimizados para un entrenamiento e inferencia más rápidos y precisos.
Los pesos del modelo son los parámetros aprendibles dentro de un modelo de aprendizaje automático que transforman los datos de entrada en predicciones de salida. En una red neuronal, estos pesos representan la fuerza de las conexiones entre neuronas a través de diferentes capas. Cuando se inicializa un modelo, estos pesos normalmente se establecen en valores pequeños y aleatorios, lo que significa que el modelo no "sabe" nada. Mediante un proceso llamado entrenamiento, el modelo ajusta iterativamente estos pesos basándose en los errores que comete, aprendiendo gradualmente a reconocer patrones, características y relaciones dentro de los datos. Puedes pensar en los pesos del modelo como la "memoria" o el "conocimiento" de la IA; almacenan lo que el sistema ha aprendido de sus datos de entrenamiento.
Link to this sectionEl papel de los pesos en el aprendizaje#
El objetivo principal del entrenamiento de una red neuronal es encontrar el conjunto óptimo de pesos del modelo que minimice el error entre las predicciones del modelo y la verdad fundamental real. Este proceso implica pasar los datos a través de la red (un paso conocido como forward pass) y luego calcular un valor de pérdida utilizando una función de pérdida específica. Si la predicción es incorrecta, un algoritmo de optimización como Stochastic Gradient Descent (SGD) o el nuevo optimizador Muon utilizado en YOLO26 calcula cuánto contribuyó cada peso al error.
A través de una técnica llamada backpropagation, el algoritmo actualiza los pesos ligeramente para reducir el error la próxima vez. Este ciclo se repite miles o millones de veces hasta que los pesos del modelo se estabilizan y el sistema logra una alta precisión. Una vez que el entrenamiento se completa, los pesos se "congelan" y se guardan, permitiendo que el modelo se implemente para la inferencia sobre datos nuevos y no vistos.
Link to this sectionPesos del modelo frente a sesgos#
Es importante distinguir entre pesos y sesgos, ya que funcionan juntos pero sirven para propósitos diferentes. Mientras que los pesos del modelo determinan la fuerza y la dirección de la conexión entre neuronas (controlando la pendiente de la activación), los sesgos permiten desplazar la función de activación hacia la izquierda o hacia la derecha. Este desplazamiento asegura que el modelo pueda ajustar mejor los datos, incluso cuando todas las características de entrada son cero. Juntos, los pesos y los sesgos forman los parámetros aprendibles que definen el comportamiento de arquitecturas como las Redes Neuronales Convolucionales (CNNs).
Link to this sectionAplicaciones en el mundo real#
Los pesos del modelo son el componente central que permite que los sistemas de IA funcionen en diversas industrias. Aquí tienes dos ejemplos concretos de cómo se aplican:
- Visión por ordenador en el comercio minorista: En un sistema de supermercado inteligente, un modelo como YOLO26 utiliza sus pesos entrenados para identificar productos en un estante. Los pesos han "aprendido" características visuales (como la forma de una caja de cereales o el color de una lata de refresco), lo que permite al sistema detectar artículos, gestionar el inventario e incluso facilitar procesos de pago automatizados de manera eficiente.
- Análisis de imágenes médicas: En el sector sanitario, los modelos de aprendizaje profundo utilizan pesos especializados para analizar radiografías o resonancias magnéticas. Por ejemplo, un modelo entrenado para la detección de tumores utiliza sus pesos para distinguir entre tejido sano y posibles anomalías. Estos pesos capturan patrones complejos y no lineales en los datos de píxeles que podrían ser sutiles para el ojo humano, ayudando a los radiólogos a realizar diagnósticos más rápidos.
Link to this sectionGuardar y cargar pesos#
En la práctica, trabajar con pesos de modelo implica guardar los parámetros entrenados en un archivo y cargarlos más tarde para la predicción o el ajuste fino. En el ecosistema de Ultralytics, estos se almacenan normalmente como archivos .pt (PyTorch).
Aquí tienes un ejemplo sencillo de cómo cargar pesos preentrenados en un modelo YOLO y ejecutar una predicción:
from ultralytics import YOLO
# Load a model with pre-trained weights (e.g., YOLO26n)
model = YOLO("yolo26n.pt")
# Run inference on an image using the loaded weights
results = model("https://ultralytics.com/images/bus.jpg")
# Print the number of detected objects
print(f"Detected {len(results[0].boxes)} objects.")Link to this sectionAprendizaje por transferencia y ajuste fino#
Uno de los aspectos más potentes de los pesos del modelo es su portabilidad. En lugar de entrenar un modelo desde cero (lo que requiere conjuntos de datos masivos y una potencia de cálculo significativa), los desarrolladores suelen utilizar el aprendizaje por transferencia. Esto implica tomar un modelo con pesos preentrenados en un conjunto de datos grande como COCO o ImageNet y adaptarlo a una tarea específica.
Por ejemplo, puedes tomar los pesos de un detector de objetos general y ajustarlos en un conjunto de datos más pequeño de paneles solares. Debido a que los pesos preentrenados ya entienden bordes, formas y texturas, el modelo converge mucho más rápido y requiere menos datos etiquetados. Herramientas como la Plataforma Ultralytics simplifican este proceso, permitiendo a los equipos gestionar conjuntos de datos, entrenar modelos en la nube e implementar pesos optimizados en dispositivos de borde de forma fluida.
Link to this sectionCompresión y optimización#
La investigación moderna en IA a menudo se centra en reducir el tamaño de archivo de los pesos del modelo sin sacrificar el rendimiento, un proceso conocido como cuantización de modelos. Al reducir la precisión de los pesos (por ejemplo, de coma flotante de 32 bits a enteros de 8 bits), los desarrolladores pueden disminuir significativamente el uso de memoria y mejorar la velocidad de inferencia. Esto es crucial para implementar modelos en hardware con recursos limitados como teléfonos móviles o dispositivos Raspberry Pi. Además, técnicas como la poda eliminan los pesos que contribuyen poco a la salida, optimizando aún más el modelo para aplicaciones en tiempo real.






