Descubra la importancia de los pesos de los modelos en el aprendizaje automático, su papel en las predicciones y cómo Ultralytics YOLO simplifica su uso para las tareas de IA.
Los pesos del modelo son los parámetros fundamentales que se pueden aprender en una red neuronal y que transforman los datos de entrada en datos de salida. red neuronal que transforman los datos de entrada en en predicciones significativas. Funcionan de forma similar a la fuerza de las sinapsis en un cerebro biológico. numéricos determinan la influencia de una característica de entrada específica en la salida de la red. Cuando un modelo procesa información, como una imagen o un texto, los datos de entrada se multiplican por estos pesos capa por capa. La combinación La combinación final de estas señales ponderadas produce el resultado. clasificación de imágenes, traducción de idiomas o o la identificación de objetos en un flujo de vídeo.
Las ponderaciones no son estáticas; son valores dinámicos que se refinan durante el proceso de entrenamiento. Inicialmente, un modelo comienza con al azar, lo que significa que sus predicciones son esencialmente conjeturas. Mediante un ciclo conocido como aprendizaje supervisado, el modelo compara sus con un conjunto de datos de entrenamiento etiquetados. A fórmula matemática denominada función de pérdida calcula el error, la diferencia entre la predicción y la verdad real.
Para minimizar este error, el modelo emplea un algoritmo de optimización, como Descenso Gradiente Estocástico (SGD) o Adam. Este algoritmo calcula los gradientes mediante retropropagación para determinar exactamente peso debe ajustarse -aumentándolo o disminuyéndolo- para reducir el error en la siguiente iteración. Este ciclo se repite Este ciclo se repite durante muchas épocas hasta que los pesos convergen a un estado óptimo en el que el modelo alcanza una alta precisión. óptimo en el que el modelo alcanza una gran precisión.
Para entender bien las ponderaciones de los modelos, es útil distinguirlas de los términos relacionados en aprendizaje automático:
Entrenar un modelo desde cero requiere conjuntos de datos masivos y recursos informáticos. Para solucionarlo, los desarrolladores suelen utilizar pesos preentrenados. Esto implica tomar un modelo como YOLO11que ya ha aprendido representaciones de un gran conjunto de datos como COCOy aplicarlo a un nuevo problema.
Esta técnica, conocida como aprendizaje por transferencia permite a los usuarios afinar el modelo en un conjunto de datos.., conjunto de datos personalizado. Los pesos preentrenados proporcionan una "ventaja inicial" que permite al modelo reconocer bordes, texturas y formas inmediatamente, lo que agiliza el entrenamiento y mejora el rendimiento, texturas y formas, lo que permite un entrenamiento más rápido y un mejor rendimiento.
El siguiente fragmento de Python muestra cómo cargar pesos específicos preentrenados en un modelo YOLO11 para la detección inmediata de objetos. detección de objetos.
from ultralytics import YOLO
# Load the YOLO11 model with pre-trained weights (learned on COCO)
model = YOLO("yolo11n.pt")
# Run inference on an image using the loaded weights
# The weights determine the model's ability to recognize the bus
results = model("https://ultralytics.com/images/bus.jpg")
# Display the resulting bounding boxes and classes
results[0].show()
La utilidad práctica de las ponderaciones optimizadas de los modelos es evidente en varios sectores en los que se utilizan soluciones de IA. soluciones de IA:
A medida que avanza la investigación, la forma de manejar los pesos sigue evolucionando. Técnicas como cuantificación de modelos reducen la precisión de precisión de los pesos (por ejemplo, de un flotante de 32 bits a un entero de 8 bits) para reducir el tamaño del archivo y acelerar la inferencia en los dispositivos de borde sin sacrificar significativamente la precisión. sin sacrificar significativamente la precisión. Además, arquitecturas futuras como YOLO26 pretenden producir modelos que sean nativamente más eficientes, garantizando que los pesos aprendidos proporcionen el mayor rendimiento posible por parámetro. rendimiento por parámetro.
La gestión eficaz de estos archivos también es fundamental. Plataformas como Ultralytics Platform permiten a los equipos versionar, track y desplegar los pesos de sus modelos sin problemas, garantizando que la versión de mejor rendimiento de un modelo es siempre la que está en producción. y desplegar sus pesos de modelo sin problemas, garantizando que la versión de mejor rendimiento de un modelo es siempre la que está en producción.