Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Pesos del Modelo

Descubra la importancia de los pesos de los modelos en el aprendizaje automático, su papel en las predicciones y cómo Ultralytics YOLO simplifica su uso para las tareas de IA.

Los pesos del modelo son los parámetros fundamentales que se pueden aprender en una red neuronal y que transforman los datos de entrada en datos de salida. red neuronal que transforman los datos de entrada en en predicciones significativas. Funcionan de forma similar a la fuerza de las sinapsis en un cerebro biológico. numéricos determinan la influencia de una característica de entrada específica en la salida de la red. Cuando un modelo procesa información, como una imagen o un texto, los datos de entrada se multiplican por estos pesos capa por capa. La combinación La combinación final de estas señales ponderadas produce el resultado. clasificación de imágenes, traducción de idiomas o o la identificación de objetos en un flujo de vídeo.

Cómo se aprenden las ponderaciones de los modelos

Las ponderaciones no son estáticas; son valores dinámicos que se refinan durante el proceso de entrenamiento. Inicialmente, un modelo comienza con al azar, lo que significa que sus predicciones son esencialmente conjeturas. Mediante un ciclo conocido como aprendizaje supervisado, el modelo compara sus con un conjunto de datos de entrenamiento etiquetados. A fórmula matemática denominada función de pérdida calcula el error, la diferencia entre la predicción y la verdad real.

Para minimizar este error, el modelo emplea un algoritmo de optimización, como Descenso Gradiente Estocástico (SGD) o Adam. Este algoritmo calcula los gradientes mediante retropropagación para determinar exactamente peso debe ajustarse -aumentándolo o disminuyéndolo- para reducir el error en la siguiente iteración. Este ciclo se repite Este ciclo se repite durante muchas épocas hasta que los pesos convergen a un estado óptimo en el que el modelo alcanza una alta precisión. óptimo en el que el modelo alcanza una gran precisión.

Diferenciar conceptos clave

Para entender bien las ponderaciones de los modelos, es útil distinguirlas de los términos relacionados en aprendizaje automático:

  • Prejuicios: Mientras que los pesos controlan la inclinación o la escala de la transformación, los sesgos permiten que la función de activación se desplace a la izquierda o a la derecha. a la izquierda o a la derecha. Juntos, los weights and biases permiten a la red ajustarse a patrones de datos complejos y no lineales.
  • Hiperparámetros: Las ponderaciones se aprenden a partir de los datos, mientras que los hiperparámetros son ajustes estructurales configurados antes de comenzar el entrenamiento. Algunos ejemplos son velocidad de aprendizaje, el tamaño del lote y el número de capas de la red.
  • Arquitectura Modelo: La arquitectura actúa como el plano o esqueleto de la red (por ejemplo, ResNet o un Transformer), definiendo cómo se conectan las neuronas. las neuronas. Los pesos son los valores específicos almacenados dentro de esa estructura.

El poder del aprendizaje por transferencia

Entrenar un modelo desde cero requiere conjuntos de datos masivos y recursos informáticos. Para solucionarlo, los desarrolladores suelen utilizar pesos preentrenados. Esto implica tomar un modelo como YOLO11que ya ha aprendido representaciones de un gran conjunto de datos como COCOy aplicarlo a un nuevo problema.

Esta técnica, conocida como aprendizaje por transferencia permite a los usuarios afinar el modelo en un conjunto de datos.., conjunto de datos personalizado. Los pesos preentrenados proporcionan una "ventaja inicial" que permite al modelo reconocer bordes, texturas y formas inmediatamente, lo que agiliza el entrenamiento y mejora el rendimiento, texturas y formas, lo que permite un entrenamiento más rápido y un mejor rendimiento.

El siguiente fragmento de Python muestra cómo cargar pesos específicos preentrenados en un modelo YOLO11 para la detección inmediata de objetos. detección de objetos.

from ultralytics import YOLO

# Load the YOLO11 model with pre-trained weights (learned on COCO)
model = YOLO("yolo11n.pt")

# Run inference on an image using the loaded weights
# The weights determine the model's ability to recognize the bus
results = model("https://ultralytics.com/images/bus.jpg")

# Display the resulting bounding boxes and classes
results[0].show()

Aplicaciones en el mundo real

La utilidad práctica de las ponderaciones optimizadas de los modelos es evidente en varios sectores en los que se utilizan soluciones de IA. soluciones de IA:

  • La IA en la sanidad: Los radiólogos utilizan modelos con ponderaciones ajustadas a las imágenes médicas para ayudar en el diagnóstico. Por ejemplo, un modelo puede identificar tumores cerebrales en resonancias magnéticas. Los pesos de Las ponderaciones de este modelo específico han aprendido a distinguir las sutiles diferencias de textura entre el tejido sano y las anomalías, proporcionando una segunda opinión que aumenta la confianza en el diagnóstico. y las anomalías, lo que proporciona una segunda opinión que aumenta la confianza en el diagnóstico.
  • Sistemas inteligentes para minoristas: Los minoristas utilizan la visión por ordenador para automatizar los procesos de caja. Un sistema de cámaras equipado con pesos modelo entrenados en el embalaje de productos puede reconocer instantáneamente reconocer al instante los artículos colocados en un mostrador. Esta aplicación se basa en la capacidad de las pesas para asignar entradas visuales, como el color y el logotipo de una caja de cereales, a la referencia correcta del producto. como el color y el logotipo de una caja de cereales, a la referencia de gestión de inventario.

El futuro de las ponderaciones por modelo

A medida que avanza la investigación, la forma de manejar los pesos sigue evolucionando. Técnicas como cuantificación de modelos reducen la precisión de precisión de los pesos (por ejemplo, de un flotante de 32 bits a un entero de 8 bits) para reducir el tamaño del archivo y acelerar la inferencia en los dispositivos de borde sin sacrificar significativamente la precisión. sin sacrificar significativamente la precisión. Además, arquitecturas futuras como YOLO26 pretenden producir modelos que sean nativamente más eficientes, garantizando que los pesos aprendidos proporcionen el mayor rendimiento posible por parámetro. rendimiento por parámetro.

La gestión eficaz de estos archivos también es fundamental. Plataformas como Ultralytics Platform permiten a los equipos versionar, track y desplegar los pesos de sus modelos sin problemas, garantizando que la versión de mejor rendimiento de un modelo es siempre la que está en producción. y desplegar sus pesos de modelo sin problemas, garantizando que la versión de mejor rendimiento de un modelo es siempre la que está en producción.

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora