Glossário

Pesos do modelo

Descubra a importância dos pesos dos modelos na aprendizagem automática, o seu papel nas previsões e como o Ultralytics YOLO simplifica a sua utilização em tarefas de IA.

Os pesos do modelo são os parâmetros numéricos de uma rede neural que são ajustados durante o processo de formação. Esses valores representam essencialmente o conhecimento aprendido de um modelo. Pense neles como os coeficientes de uma equação muito complexa; ao ajustar estes coeficientes, o modelo aprende a mapear os dados de entrada, como uma imagem, para uma saída desejada, como uma caixa delimitadora em torno de um objeto. A qualidade dos pesos de um modelo determina diretamente o seu desempenho numa determinada tarefa, como a classificação de imagens ou a deteção de objectos.

Como são determinados os pesos

Os pesos do modelo não são definidos manualmente, mas são "aprendidos" a partir dos dados. O processo começa com a inicialização dos pesos com pequenos números aleatórios. Durante o treino, o modelo faz previsões sobre os dados de treino e uma função de perda calcula o grau de erro dessas previsões. Este sinal de erro é depois utilizado num processo chamado retropropagação para calcular o gradiente da perda em relação a cada peso. Um algoritmo de otimização, como o Stochastic Gradient Descent (SGD), ajusta então os pesos na direção oposta ao gradiente para minimizar o erro. Este ciclo é repetido durante muitas épocas até que o desempenho do modelo num conjunto de dados de validação separado deixe de melhorar, um sinal de que aprendeu os padrões nos dados.

A importância dos pesos pré-treinados

O treino de um modelo topo de gama a partir do zero requer imensos recursos computacionais e conjuntos de dados maciços. Para ultrapassar este problema, a comunidade da visão computacional utiliza amplamente pesos pré-treinados. Isto implica a utilização de um modelo, como o modelo Ultralytics YOLO, que já foi treinado num grande conjunto de dados de uso geral, como o COCO. Estes pesos servem como um excelente ponto de partida para uma tarefa nova e específica através de um processo chamado aprendizagem por transferência. Ao começar com pesos pré-treinados, é possível obter maior precisão com menos dados e tempos de treinamento mais curtos por meio de um processo conhecido como ajuste fino.

Aplicações no mundo real

  • Análise de imagens médicas: Um programador pode pegar num modelo YOLOv8 com os seus pesos pré-treinados e afiná-lo num conjunto de dados personalizado de exames de tumores cerebrais. O modelo resultante tem pesos especificamente optimizados para identificar os padrões subtis dos tumores, ajudando os radiologistas no diagnóstico. Esta é uma aplicação fundamental da IA nos cuidados de saúde.
  • Gestão do inventário de retalho: Uma empresa de retalho pode utilizar um modelo para monitorizar as prateleiras e contar os produtos. Um modelo de deteção de objectos é afinado em imagens dos produtos da loja. Os pesos finais permitem que o modelo detecte e conte com precisão itens específicos para o controlo automático do inventário.

Pesos vs. conceitos relacionados

É importante distinguir os pesos dos modelos de outros termos relacionados com a aprendizagem automática:

  • Hiperparâmetros: Ao contrário dos pesos, que são aprendidos, os hiperparâmetros são configurados antes do início do treino. Os exemplos incluem a taxa de aprendizagem, o tamanho do lote e a escolha do optimizador. O processo de encontrar a melhor configuração de hiperparâmetros é conhecido como ajuste de hiperparâmetros.
  • Polarização: Os pesos e as polarizações são ambos parâmetros aprendidos. No entanto, os pesos dimensionam a saída de um neurónio, enquanto um termo de polarização a desloca. Juntos, eles dão a uma rede neural a flexibilidade para se ajustar aos dados.
  • Arquitetura do modelo: A arquitetura (por exemplo, a espinha dorsal ou a cabeça de deteção) é a planta do modelo - define as camadas e a forma como estão ligadas. Os pesos são os valores dentro dessa estrutura. A mesma arquitetura pode ter inúmeros conjuntos de pesos diferentes, dependendo da forma como foi treinada. É possível explorar diferentes comparações de modelos para ver como as arquitecturas variam.

Gestão e controlo de pesos

À medida que os modelos se tornam mais complexos, a gestão dos seus pesos e das experiências que os produzem torna-se crucial para a reprodutibilidade e a colaboração. Ferramentas como o Weights & Biases (W&B) fornecem uma plataforma específica para MLOps, permitindo às equipas controlar hiperparâmetros, métricas, versões de código e os pesos dos modelos resultantes de cada experiência. É importante notar que a plataforma "Weights & Biases" é diferente dos conceitos de "pesos" e "biases" como parâmetros dentro de uma rede neural; a plataforma ajuda a gerir o processo de encontrar pesos e biases óptimos. Pode obter mais informações sobre a integração do Ultralytics com a W&B na documentação. A gestão eficiente é fundamental para tarefas que vão desde a afinação de hiperparâmetros até à implementação de modelos utilizando estruturas como PyTorch ou TensorFlow. Plataformas como o Ultralytics HUB também fornecem soluções integradas para gerir todo o ciclo de vida do modelo.

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Ligue-se, colabore e cresça com inovadores globais

Aderir agora
Ligação copiada para a área de transferência