Yolo Vision Shenzhen
Shenzhen
Junte-se agora
Glossário

Aritmética de tarefas

Descubra como a aritmética de tarefas utiliza atualizações de peso para ajustar o comportamento do modelo. Aprenda a combinar tarefas ou a desaprender características no Ultralytics sem necessidade de um novo treino completo.

A aritmética de tarefas é uma técnica avançada de aprendizagem automática que envolve a modificação do comportamento de redes neurais pré-treinadas através da adição ou subtração de atualizações específicas dos pesos. Em vez de treinar novamente um modelo do zero, os profissionais podem isolar as diferenças aprendidas entre um modelo base e um modelo aperfeiçoado. Estas diferenças são, essencialmente, atualizações direcionais que encapsulam uma capacidade ou comportamento específico. Ao aplicar operações matemáticas básicas, como adição e subtração, a estas atualizações, os programadores podem editar dinamicamente sistemas de aprendizagem profunda. Este paradigma ganhou força significativa em recentes investigações do arXiv sobre aritmética de tarefas, oferecendo um método leve e computacionalmente eficiente para adaptar modelos em grande escala a novos requisitos.

Como funciona o conceito

A base desta técnica assenta no cálculo da diferença nos pesos do modelo entre um modelo pré-treinado de base e uma versão que tenha sido submetida a um ajuste fino num conjunto de dados específico. Esta diferença isolada torna-se uma representação localizada da nova competência. Ao manipulardiretamente os dicionários PyTorch ou ao utilizar metodologiasTensorFlow , os engenheiros podem escalar e combinar estas diferenças de pesos. Por exemplo, subtrair uma atualização de peso específica pode forçar um modelo a «esquecer» um comportamento aprendido, um conceito amplamente explorado na Anthropic sobre segurança de modelos.

Aplicações no Mundo Real

A aritmética de tarefas permite vários fluxos de trabalho altamente eficientes em pipelines modernos de visão computacional e processamento de linguagem natural :

Diferenciação de conceitos relacionados

Ao navegar pelos arquivos do IEEE Xplore ou pela biblioteca digital da ACM, é fácil confundir a aritmética de tarefas com metodologias relacionadas :

  • Vetores de tarefa: Estes são os tensores matemáticos propriamente ditos (as diferenças de peso calculadas) utilizados durante o processo aritmético . A aritmética de tarefas é a estrutura global de somar ou subtrair estes vetores.
  • Fusão de modelos: Este é um termo mais abrangente para designar a combinação de vários modelos. Embora a aritmética seja uma forma de combinar modelos, a fusão pode também envolver redes de encaminhamento complexas ou ensamblagem.
  • Aprendizagem por transferência: De acordo com os conceitos de aprendizagem por transferência da Wikipédia, isto envolve utilizar o conhecimento de uma tarefa como ponto de partida para outra, o que normalmente requer mais ciclos de treino. A aritmética de tarefas modifica comportamentos exclusivamente através de cálculos diretos de pesos, sem ciclos de treino adicionais.

Implementação de operações aritméticas

A aplicação destas estratégias de otimização de modelos na prática requer uma gestão cuidadosa do estado interno do modelo. Segue-se um exemplo de cálculo e aplicação de uma atualização utilizando PyTorch, uma técnica frequentemente abordada em artigos recentes sobre visão computacional.

import torch

# Load the state dictionaries of the pre-trained base and fine-tuned models
base_weights = torch.load("yolo26_base.pt")
tuned_weights = torch.load("yolo26_tuned.pt")

# Calculate the task vector and add it back to the base model with a scaling factor
scaling_factor = 0.5
for key in base_weights.keys():
    task_vector = tuned_weights[key] - base_weights[key]
    base_weights[key] += scaling_factor * task_vector

Para equipas que gerem fluxos de trabalho complexos de anotação de dados e várias versões de modelos ajustadas, a Ultralytics oferece um ambiente simplificado para supervisionar o treino na nuvem e a implementação sem interrupções, tornando a gestão das melhorias iterativas dos modelos muito mais eficiente.

Vamos construir juntos o futuro da IA!

Comece sua jornada com o futuro do aprendizado de máquina