Glossário

Ajuste Fino Eficiente em Parâmetros (PEFT)

Descubra o Fine-Tuning com Eficiência de Parâmetros (PEFT) para adaptar grandes modelos de IA com recursos mínimos. Economize custos, evite overfitting e otimize a implementação!

O ajuste fino com eficiência de parâmetros (PEFT) é um conjunto de técnicas usadas em aprendizado de máquina para adaptar grandes modelos pré-treinados a novas tarefas específicas, sem a necessidade de retreinar todo o modelo. À medida que os modelos de fundação em campos como Processamento de Linguagem Natural (NLP) e Visão Computacional (CV) crescem para bilhões de parâmetros, o ajuste fino completo se torna computacionalmente caro e requer armazenamento de dados significativo para cada nova tarefa. O PEFT aborda isso congelando a grande maioria dos pesos do modelo pré-treinado e treinando apenas um pequeno número de parâmetros adicionais ou existentes. Essa abordagem reduz drasticamente os custos computacionais e de armazenamento, diminui o risco de esquecimento catastrófico (onde um modelo esquece suas capacidades originais) e torna viável personalizar um único modelo grande para muitas aplicações diferentes.

Como funciona o PEFT?

O princípio fundamental por trás do PEFT é fazer alterações mínimas e direcionadas a um modelo pré-treinado. Em vez de atualizar todos os parâmetros, os métodos PEFT introduzem um pequeno conjunto de parâmetros treináveis ou selecionam um pequeno subconjunto dos existentes para atualizar durante o treino. Esta é uma forma de transfer learning que otimiza a eficiência. Existem vários métodos PEFT populares, cada um com uma estratégia diferente:

LoRA (Adaptação de Baixa Classificação): Esta técnica injeta pequenas matrizes de baixa classificação treináveis nas camadas do modelo pré-treinado, frequentemente dentro do mecanismo de atenção. Essas matrizes de "adaptador" são significativamente menores do que as matrizes de peso originais, tornando o treinamento rápido e eficiente. O artigo de pesquisa original do LoRA fornece mais detalhes técnicos.
Ajuste de Prompt (Prompt Tuning): Em vez de modificar a arquitetura do modelo, este método mantém o modelo totalmente congelado e aprende um conjunto de "soft prompts" ou vetores de embedding treináveis. Esses vetores são adicionados à sequência de entrada para guiar a saída do modelo para uma tarefa específica, conforme detalhado em seu artigo fundamental.
Ajuste de Adaptadores: Este método envolve a inserção de pequenos módulos de rede neural totalmente conectados, conhecidos como "adaptadores", entre as camadas do modelo pré-treinado. Apenas os parâmetros desses novos adaptadores são treinados.

Estes e outros métodos são amplamente acessíveis através de frameworks como a biblioteca Hugging Face PEFT, que simplifica a sua implementação.

PEFT vs. Conceitos Relacionados

É importante diferenciar PEFT de outras estratégias de adaptação de modelos:

Ajuste Fino Completo: Em contraste com o PEFT, o ajuste fino completo atualiza todos os pesos de um modelo pré-treinado. Isso exige muitos recursos, necessitando de uma GPU poderosa e grande armazenamento para cada versão do modelo ajustado.
Engenharia de Prompt: Esta técnica envolve projetar manualmente prompts eficazes baseados em texto para orientar o comportamento de um modelo. Não envolve nenhum treinamento ou atualização de parâmetros; trata-se puramente de criar a entrada para obter a saída desejada de um modelo congelado.
Destilação de Conhecimento: Isso envolve treinar um modelo "estudante" menor para imitar o comportamento de um modelo "professor" maior, pré-treinado. Embora crie um modelo menor, o processo em si ainda pode ser computacionalmente intensivo.

Aplicações no Mundo Real

O PEFT permite a aplicação prática de modelos grandes em vários domínios:

Processamento de Linguagem Natural (NLP): Uma empresa pode usar PEFT para adaptar um modelo de propósito geral como GPT-4 ou BERT para criar um chatbot especializado para sua base de conhecimento interna. Em vez de um retreinamento completo dispendioso, eles podem usar um método como LoRA para ensinar ao modelo a terminologia e os procedimentos específicos da empresa, resultando em respostas mais precisas para o atendimento ao cliente ou suporte interno. Grupos de pesquisa como o Stanford NLP Group exploram esses tipos de aplicações.
Visão Computacional (VC): O PEFT pode personalizar grandes modelos de visão, como Vision Transformers (ViT) ou modelos Ultralytics YOLO, para tarefas específicas de reconhecimento visual. Por exemplo, um modelo pré-treinado no amplo conjunto de dados COCO pode ser adaptado usando PEFT para detecção de objetos precisa de defeitos únicos no controle de qualidade de fabricação, realizando segmentação de imagem especializada para análise de imagens médicas ou identificando certas espécies de animais em armadilhas fotográficas de conservação da vida selvagem. Plataformas como o Ultralytics HUB podem ajudar a gerenciar esses modelos e experimentos adaptados.

Em essência, o Fine-Tuning com Eficiência de Parâmetros torna os modelos de IA de última geração mais versáteis e económicos de adaptar, democratizando o acesso a capacidades de IA poderosas para uma ampla gama de aplicações específicas.

Ajuste Fino Eficiente em Parâmetros (PEFT)

Treine modelos Ultralytics YOLO para otimizar fluxos de trabalho em todos os setores

Solução de licenciamento empresarial flexível para impulsionar sua inovação

Treine modelos de IA em segundos com o Ultralytics YOLO

Como funciona o PEFT?

PEFT vs. Conceitos Relacionados

Aplicações no Mundo Real

Leia mais nesta categoria

Um guia rápido para principiantes sobre como treinar um modelo de IA

Do Dubai, com ideias: Principais conclusões da Cimeira GDG MENA-T 2025

Explorando o aprendizado por ensemble e seu papel na IA e ML

Junte-se à comunidade Ultralytics