Yolo Vision Shenzhen
Shenzhen
Junte-se agora
Glossário

Ajuste das instruções

Descubra como o ajuste das instruções alinha os modelos de IA com a intenção humana. Aprenda a treinar Ultralytics e outros modelos para seguir diretrizes específicas para tarefas melhores.

O ajuste de instruções é uma técnica especializada de aprendizagem automática usada para treinar modelos a seguir diretivas ou comandos específicos do utilizador. Ao contrário do pré-treinamento padrão, que geralmente se concentra em prever a próxima palavra em uma sequência ou reconhecer padrões gerais nos dados, o ajuste de instruções aproveita conjuntos de dados formatados como tarefas diretas. Ao expor o modelo a pares de entrada-saída estruturados como comandos explícitos e suas respostas corretas correspondentes, os desenvolvedores podem transformar um modelo básico de uso geral em um assistente altamente responsivo e orientado para tarefas. Essa abordagem é amplamente utilizada em IA generativa para alinhar modelos com a intenção humana, garantindo que os resultados sejam relevantes, seguros e acionáveis.

Como funciona o ajuste das instruções

O processo envolve a atualização dos pesos do modelo usando um conjunto de dados altamente selecionado de instruções. Esses conjuntos de dados abrangem diversos domínios, desde a resolução de equações matemáticas até a análise de imagens. Durante o treinamento, o modelo aprende a relação estrutural entre a formulação imperativa de uma instrução (por exemplo, "Resuma este texto" ou "Identifique os objetos nesta imagem") e o formato de saída desejado. Pesquisas recentes, como estudos sobre FLAN (Fine-tuned Language Net) pelo Google, demonstram que modelos ajustados por instruções exibem capacidades de aprendizagem zero-shot amplamente aprimoradas em tarefas não vistas .

Aplicações no Mundo Real

O ajuste das instruções revelou capacidades transformadoras tanto na modalidade textual como na visual:

  • Assistentes interativos de IA: os chatbots modernos dependem muito do ajuste de instruções para processar diálogos complexos e executar lógicas de várias etapas. Esse ajuste garante que, quando um utilizador pede ao sistema para formatar dados como um objeto JSON , o modelo siga rigorosamente essa restrição, em vez de gerar preenchimentos conversacionais. A pesquisa da OpenAI sobre o InstructGPT destaca como essa técnica reduz resultados tóxicos e melhora o alinhamento.
  • Modelos de Visão-Linguagem (VLMs): Na visão computacional, o ajuste de instruções é usado para construir sistemas de visão flexíveis e prontos para uso. Em vez de um pipeline rígido de detecção de objetos que detecta um conjunto fixo de classes, um modelo de visão ajustado por instruções pode processar um comando como "Encontre o produto defeituoso na linha de montagem" e ajustar seu foco dinamicamente.

Para gerir os conjuntos de dados de alta qualidade necessários para esses fluxos de trabalho avançados, as equipas recorrem frequentemente à Ultralytics , que simplifica a anotação de conjuntos de dados, a organização de projetos e as implementações de formação baseadas na nuvem.

Distinguir conceitos relacionados

Para arquitetar corretamente os pipelines de IA, é importante distinguir o ajuste de instruções de técnicas semelhantes de otimização de modelos :

  • Ajuste de prompt vs. ajuste de instrução: O ajuste de prompt é um método eficiente em termos de parâmetros que otimiza um pequeno conjunto de "prompts suaves" (tensores aprendíveis ) enquanto mantém o modelo base congelado. Em contrapartida, o ajuste de instrução normalmente envolve a atualização de todo o modelo (ou partes significativas dele) usando aprendizagem supervisionada em conjuntos de dados de instrução.
  • Ajustes finos vs. ajustes de instruções: Os ajustes finos tradicionais adaptam um modelo a um domínio específico (por exemplo, literatura médica) sem necessariamente ensinar como seguir comandos. Os ajustes de instruções são um subconjunto distinto dos ajustes finos, projetado explicitamente para melhorar a execução de tarefas e a compreensão da linguagem natural em uma ampla variedade de instruções.

Adaptando modelos na prática

Para programadores que criam pipelines personalizados de visão computacional, adaptar um modelo básico a restrições de tarefas específicas é um requisito comum. Embora o ajuste completo das instruções exija conjuntos de dados massivos especializados, adaptar modelos poderosos como Ultralytics a tarefas de domínios específicos usa princípios semelhantes de adaptação supervisionada.

from ultralytics import YOLO

# Load a pre-trained YOLO26 foundation model
model = YOLO("yolo26n.pt")

# Adapt the model weights to a custom task dataset using the PyTorch backend
# This process aligns the model's predictive capabilities with user-defined classes
results = model.train(data="custom_task.yaml", epochs=50, imgsz=640)

Ao aproveitar essas metodologias avançadas de treinamento, os desenvolvedores podem implementar sistemas de IA robustos que interpretam e executam comandos complexos de forma confiável, preenchendo a lacuna entre o aprendizado profundo teórico e o software prático e centrado no utilizador. Para ler mais sobre mecanismos de treinamento, explore PyTorch oficial PyTorch sobre treinamento de redes neurais.

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Conecte-se, colabore e cresça com inovadores globais

Junte-se agora