Instruction Tuning

Descobre como o ajuste de instruções alinha modelos de IA com a intenção humana. Aprende a treinar o Ultralytics YOLO26 e outros modelos para seguir diretrizes específicas para melhores tarefas.

O ajuste de instruções é uma técnica especializada de machine learning usada para treinar modelos a seguir diretrizes ou comandos específicos do usuário. Ao contrário do pré-treinamento padrão, que frequentemente foca em prever a próxima palavra em uma sequência ou reconhecer padrões gerais em dados, o ajuste de instruções aproveita conjuntos de dados formatados como tarefas diretas. Ao expor o modelo a pares de entrada-saída estruturados como comandos explícitos e suas respostas corretas correspondentes, os desenvolvedores podem transformar um modelo fundamental de uso geral em um assistente altamente responsivo e orientado a tarefas. Esta abordagem é amplamente utilizada em Generative AI para alinhar modelos com a intenção humana, garantindo que as saídas sejam relevantes, seguras e acionáveis.

Link to this sectionComo o Ajuste de Instruções Funciona#

O processo envolve a atualização dos model weights de um modelo usando um conjunto de dados altamente curado de instruções. Esses conjuntos de dados abrangem diversos domínios, desde a resolução de equações matemáticas até a análise de imagens. Durante o treinamento, o modelo aprende a relação estrutural entre a formulação imperativa de uma instrução (por exemplo, "Resuma este texto" ou "Identifique os objetos nesta imagem") e o formato de saída desejado. Pesquisas recentes, como estudos sobre FLAN (Fine-tuned Language Net) do Google, demonstram que modelos ajustados por instruções exibem capacidades de zero-shot learning vastamente aprimoradas em tarefas inéditas.

Link to this sectionAplicações no Mundo Real#

O ajuste de instruções desbloqueou capacidades transformadoras em modalidades de texto e visuais:

Assistentes de IA Interativos: Chatbots modernos dependem fortemente do ajuste de instruções para processar diálogos complexos e executar lógica de várias etapas. Esse ajuste garante que, quando um usuário pede ao sistema para formatar dados como um objeto JSON, o modelo adere estritamente a essa restrição em vez de gerar preenchimento conversacional. A pesquisa da OpenAI sobre InstructGPT destaca como essa técnica reduz saídas tóxicas e melhora o alinhamento.
Modelos de Visão e Linguagem (VLMs): Em computer vision, o ajuste de instruções é usado para construir sistemas de visão flexíveis e passíveis de prompt. Em vez de um pipeline de object detection rígido que detecta um conjunto fixo de classes, um modelo de visão ajustado por instruções pode processar um comando como "Encontre o produto com defeito na linha de montagem" e ajustar seu foco dinamicamente.

Para gerenciar os conjuntos de dados de alta qualidade necessários para esses fluxos de trabalho avançados, as equipes recorrem frequentemente à Ultralytics Platform, que simplifica a anotação de dados, a organização de projetos e as implantações de treinamento baseadas em nuvem.

Link to this sectionDistinguindo Conceitos Relacionados#

Para arquitetar pipelines de IA adequadamente, é importante distinguir o ajuste de instruções de técnicas semelhantes de otimização de modelos:

Prompt Tuning vs. Instruction Tuning: O prompt tuning é um método eficiente em parâmetros que otimiza um pequeno conjunto de "soft prompts" (tensores treináveis) enquanto mantém o modelo base congelado. Em contraste, o ajuste de instruções normalmente envolve a atualização de todo o modelo (ou porções significativas dele) usando supervised learning em conjuntos de dados de instruções.
Fine-Tuning vs. Instruction Tuning: O fine-tuning tradicional adapta um modelo a um domínio específico (por exemplo, literatura médica) sem necessariamente ensinar a seguir comandos. O ajuste de instruções é um subconjunto distinto de fine-tuning projetado explicitamente para melhorar a execução de tarefas e o natural language understanding em uma ampla gama de instruções variadas.

Link to this sectionAdaptando Modelos na Prática#

Para desenvolvedores que constroem pipelines de visão computacional personalizados, adaptar um modelo fundamental a restrições de tarefas específicas é um requisito comum. Embora o ajuste de instruções completo exija conjuntos de dados massivos e especializados, adaptar modelos poderosos como o Ultralytics YOLO26 para tarefas de domínio específico usa princípios semelhantes de adaptação supervisionada.

from ultralytics import YOLO

# Load a pre-trained YOLO26 foundation model
model = YOLO("yolo26n.pt")

# Adapt the model weights to a custom task dataset using the PyTorch backend
# This process aligns the model's predictive capabilities with user-defined classes
results = model.train(data="custom_task.yaml", epochs=50, imgsz=640)

Ao aproveitar essas metodologias de treinamento avançadas, desenvolvedores podem implantar sistemas de IA robustos que interpretam e executam comandos complexos de forma confiável, unindo a lacuna entre o deep learning teórico e o software prático centrado no usuário. Para mais leituras sobre mecanismos de treinamento, explore a documentação oficial do PyTorch sobre treinamento de redes neurais.

Instruction Tuning

Link to this sectionComo o Ajuste de Instruções Funciona#

Link to this sectionAplicações no Mundo Real#

Link to this sectionDistinguindo Conceitos Relacionados#

Link to this sectionAdaptando Modelos na Prática#

Explore solutions

IA em robótica

IA na Logística

IA no varejo

IA na Saúde

IA na Fabricação

IA no Setor Automóvel

IA na Agricultura

IA em robótica

IA na Logística

IA no varejo

IA na Saúde

IA na Fabricação

IA no Setor Automóvel

IA na Agricultura

IA em robótica

IA na Logística

IA no varejo

IA na Saúde

IA na Fabricação

IA no Setor Automóvel

IA na Agricultura

Vamos construir o futuro da IA juntos!