Descubra como o ajuste das instruções alinha os modelos de IA com a intenção humana. Aprenda a treinar Ultralytics e outros modelos para seguir diretrizes específicas para tarefas melhores.
O ajuste de instruções é uma técnica especializada de aprendizagem automática usada para treinar modelos a seguir diretivas ou comandos específicos do utilizador. Ao contrário do pré-treinamento padrão, que geralmente se concentra em prever a próxima palavra em uma sequência ou reconhecer padrões gerais nos dados, o ajuste de instruções aproveita conjuntos de dados formatados como tarefas diretas. Ao expor o modelo a pares de entrada-saída estruturados como comandos explícitos e suas respostas corretas correspondentes, os desenvolvedores podem transformar um modelo básico de uso geral em um assistente altamente responsivo e orientado para tarefas. Essa abordagem é amplamente utilizada em IA generativa para alinhar modelos com a intenção humana, garantindo que os resultados sejam relevantes, seguros e acionáveis.
O processo envolve a atualização dos pesos do modelo usando um conjunto de dados altamente selecionado de instruções. Esses conjuntos de dados abrangem diversos domínios, desde a resolução de equações matemáticas até a análise de imagens. Durante o treinamento, o modelo aprende a relação estrutural entre a formulação imperativa de uma instrução (por exemplo, "Resuma este texto" ou "Identifique os objetos nesta imagem") e o formato de saída desejado. Pesquisas recentes, como estudos sobre FLAN (Fine-tuned Language Net) pelo Google, demonstram que modelos ajustados por instruções exibem capacidades de aprendizagem zero-shot amplamente aprimoradas em tarefas não vistas .
O ajuste das instruções revelou capacidades transformadoras tanto na modalidade textual como na visual:
Para gerir os conjuntos de dados de alta qualidade necessários para esses fluxos de trabalho avançados, as equipas recorrem frequentemente à Ultralytics , que simplifica a anotação de conjuntos de dados, a organização de projetos e as implementações de formação baseadas na nuvem.
Para arquitetar corretamente os pipelines de IA, é importante distinguir o ajuste de instruções de técnicas semelhantes de otimização de modelos :
Para programadores que criam pipelines personalizados de visão computacional, adaptar um modelo básico a restrições de tarefas específicas é um requisito comum. Embora o ajuste completo das instruções exija conjuntos de dados massivos especializados, adaptar modelos poderosos como Ultralytics a tarefas de domínios específicos usa princípios semelhantes de adaptação supervisionada.
from ultralytics import YOLO
# Load a pre-trained YOLO26 foundation model
model = YOLO("yolo26n.pt")
# Adapt the model weights to a custom task dataset using the PyTorch backend
# This process aligns the model's predictive capabilities with user-defined classes
results = model.train(data="custom_task.yaml", epochs=50, imgsz=640)
Ao aproveitar essas metodologias avançadas de treinamento, os desenvolvedores podem implementar sistemas de IA robustos que interpretam e executam comandos complexos de forma confiável, preenchendo a lacuna entre o aprendizado profundo teórico e o software prático e centrado no utilizador. Para ler mais sobre mecanismos de treinamento, explore PyTorch oficial PyTorch sobre treinamento de redes neurais.