Domine a arte da engenharia de prompt para orientar modelos de IA como LLMs para saídas precisas e de alta qualidade em conteúdo, atendimento ao cliente e muito mais.
A engenharia de prompts é o processo estratégico de estruturação e otimização do texto de entrada, conhecido como prompts, para orientar modelos de Inteligência Artificial (IA) para gerar resultados específicos e de alta qualidade. Embora inicialmente popularizado pelo aparecimento de grandes modelos de linguagem (LLM) como o GPT-4, esta disciplina evoluiu para uma competência crítica para para interagir com vários sistemas generativos. Envolve a compreensão das nuances de como um modelo interpreta a linguagem, contexto e instruções para preencher a lacuna entre a intenção humana e a execução da máquina. Selecionando cuidadosamente as palavras, formatação de restrições e fornecendo contexto, os utilizadores podem melhorar significativamente a precisão e a relevância das respostas generativas da IA sem necessidade de alterar os parâmetros subjacentes do modelo.
Na sua essência, a engenharia de prontidão baseia-se no princípio de que os modelos de IA são sensíveis ao fraseado e à estrutura dos entradas. Um prompt bem concebido contém normalmente componentes específicos concebidos para reduzir a ambiguidade. Estes incluem instruções explícitas, informações de fundo relevantes (contexto) e especificações de saída, como o formato - por exemplo, solicitar uma por exemplo, solicitar uma resposta em JSON ou numa lista com marcadores. As técnicas avançadas incluem a aprendizagem de poucos disparos, em que o utilizador fornece exemplos dos pares de entrada-saída desejados no prompt para orientar o raciocínio do modelo. Outro método poderoso é o o raciocínio em cadeia, que encoraja o modelo a decompor problemas complexos em passos de raciocínio intermédios, melhorando o desempenho em tarefas de lógica pesada, tal como descrito em PesquisaGoogle publicações.
Embora frequentemente associada à geração de texto, a engenharia de prontidão é cada vez mais vital na Visão por computador (CV). Os modernos modelos multimodais e detectores de vocabulário aberto, como o YOLO, permitem aos utilizadores definir alvos de deteção de deteção utilizando linguagem natural em vez de IDs de classe predefinidos. Neste contexto, o "prompt" é o texto descrição textual do objeto (por exemplo, "capacete vermelho" vs. "capacete"). Esta capacidade, muitas vezes referida como aprendizagem zero-shot, permite que os modelos detect detetar objectos para os quais não foram explicitamente treinados, simplesmente processando a relação semântica entre o texto e as caraterísticas visuais.
O exemplo a seguir demonstra como o prompt engineering é aplicado programaticamente usando o
ultralytics para definir dinamicamente classes para
deteção de objectos:
from ultralytics import YOLO
# Load a YOLO-World model capable of interpreting text prompts
model = YOLO("yolo-world.pt")
# Use prompt engineering to define custom classes without retraining
# The model aligns these text descriptions with visual features
model.set_classes(["person in safety vest", "forklift", "cardboard box"])
# Run inference on an image to detect the prompted objects
results = model.predict("warehouse.jpg")
A utilidade da engenharia rápida estende-se a diversos sectores, melhorando a automatização e a criatividade:
É importante distinguir a engenharia de prontidão de termos semelhantes no panorama da aprendizagem automática: