Glossário

Engenharia de Prompt

Domine a arte da engenharia de prompt para orientar modelos de IA como LLMs para saídas precisas e de alta qualidade em conteúdo, atendimento ao cliente e muito mais.

A engenharia de prompts é o processo estratégico de estruturação e otimização do texto de entrada, conhecido como prompts, para orientar modelos de Inteligência Artificial (IA) para gerar resultados específicos e de alta qualidade. Embora inicialmente popularizado pelo aparecimento de grandes modelos de linguagem (LLM) como o GPT-4, esta disciplina evoluiu para uma competência crítica para para interagir com vários sistemas generativos. Envolve a compreensão das nuances de como um modelo interpreta a linguagem, contexto e instruções para preencher a lacuna entre a intenção humana e a execução da máquina. Selecionando cuidadosamente as palavras, formatação de restrições e fornecendo contexto, os utilizadores podem melhorar significativamente a precisão e a relevância das respostas generativas da IA sem necessidade de alterar os parâmetros subjacentes do modelo.

A mecânica de prompts eficazes

Na sua essência, a engenharia de prontidão baseia-se no princípio de que os modelos de IA são sensíveis ao fraseado e à estrutura dos entradas. Um prompt bem concebido contém normalmente componentes específicos concebidos para reduzir a ambiguidade. Estes incluem instruções explícitas, informações de fundo relevantes (contexto) e especificações de saída, como o formato - por exemplo, solicitar uma por exemplo, solicitar uma resposta em JSON ou numa lista com marcadores. As técnicas avançadas incluem a aprendizagem de poucos disparos, em que o utilizador fornece exemplos dos pares de entrada-saída desejados no prompt para orientar o raciocínio do modelo. Outro método poderoso é o o raciocínio em cadeia, que encoraja o modelo a decompor problemas complexos em passos de raciocínio intermédios, melhorando o desempenho em tarefas de lógica pesada, tal como descrito em PesquisaGoogle publicações.

Relevância em Visão Computacional

Embora frequentemente associada à geração de texto, a engenharia de prontidão é cada vez mais vital na Visão por computador (CV). Os modernos modelos multimodais e detectores de vocabulário aberto, como o YOLO, permitem aos utilizadores definir alvos de deteção de deteção utilizando linguagem natural em vez de IDs de classe predefinidos. Neste contexto, o "prompt" é o texto descrição textual do objeto (por exemplo, "capacete vermelho" vs. "capacete"). Esta capacidade, muitas vezes referida como aprendizagem zero-shot, permite que os modelos detect detetar objectos para os quais não foram explicitamente treinados, simplesmente processando a relação semântica entre o texto e as caraterísticas visuais.

O exemplo a seguir demonstra como o prompt engineering é aplicado programaticamente usando o ultralytics para definir dinamicamente classes para deteção de objectos:

from ultralytics import YOLO

# Load a YOLO-World model capable of interpreting text prompts
model = YOLO("yolo-world.pt")

# Use prompt engineering to define custom classes without retraining
# The model aligns these text descriptions with visual features
model.set_classes(["person in safety vest", "forklift", "cardboard box"])

# Run inference on an image to detect the prompted objects
results = model.predict("warehouse.jpg")

Aplicações no Mundo Real

A utilidade da engenharia rápida estende-se a diversos sectores, melhorando a automatização e a criatividade:

Geração automática de conteúdos: No marketing e nos media, os profissionais utilizam instruções pormenorizadas para orientar geradores de texto-imagem como o Midjourney ou Difusão estável. Um pedido específico que descreva um prompt específico que descreve a iluminação, o estilo artístico e a composição permite aos designers criar rapidamente protótipos de activos visuais, poupando tempo em comparação em comparação com os métodos de renderização tradicionais.
Apoio ao Cliente Inteligente: As empresas utilizam chatbots alimentados por LLMs para responder às perguntas dos clientes. Os engenheiros criam "avisos de sistema" que definem a personalidade do bot (por exemplo, "Você é um assistente de suporte técnico assistente de apoio técnico"), estabelecem limites para evitar alucinações e instruem a IA a obter respostas de uma base de conhecimentos específica.

Distinguir conceitos relacionados

É importante distinguir a engenharia de prontidão de termos semelhantes no panorama da aprendizagem automática:

Engenharia de prompts vs. Tuning de prompts: A engenharia de prompts envolve a elaboração manual de consultas em linguagem natural. Em contraste, o ajuste de prompts é um mecanismo eficiente em termos de parâmetros que aprende ( vectores numéricos) durante uma fase de treino para otimizar para otimizar as entradas do modelo, muitas vezes invisíveis para o utilizador humano.
Engenharia imediata vs. Afinação fina: O ajuste fino actualiza permanentemente os actualiza permanentemente os pesos do modelo através do treino num conjunto de dados especializado. A engenharia de prompts não altera o modelo em si; apenas optimiza a entrada durante a inferência em tempo real.
Prompt Engineering vs. RAG: Retrieval-Augmented Generation (RAG) é uma arquitetura de sistema que vai buscar dados externos para fundamentar a resposta do modelo. resposta do modelo. A engenharia de prompts é a técnica utilizada no RAG para formatar corretamente os dados obtidos e e apresentá-los ao LLM para processamento.

Engenharia de Prompt

Treine os modelosYOLO Ultralytics para simplificar os fluxos de trabalho em todos os sectores

Solução de licenciamento empresarial flexível para impulsionar sua inovação

Treine modelos de IA em segundos com o Ultralytics YOLO

A mecânica de prompts eficazes

Relevância em Visão Computacional

Aplicações no Mundo Real

Distinguir conceitos relacionados

Leia mais nesta categoria

Compreender por que a anotação humana no ciclo é fundamental

O que é destilação de conjuntos de dados? Uma rápida visão geral

Os óculos Oakley Meta AI estão a redefinir os óculos com a Vision AI

Junte-se à comunidade Ultralytics