Yolo Vision Shenzhen
Shenzhen
Junte-se agora
Glossário

Engenharia de Prompt

Domine a arte da engenharia de prompt para orientar modelos de IA como LLMs para saídas precisas e de alta qualidade em conteúdo, atendimento ao cliente e muito mais.

A engenharia de prompts é o processo estratégico de estruturação e otimização do texto de entrada, conhecido como prompts, para orientar modelos de Inteligência Artificial (IA) para gerar resultados específicos e de alta qualidade. Embora inicialmente popularizado pelo aparecimento de grandes modelos de linguagem (LLM) como o GPT-4, esta disciplina evoluiu para uma competência crítica para para interagir com vários sistemas generativos. Envolve a compreensão das nuances de como um modelo interpreta a linguagem, contexto e instruções para preencher a lacuna entre a intenção humana e a execução da máquina. Selecionando cuidadosamente as palavras, formatação de restrições e fornecendo contexto, os utilizadores podem melhorar significativamente a precisão e a relevância das respostas generativas da IA sem necessidade de alterar os parâmetros subjacentes do modelo.

A mecânica de prompts eficazes

Na sua essência, a engenharia de prontidão baseia-se no princípio de que os modelos de IA são sensíveis ao fraseado e à estrutura dos entradas. Um prompt bem concebido contém normalmente componentes específicos concebidos para reduzir a ambiguidade. Estes incluem instruções explícitas, informações de fundo relevantes (contexto) e especificações de saída, como o formato - por exemplo, solicitar uma por exemplo, solicitar uma resposta em JSON ou numa lista com marcadores. As técnicas avançadas incluem a aprendizagem de poucos disparos, em que o utilizador fornece exemplos dos pares de entrada-saída desejados no prompt para orientar o raciocínio do modelo. Outro método poderoso é o o raciocínio em cadeia, que encoraja o modelo a decompor problemas complexos em passos de raciocínio intermédios, melhorando o desempenho em tarefas de lógica pesada, tal como descrito em PesquisaGoogle publicações.

Relevância em Visão Computacional

Embora frequentemente associada à geração de texto, a engenharia de prontidão é cada vez mais vital na Visão por computador (CV). Os modernos modelos multimodais e detectores de vocabulário aberto, como o YOLO, permitem aos utilizadores definir alvos de deteção de deteção utilizando linguagem natural em vez de IDs de classe predefinidos. Neste contexto, o "prompt" é o texto descrição textual do objeto (por exemplo, "capacete vermelho" vs. "capacete"). Esta capacidade, muitas vezes referida como aprendizagem zero-shot, permite que os modelos detect detetar objectos para os quais não foram explicitamente treinados, simplesmente processando a relação semântica entre o texto e as caraterísticas visuais.

O exemplo a seguir demonstra como o prompt engineering é aplicado programaticamente usando o ultralytics para definir dinamicamente classes para deteção de objectos:

from ultralytics import YOLO

# Load a YOLO-World model capable of interpreting text prompts
model = YOLO("yolo-world.pt")

# Use prompt engineering to define custom classes without retraining
# The model aligns these text descriptions with visual features
model.set_classes(["person in safety vest", "forklift", "cardboard box"])

# Run inference on an image to detect the prompted objects
results = model.predict("warehouse.jpg")

Aplicações no Mundo Real

A utilidade da engenharia rápida estende-se a diversos sectores, melhorando a automatização e a criatividade:

  • Geração automática de conteúdos: No marketing e nos media, os profissionais utilizam instruções pormenorizadas para orientar geradores de texto-imagem como o Midjourney ou Difusão estável. Um pedido específico que descreva um prompt específico que descreve a iluminação, o estilo artístico e a composição permite aos designers criar rapidamente protótipos de activos visuais, poupando tempo em comparação em comparação com os métodos de renderização tradicionais.
  • Apoio ao Cliente Inteligente: As empresas utilizam chatbots alimentados por LLMs para responder às perguntas dos clientes. Os engenheiros criam "avisos de sistema" que definem a personalidade do bot (por exemplo, "Você é um assistente de suporte técnico assistente de apoio técnico"), estabelecem limites para evitar alucinações e instruem a IA a obter respostas de uma base de conhecimentos específica.

Distinguir conceitos relacionados

É importante distinguir a engenharia de prontidão de termos semelhantes no panorama da aprendizagem automática:

  • Engenharia de prompts vs. Tuning de prompts: A engenharia de prompts envolve a elaboração manual de consultas em linguagem natural. Em contraste, o ajuste de prompts é um mecanismo eficiente em termos de parâmetros que aprende ( vectores numéricos) durante uma fase de treino para otimizar para otimizar as entradas do modelo, muitas vezes invisíveis para o utilizador humano.
  • Engenharia imediata vs. Afinação fina: O ajuste fino actualiza permanentemente os actualiza permanentemente os pesos do modelo através do treino num conjunto de dados especializado. A engenharia de prompts não altera o modelo em si; apenas optimiza a entrada durante a inferência em tempo real.
  • Prompt Engineering vs. RAG: Retrieval-Augmented Generation (RAG) é uma arquitetura de sistema que vai buscar dados externos para fundamentar a resposta do modelo. resposta do modelo. A engenharia de prompts é a técnica utilizada no RAG para formatar corretamente os dados obtidos e e apresentá-los ao LLM para processamento.

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Conecte-se, colabore e cresça com inovadores globais

Junte-se agora