Domine a arte da engenharia de prontidão para orientar modelos de IA como LLMs para obter resultados precisos e de alta qualidade em conteúdo, atendimento ao cliente e muito mais.
A engenharia de prompts é a arte e a ciência de conceber entradas eficazes (prompts) para orientar os modelos de Inteligência Artificial (IA), em particular os Modelos de Linguagem de Grande Dimensão (LLM), no sentido de gerar os resultados desejados. É análogo a ser um comunicador competente com uma IA, sabendo exatamente o que dizer e como dizê-lo para obter a melhor resposta possível. Esta prática é crucial porque o desempenho, a relevância e a qualidade dos resultados de um modelo de IA são altamente sensíveis à forma como uma consulta é formulada. Uma engenharia de prontidão eficaz permite que os utilizadores aproveitem todo o potencial de modelos de base poderosos para uma vasta gama de tarefas.
O cerne da engenharia de mensagens é estruturar uma entrada que forneça um contexto claro e suficiente para o modelo. Embora uma pergunta simples possa dar origem a uma resposta básica, uma pergunta bem concebida pode controlar o tom, o formato e a complexidade. Os principais componentes de uma pergunta avançada podem incluir:
Automatização do apoio ao cliente: Para garantir a consistência e a exatidão da marca, uma empresa pode utilizar a engenharia de mensagens para orientar o seu chatbot de apoio. Um aviso pode instruir a IA a adotar um tom amigável e útil, a utilizar uma base de conhecimentos interna para responder a perguntas sobre produtos e a definir um protocolo claro sobre quando encaminhar uma conversa para um agente humano. Isto controla o comportamento da IA, impedindo-a de fornecer informações incorrectas ou de interagir com os clientes de uma forma que não seja de acordo com a marca.
Geração de conteúdos criativos: Em modelos de texto para imagem como o Midjourney ou o DALL-E 3 da OpenAI, o comando é a principal ferramenta de criação. Uma simples pergunta como "uma foto de um carro" produzirá um resultado genérico. No entanto, um pedido detalhado como "Um carro desportivo vermelho vintage dos anos 60 a descer uma autoestrada costeira ao pôr do sol, estilo fotorrealista, iluminação cinematográfica, resolução de 8K" fornece instruções específicas sobre o tema, o cenário, o estilo e a qualidade, produzindo uma imagem altamente personalizada e visualmente deslumbrante.
Embora tenha tido origem no Processamento de Linguagem Natural (PLN), a engenharia de prontidão é cada vez mais relevante na Visão por Computador (CV). Este facto é impulsionado pelo desenvolvimento de modelos multimodais que podem processar simultaneamente texto e imagens. Modelos como o CLIP e detectores de vocabulário aberto como o YOLO-World podem realizar tarefas como a deteção de objectos com base em descrições de texto arbitrárias. Para estes modelos, a elaboração de uma mensagem de texto eficaz (por exemplo, "detetar todas as 'bicicletas' mas ignorar as 'motas'") é uma forma de engenharia de mensagens crucial para orientar estes modelos de linguagem de visão. Plataformas como o Ultralytics HUB facilitam a interação com vários modelos, em que a definição de tarefas através de interfaces pode beneficiar dos princípios da engenharia de solicitações.
É importante distinguir a engenharia de prontidão de outros conceitos de aprendizagem automática: