Yolo Vision Shenzhen
Shenzhen
Junte-se agora
Glossário

Enriquecimento de Prompts

Explore como o enriquecimento imediato automatiza o aumento de entradas para melhorar a precisão da IA. Aprenda a otimizar LLMs e modelos de visão como [YOLO26](ultralytics) para obter melhores resultados.

O enriquecimento imediato é o processo automatizado de aumentar a entrada inicial de um utilizador com contexto relevante, instruções específicas ou dados suplementares antes de enviá-la para um modelo de Inteligência Artificial (IA). Essa técnica atua como uma camada de middleware inteligente que otimiza a interação entre humanos e máquinas, garantindo que os Modelos de Linguagem Grande (LLMs) e os sistemas de visão computacional recebam consultas abrangentes. Ao injetar detalhes que um utilizador pode omitir, como preferências históricas, dados de localização ou restrições técnicas, o enriquecimento imediato melhora significativamente a precisão e a personalização da saída do modelo, sem exigir que o utilizador seja um especialista na elaboração de instruções detalhadas.

O mecanismo de enriquecimento

A função principal do enriquecimento de prompts é preencher a lacuna entre uma intenção humana vaga e a entrada precisa e rica em dados que os modelos exigem para um desempenho ideal. Quando uma consulta é recebida, o sistema analisa-a e recupera as informações de fundo necessárias de um gráfico de conhecimento ou de uma base de dados estruturada. Esses dados recuperados são formatados programaticamente e anexados ao prompt original.

Por exemplo, em fluxos de trabalho de Processamento de Linguagem Natural (NLP), uma pergunta simples como "Qual é o estado?" é contextualmente insuficiente. Um sistema de enriquecimento identifica a sessão ativa, recupera o número do pedido mais recente de um banco de dados transacional e reescreve o prompt para: "O utilizador está a perguntar sobre o pedido nº 998, que está atualmente em trânsito. Forneça uma atualização de envio com base nesse estado." Esse processo geralmente utiliza bancos de dados vetoriais para encontrar rapidamente um contexto semanticamente relevante para inserir.

Aplicações no Mundo Real

O enriquecimento imediato é essencial para a implementação de aplicações robustas de IA generativa em vários setores, aprimorando os sistemas baseados em texto e visão:

  1. Suporte ao cliente sensível ao contexto: em helpdesks automatizados, um chatbot usa o enriquecimento para aceder ao histórico de compras e ao ambiente técnico do cliente. Em vez de perguntar ao utilizador a versão do seu dispositivo, o sistema recupera essa informação dos metadados da conta e insere-a no prompt. Isso permite que o agente de IA forneça etapas imediatas de resolução de problemas específicas para o dispositivo, melhorando significativamente a experiência do cliente.
  2. Configuração dinâmica da visão computacional: em operações de segurança, um utilizador pode simplesmente alternar a configuração "Modo noturno". Nos bastidores, o enriquecimento imediato traduz essa intenção de alto nível em classes de objetos específicas para um detetor de vocabulário aberto como o YOLO. O sistema enriquece o prompt para procurar especificamente por "lanterna", "movimento suspeito" ou "pessoa não autorizada", permitindo que o modelo adapte o seu foco de deteção de objetos dinamicamente.

Exemplo: Enriquecimento dinâmico de classes

O seguinte Python O exemplo demonstra o conceito de enriquecimento imediato usando o ultralytics pacote. Aqui, a intenção de alto nível de um utilizador é programaticamente enriquecida numa lista de classes descritivas específicas que o modelo procura.

from ultralytics import YOLO


def run_enriched_inference(user_mode):
    """Enriches a simple user mode into specific detection prompts."""
    # Load a YOLO-World model capable of open-vocabulary detection
    model = YOLO("yolov8s-world.pt")

    # Enrichment Logic: Map simple user intent to detailed class prompts
    context_map = {
        "site_safety": ["hard hat", "safety vest", "gloves"],
        "traffic": ["car", "bus", "traffic light", "pedestrian"],
    }

    # Inject the enriched context into the model
    enriched_classes = context_map.get(user_mode, ["object"])
    model.set_classes(enriched_classes)

    # The model now looks for the specific enriched terms
    print(f"Mode: {user_mode} -> Enriched Prompt: {enriched_classes}")


run_enriched_inference("site_safety")

Enriquecimento de Prompts vs. Conceitos Relacionados

Para implementar operações de aprendizagem automática (MLOps), é útil distinguir o enriquecimento rápido de termos semelhantes:

  • Geração Aumentada por Recuperação (RAG): RAG é um método específico de enriquecimento. Refere-se estritamente ao mecanismo de busca de documentos relevantes em um corpus externo para fundamentar a resposta do modelo. Enriquecimento é o conceito mais amplo que inclui RAG, mas também abrange a injeção de dados estáticos da sessão, metadados do utilizador ou tempo do sistema, sem necessariamente realizar uma pesquisa semântica complexa .
  • Engenharia rápida: Este é o trabalho manual de conceber prompts eficazes. O enriquecimento é um processo automatizado que aplica os princípios princípios de engenharia de prompts de forma dinâmica em tempo de execução.
  • Sintonização imediata: Este é um ajuste fino eficiente de parâmetros (PEFT) onde os "prompts suaves" (tensores aprendíveis) são optimizados durante o treino. O enriquecimento de prompts acontece inteiramente durante a inferência em tempo real e não altera os pesos pesos do modelo.
  • Aprendizagem com poucos tiros: Isto envolve o fornecimento de exemplos dentro do prompt para ensinar uma tarefa ao modelo. Os sistemas de enriquecimento injectam frequentemente estes exemplos de poucos instantes dinamicamente com base no tipo de tarefa, combinando efetivamente ambos os conceitos.

Relevância nos sistemas modernos de IA

À medida que modelos como Ultralytics e GPT-4 se tornam mais capazes, o gargalo muitas vezes muda para a qualidade da entrada. O enriquecimento de prompts mitiga alucinações em LLMs, fundamentando o modelo em dados factuais fornecidos. Na visão computacional (CV), permite sistemas de deteção de aprendizagem flexíveis e zero-shot que podem adaptar-se a novos ambientes instantaneamente sem retreinamento, simplesmente modificando os prompts de texto alimentados no sistema. Essa flexibilidade é crucial para construir soluções de IA escaláveis e multimodais que podem raciocinar sobre texto e imagens. Os utilizadores que pretendem gerir conjuntos de dados utilizados para fundamentar estes sistemas recorrem frequentemente a ferramentas como a Ultralytics para organizar e anotar as suas informações de forma eficaz.

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Conecte-se, colabore e cresça com inovadores globais

Junte-se agora