Yolo Vision Shenzhen
Shenzhen
Junte-se agora
Glossário

Enriquecimento de Prompts

Domine a IA com o enriquecimento de prompts! Melhore as saídas de Grandes Modelos de Linguagem usando contexto, instruções claras e exemplos para resultados precisos.

O enriquecimento do prompt é o processo de aumentar automaticamente a entrada inicial de um utilizador com contexto, dados ou instruções relevantes antes de o submeter a um modelo de modelo de Inteligência Artificial (IA). Ao injetar detalhes específicos que o utilizador possa ter omitido, esta técnica garante que Grandes Modelos de Linguagem (LLMs) e sistemas de visão recebem uma consulta abrangente, conduzindo a resultados mais precisos, personalizados e acionáveis. Actua como uma camada de middleware inteligente que optimiza as interações entre humanos e máquinas sem exigir que o utilizador seja um perito na elaboração de avisos pormenorizados.

O mecanismo de enriquecimento

A principal função do enriquecimento de pedidos é colmatar a lacuna entre a intenção possivelmente vaga de um utilizador e a precisa de que a IA necessita. Quando é recebida uma consulta, o sistema recupera informações suplementares - como as preferências do utilizador, dados históricos ou leituras de sensores em tempo real - a partir de um de um gráfico de conhecimentos ou de uma base de dados. Estes dados recuperados são formatados de forma programática e anexados à consulta original.

Por exemplo, no Processamento de linguagem natural (PNL), uma simples pergunta como "Qual é o estado?" é insuficiente para um modelo. Através do enriquecimento, o sistema identifica o ID da sessão ativa do utilizador, procura a última transação numa base de dados vetorial, e reescreve a pergunta para: "O utilizador (ID: 5521) está a perguntar sobre a encomenda #998, que está atualmente em trânsito. Fornecer uma atualização de estado com base dados de rastreamento".

Aplicações no Mundo Real

O enriquecimento imediato é essencial para a implementação de aplicações de IA generativa aplicações de IA generativa robustas em vários sectores:

  1. Apoio ao cliente sensível ao contexto: Nos serviços de assistência automatizados, um chatbot utiliza o enriquecimento para aceder ao histórico de compras histórico de compras e ambiente técnico do cliente. Em vez de pedir ao utilizador a versão do seu dispositivo, o sistema recupera-a a partir dos metadados da conta e injecta-a no pedido. Isto permite que o agente de agente de IA forneça imediatamente passos de resolução de problemas de resolução de problemas, melhorando significativamente a experiência do cliente.
  2. Configuração dinâmica de visão computacional: Nas operações de segurança, um utilizador pode simplesmente alternar uma configuração "Modo noturno". Nos bastidores, o enriquecimento de pedidos traduz esta intenção de alto nível em classes de objectos específicos para um Modelo de Linguagem de Visão (VLM) ou um detetor de vocabulário aberto. O sistema enriquece o aviso para procurar especificamente por "lanterna", "movimento suspeito" ou "movimento suspeito". "movimento suspeito" ou "pessoa não autorizada", permitindo que o modelo adapte o seu foco de deteção de objectos de forma dinâmica.

Exemplo: Enriquecimento dinâmico de classes com o YOLO

O exemplo Python que se segue demonstra o conceito de enriquecimento de pedidos utilizando o Ultralytics YOLO. Aqui, a seleção simples de um utilizador seleção de "modo" de um utilizador é enriquecida programaticamente numa lista de classes descritivas específicas que o modelo procura.

from ultralytics import YOLO


def run_enriched_inference(user_mode):
    """Enriches a simple user mode into specific detection prompts."""
    # Load an open-vocabulary YOLO model
    model = YOLO("yolov8s-world.pt")

    # Enrichment Logic: Map simple user intent to detailed class prompts
    context_map = {
        "site_safety": ["hard hat", "safety vest", "gloves"],
        "traffic": ["car", "bus", "traffic light", "pedestrian"],
    }

    # Inject the enriched context into the model
    enriched_classes = context_map.get(user_mode, ["object"])
    model.set_classes(enriched_classes)

    # The model now looks for the specific enriched terms
    # model.predict("site_image.jpg") # Run inference
    print(f"Mode: {user_mode} -> Enriched Prompt: {enriched_classes}")


# Example usage
run_enriched_inference("site_safety")

Enriquecimento de Prompts vs. Conceitos Relacionados

Para implementar operações de aprendizagem automática (MLOps), é útil distinguir o enriquecimento rápido de termos semelhantes:

  • Geração Aumentada por Recuperação (RAG): O RAG é um método específico de enriquecimento. Refere-se estritamente ao mecanismo de recolha de documentos relevantes de um corpus externo para fundamentar a resposta do modelo. O enriquecimento é o conceito mais amplo que inclui o RAG mas também mas também abrange a injeção de dados estáticos da sessão, metadados do utilizador ou tempo do sistema sem necessariamente realizar uma pesquisa semântica complexa.
  • Engenharia rápida: Este é o trabalho manual de conceber prompts eficazes. O enriquecimento é um processo automatizado que aplica os princípios princípios de engenharia de prompts de forma dinâmica em tempo de execução.
  • Sintonização imediata: Este é um ajuste fino eficiente de parâmetros (PEFT) onde os "prompts suaves" (tensores aprendíveis) são optimizados durante o treino. O enriquecimento de prompts acontece inteiramente durante a inferência em tempo real e não altera os pesos pesos do modelo.
  • Aprendizagem com poucos tiros: Isto envolve o fornecimento de exemplos dentro do prompt para ensinar uma tarefa ao modelo. Os sistemas de enriquecimento injectam frequentemente estes exemplos de poucos instantes dinamicamente com base no tipo de tarefa, combinando efetivamente ambos os conceitos.

Relevância nos sistemas modernos de IA

Como modelos como Ultralytics YOLO11 e GPT-4 tornam-se mais capazes, o estrangulamento desloca-se frequentemente para a qualidade da entrada. O enriquecimento imediato atenua as alucinações nos LLMs, baseando o modelo em dados factuais e fornecidos. Na visão por computador (CV), permite sistemas de deteção flexíveis, sistemas de deteção flexíveis e sem disparos, que se podem adaptar instantaneamente a novos ambientes sem necessidade de texto introduzido no sistema. Esta flexibilidade é crucial para a construção de soluções de IA multimodais escaláveis, escaláveis e multimodais que podem raciocinar tanto sobre texto e imagens.

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Conecte-se, colabore e cresça com inovadores globais

Junte-se agora