Domina a IA com enriquecimento imediato! Melhora os resultados dos Large Language Models utilizando o contexto, instruções claras e exemplos para obter resultados precisos.
O enriquecimento de prompts é o processo de melhorar, de forma automática ou semi-automática, o prompt de entrada inicial de um utilizador antes de ser processado por um modelo de Inteligência Artificial (IA), especialmente os Modelos de Linguagem de Grande Porte (LLM). O objetivo principal é melhorar a qualidade, a relevância e a especificidade do resultado da IA, acrescentando informações contextuais relevantes, clarificando potenciais ambiguidades, definindo restrições ou incluindo detalhes específicos. Esta técnica aperfeiçoa a interação entre os utilizadores e os sistemas de IA, tornando os avisos mais eficazes sem que o utilizador necessite de conhecimentos profundos em engenharia de avisos, melhorando assim a experiência geral do utilizador (UX).
Normalmente, o processo de enriquecimento começa com a análise do pedido original do utilizador. Com base nesta análise, o sistema utiliza fontes de informação adicionais ou regras predefinidas para aumentar o pedido. Isto pode envolver o acesso ao histórico de interações do utilizador, a recuperação de documentos pertinentes de uma base de conhecimentos, a incorporação do contexto da conversa em curso ou a aplicação de instruções de formatação específicas exigidas pelo modelo. Por exemplo, um simples pedido como "Resume os últimos desenvolvimentos Ultralytics " pode ser enriquecido para especificar "Resume as principais caraterísticas e melhorias de desempenho do Ultralytics YOLOv11 em comparação com o YOLOv8centrando-se nas tarefas de deteção de objectos ". Técnicas como a Retrieval-Augmented Generation (RAG) são normalmente utilizadas, em que o sistema vai buscar fragmentos de dados relevantes (por exemplo, aosUltralytics Docs) e incorpora-os na janela de contexto do pedido antes de o enviar para o LLM. Desta forma, garante que o modelo tem os antecedentes necessários para gerar uma resposta abrangente e exacta.
O enriquecimento de prompts é valioso em várias aplicações orientadas para a IA, melhorando a qualidade da interação e o desempenho das tarefas:
Compreender as nuances entre enriquecimento imediato e termos semelhantes é crucial:
Embora o enriquecimento de pedidos esteja mais frequentemente associado aos LLM e à compreensão da linguagem natural (NLU), os seus princípios estão a tornar-se relevantes na visão computacional (CV). Tarefas tradicionais de CV, como a deteção de objectos padrão utilizando modelos como Ultralytics YOLO baseia-se normalmente em entradas de imagem e não em pedidos de texto complexos. No entanto, os modelos multimodais mais recentes e os sistemas de visão que podem ser solicitados, como o CLIP, YOLO e o YOLOE, aceitam solicitações de texto ou de imagem para orientar tarefas como a deteção de zero disparos. Para estes modelos, o enriquecimento de um simples pedido de texto (por exemplo, "detetar veículos") com mais contexto (por exemplo, "detetar apenas veículos de emergência como ambulâncias e camiões de bombeiros neste feed de câmara de trânsito") poderia melhorar significativamente o desempenho e a especificidade. Plataformas como o Ultralytics HUB poderiam potencialmente integrar tais técnicas para simplificar a interação do utilizador ao definir tarefas de visão complexas ou ao analisar resultados, representando uma área de investigação e desenvolvimento de IA em curso destinada a melhorar a segurança e a usabilidade da IA em todos os domínios.