Glossário

Prompting de cadeia de pensamento

Melhora o raciocínio da IA com a sugestão de cadeia de pensamento! Aumenta a precisão, a transparência e a retenção de contexto para tarefas complexas e de vários passos.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

A sugestão de cadeia de pensamento (CoT) é uma técnica avançada utilizada principalmente com modelos de linguagem de grande porte (LLMs) para melhorar a sua capacidade de realizar tarefas de raciocínio complexas. Em vez de pedir apenas a resposta final, a CoT incentiva o modelo a gerar passos intermédios ou uma "cadeia de pensamento" que conduza logicamente à solução. Esta abordagem imita os processos humanos de resolução de problemas e ajuda os modelos a resolver problemas que requerem raciocínio aritmético, de senso comum ou simbólico de forma mais eficaz, conduzindo frequentemente a uma precisão significativamente melhor. A técnica foi destacada na investigação da Google AI.

Como funciona a promoção da cadeia de pensamento

As instruções CoT orientam um modelo de IA mostrando-lhe explicitamente como resolver um problema. Existem duas variantes principais:

  1. CoT de poucas fotos: O prompt inclui alguns exemplos (fotos) em que cada exemplo consiste em uma pergunta, um processo de raciocínio detalhado passo a passo (a cadeia de pensamento) e a resposta final. O modelo aprende com estes exemplos a aplicar um processo de raciocínio semelhante à pergunta atual. Esta é uma forma de aprendizagem de poucos exemplos aplicada a percursos de raciocínio.
  2. CoT de tiro zero: Esta abordagem mais simples não requer a apresentação de exemplos. Em vez disso, acrescenta à pergunta uma instrução simples como "Vamos pensar passo a passo". Esta sugestão incentiva o modelo a articular o seu processo de raciocínio antes de dar a resposta final. Aproveita as capacidades inerentes do modelo aprendidas durante o seu extenso pré-treino.

Ao exteriorizar os passos do raciocínio, a CoT torna o processo do modelo mais transparente e permite uma depuração mais fácil dos pontos onde o raciocínio pode ter corrido mal. Contrasta com o estímulo padrão, que muitas vezes pede uma resposta direta e pode falhar em tarefas que requerem vários passos lógicos.

Benefícios e aplicações

A principal vantagem do estímulo da CoT é a sua capacidade de melhorar as capacidades de raciocínio dos LLMs para tarefas complexas, com as quais o estímulo padrão não consegue lidar. As principais vantagens incluem:

  • Melhora o desempenho: Aumenta significativamente a precisão em tarefas como problemas matemáticos de palavras, puzzles lógicos e respostas a perguntas de vários passos.
  • Aumenta a transparência: A cadeia de pensamento gerada fornece informações sobre o processo de raciocínio do modelo, contribuindo para a IA explicável (XAI).
  • Lida melhor com a complexidade: Permite que os modelos resolvam problemas que requerem a sua decomposição em passos mais pequenos e geríveis.

Exemplos do mundo real:

  1. Apoio ao cliente complexo: Um chatbot de IA que utilize CoT pode lidar com questões complexas dos clientes, como a resolução de um problema técnico com várias partes ou a explicação de um pedido de faturação complexo. O prompt do CoT orienta a IA para identificar primeiro o problema principal, depois relembrar as políticas relevantes ou os passos técnicos, verificar o histórico do utilizador, se necessário, e finalmente formular um plano de resolução passo a passo para o cliente. Isto é mais eficaz do que adivinhar diretamente uma solução. Plataformas como o Salesforce Einstein utilizam um raciocínio semelhante para o serviço ao cliente.
  2. Análise e interpretação de dados: Quando lhe é apresentado um conjunto de dados e uma consulta complexa (por exemplo, "Identifica os principais factores que contribuíram para o declínio das vendas no último trimestre com base neste relatório"), um LLM que utilize a CoT pode delinear o seu plano de análise: primeiro, identifica os pontos de dados relevantes; segundo, efectua os cálculos ou comparações necessários; terceiro, sintetiza os resultados; e, finalmente, apresenta a conclusão. Esta abordagem estruturada melhora a fiabilidade dos conhecimentos analíticos de dados gerados pela IA.

A CoT é particularmente valiosa em domínios que exigem uma tomada de decisões fiável e complexa, como o apoio à análise de imagens médicas ou a modelação financeira, complementando os avanços em áreas como a visão por computador (CV), impulsionados por modelos como Ultralytics YOLO.

Comparação com conceitos relacionados

A solicitação de CoT está relacionada com outras técnicas de processamento de linguagem natural (PNL) e de aprendizagem automática (ML), mas distingue-se delas:

  • Engenharia de prompts: Esta é a prática geral de conceber entradas eficazes (prompts) para modelos de IA. A CoT é uma técnica específica e avançada de engenharia de prompts que se centra na obtenção de raciocínio. Outras técnicas podem centrar-se na clareza, no fornecimento de contexto(Enriquecimento de prompts) ou na especificação do formato.
  • Encadeamento de prompts: O encadeamento de prompts envolve a quebra de uma tarefa complexa em uma sequência de prompts mais simples e interconectados, onde a saída de um prompt se torna a entrada para o próximo. Isto requer frequentemente uma orquestração externa (por exemplo, utilizando estruturas como LangChain). Em contraste, o CoT pretende extrair todo o processo de raciocínio numa única interação prompt-resposta.
  • Aprendizagem Zero-shot: Refere-se à capacidade de um modelo para executar tarefas para as quais não foi explicitamente treinado, sem quaisquer exemplos. A CoT de disparo zero é uma aplicação específica disto, utilizando uma instrução genérica ("Vamos pensar passo a passo") para desencadear o raciocínio. No entanto, a CoT tem muitas vezes um melhor desempenho num cenário de poucas tentativas, que fornece exemplos de raciocínio específicos da tarefa, ao contrário da aprendizagem pura de zero tentativas.

A solicitação de CoT representa um passo significativo para a construção de sistemas de Inteligência Artificial (IA) mais capazes e interpretáveis. Compreender e utilizar essas técnicas pode ser benéfico para o desenvolvimento de modelos sofisticados de IA, potencialmente aproveitando plataformas como o Ultralytics HUB para gerir a formação e a implementação. Técnicas como a autoconsistência podem melhorar ainda mais a CoT, recolhendo amostras de vários caminhos de raciocínio e selecionando a resposta mais consistente.

Lê tudo