Acesso no exterior: www.kdjingpai.com
Ctrl + D Marcar este site como favorito

CoT (Chain-of-Thought) Cadeia de pensamento

2024-08-11 1.3 K

AKA: Cadeia de pensamento

Definição e justificativa para a Cadeia de Pensamento

“Chain-of-Thought”(简称CoT)是一种思维方法,其原理是建立一个由一系列关联的思考步骤组成的思考链。该方法通过将思考过程分解成一系列有序的步骤,帮助人们更系统地思考问题和产生创造性的想法。该方法适用于各种思考场景,如创新、决策、问题解决等。CoT方法的核心思想是:将一个大的问题分解成若干个小问题,然后将每个小问题再分解成更小的问题,直到每个问题都可以得到简单、明确的答案。这样一来,人们可以更加清晰地理解问题,并找到更优的解决方案。

Podemos comparar a Cadeia de Pensamento a um quebra-cabeça, em que cada peça representa um aspecto de um problema, e somente conectando essas peças podemos obter uma resposta completa. Por exemplo, quando estamos aprendendo um novo conhecimento, podemos usar a Cadeia de Pensamento para estabelecer a relação entre vários pontos de conhecimento, de modo a entender e lembrar melhor o conhecimento; quando estamos resolvendo um problema, podemos usar a Cadeia de Pensamento para dividir o problema em vários subproblemas e, em seguida, resolvê-los passo a passo para finalmente obter uma solução completa. solução completa.

 

Interpretação do campo de big data

O processo de solicitação Chain of Thought (CoT) é um método de solicitação desenvolvido recentemente que incentiva modelos de linguagem grandes a explicar seus processos de raciocínio. A figura abaixo mostra uma comparação do prompt padrão de poucas tentativas (esquerda) com o processo de prompt Chain of Thought (direita).

CoT (Cadeia de raciocínio) Cadeia de raciocínio-1

Crie uma nova pergunta sobre como fazer com que o modelo grande calcule essa pergunta de forma absolutamente correta:
Uma galinha põe seis ovos por dia. Hoje, recolhi os ovos uma vez e comi metade deles. No dia seguinte, coletei os ovos novamente e comi dois deles e, no terceiro dia, coletei os ovos novamente. Quantos ovos me restam agora?

existirWei et al. (2022) (abre em uma nova guia)Os prompts do Chained Thinking (CoT) introduzidos em permitem recursos de raciocínio complexos por meio de etapas intermediárias de raciocínio. Você pode combinar isso com prompts com menos exemplos para obter melhores resultados em tarefas mais complexas em que o raciocínio precede a resposta.

A ideia principal do encadeamento de pensamento é explicar o processo de raciocínio em amostras mostrando um pequeno número de exemplos para o modelo de linguagem grande, que também exibe o processo de raciocínio ao responder aos prompts. Essa explicação do raciocínio geralmente leva a resultados mais precisos.

 

Exemplos da vida real

O CoT Chain Thinking também pode ser encontrado em toda parte na vida cotidiana. Por exemplo, quando cozinhamos, precisamos primeiro preparar os ingredientes, depois cozinhá-los e, por fim, servi-los. Esse é um processo típico de pensamento em cadeia da CoT. Por exemplo, quando aprendemos um novo conhecimento, precisamos primeiro entender o básico e depois aprender o conteúdo avançado.

Podemos comparar a Cadeia de Pensamento a um quebra-cabeça, em que cada peça representa um aspecto de um problema, e somente conectando essas peças podemos obter uma resposta completa. Por exemplo, quando estamos aprendendo um novo conhecimento, podemos usar a Cadeia de Pensamento para estabelecer a relação entre vários pontos de conhecimento, de modo a entender e lembrar melhor o conhecimento; quando estamos resolvendo um problema, podemos usar a Cadeia de Pensamento para dividir o problema em vários subproblemas e, em seguida, resolvê-los passo a passo para finalmente obter uma solução completa. solução completa.

 

vantagens e desvantagens

Chain-of-Thought (CoT) é um método de raciocínio que melhora a eficiência e a qualidade do pensamento, dividindo o processo de raciocínio em uma série de etapas organicamente vinculadas. Suas vantagens incluem:

1. ajudar as pessoas a organizar e controlar melhor o fluxo de ideias, o que leva a uma melhor solução de problemas.
2. apoio ao pensamento contínuo e promoção do pensamento criativo.
3. ao acompanhar o processo de pensamento, a qualidade do pensamento pode ser melhor verificada e otimizada.
4. pode ser usado para resolver problemas complexos que vão desde a organização até a inovação.

Desvantagens da CoT:

1. o CoT requer uma grande base de conhecimento e habilidades analíticas e não é adequado para iniciantes
2. o CoT exige tempo e esforço de raciocínio e é difícil de ser usado em situações de pouco tempo
3. os padrões de pensamento de cada pessoa podem ser diferentes, portanto, a CoT pode não ser a melhor maneira de pensar para pessoas diferentes.

 

 

Classificação dos métodos COT

 

Least-to-Most (dicas de menos para mais)

O CoT funciona bem em problemas fáceis, mas não em problemas difíceis. E o Least-to-Most Prompting é usado principalmente para resolver problemas difíceis.

 

Prompting do mínimo ao máximo

A ideia do Least-to-Most Prompting também é muito simples, pois consiste em dividir a pergunta em subperguntas mais simples e, em seguida, responder às subperguntas uma a uma para obter a resposta à pergunta original:

CoT (Cadeia de raciocínio) Cadeia de raciocínio-1

 

Além dos itens acima, outro truque é adicionar algumas amostras (few-shots) ao prompt, o que pode melhorar significativamente os resultados. Esse truque também é encontrado no CoT e é uma maneira muito versátil de melhorar os resultados.

No documento, as duas principais estruturas de prompt a seguir são projetadas para diferentes tarefas na implementação concreta (um pequeno número de amostras no prompt é omitido):

 

1.Let’s break down this problem:

Essa abordagem éinvocar uma vezLLM, de modo que ele gera subproblemas primeiro e, em seguida, gera a resposta para cada subproblema e a resposta final. Portanto, cabe em grande parte às amostras padronizar o resultado do LLM.

CoT (Cadeia de raciocínio) Cadeia de raciocínio-1

 

2) Para resolver o "****", precisamos primeiro resolver: "****", "****", "****", ... subproblema2>**", "****", ...

Essa abordagem éiteração (matemática)Gerar respostas para as subperguntas, resumir todas as informações e, em seguida, gerar a resposta final.

CoT (Cadeia de raciocínio) Cadeia de raciocínio-1

 

Entendo que as palavras-chave específicas usadas pelo prompt (**decompor** ou **primeiro resolver**) não são importantes, o que é importante é quePrimeiro, divida-o em subtarefasmais uma vezResposta caso a casoO processo de pensamento.

Efeito:

CoT (Cadeia de raciocínio) Cadeia de raciocínio-1

 

CoT (Cadeia de raciocínio) Cadeia de raciocínio-1

 

CoT (Cadeia de raciocínio) Cadeia de raciocínio-1

Recomendado

Não consegue encontrar ferramentas de IA? Tente aqui!

Basta digitar a palavra-chave Acessibilidade Bing SearchA seção Ferramentas de IA deste site é uma maneira rápida e fácil de encontrar todas as ferramentas de IA deste site.

caixa de entrada

Entre em contato conosco

voltar ao topo

pt_BRPortuguês do Brasil