AKA: Gedankenkette
Definition und Begründung der Gedankenkette
“Chain-of-Thought”(简称CoT)是一种思维方法,其原理是建立一个由一系列关联的思考步骤组成的思考链。该方法通过将思考过程分解成一系列有序的步骤,帮助人们更系统地思考问题和产生创造性的想法。该方法适用于各种思考场景,如创新、决策、问题解决等。CoT方法的核心思想是:将一个大的问题分解成若干个小问题,然后将每个小问题再分解成更小的问题,直到每个问题都可以得到简单、明确的答案。这样一来,人们可以更加清晰地理解问题,并找到更优的解决方案。
Wir können die Gedankenkette mit einem Puzzle vergleichen, bei dem jedes Teil einen Aspekt eines Problems darstellt, und nur wenn wir diese Teile verbinden, können wir eine vollständige Antwort erhalten. Wenn wir zum Beispiel ein neues Wissen lernen, können wir die Gedankenkette nutzen, um die Beziehung zwischen verschiedenen Wissenspunkten herzustellen, um das Wissen besser zu verstehen und zu behalten; wenn wir ein Problem lösen, können wir die Gedankenkette nutzen, um das Problem in mehrere Teilprobleme zu zerlegen und diese dann Schritt für Schritt zu lösen, um schließlich eine vollständige Lösung.
Interpretation des Bereichs Big Data
Der Chain of Thought (CoT) Prompting-Prozess ist eine kürzlich entwickelte Prompting-Methode, die große Sprachmodelle dazu anregt, ihre Argumentationsprozesse zu erklären. Die folgende Abbildung zeigt einen Vergleich zwischen dem Standardprompt mit wenigen Aufnahmen (links) und dem Chain-of-Thought-Prompting-Prozess (rechts).
Denken Sie sich eine neue Frage aus, wie Sie das große Modell zur Berechnung dieser Frage absolut korrekt bekommen:
Ein Huhn legt sechs Eier pro Tag. Ich habe heute einmal die Eier gesammelt und die Hälfte davon gegessen. Am nächsten Tag habe ich die Eier wieder eingesammelt und zwei davon gegessen, und am dritten Tag habe ich die Eier wieder eingesammelt, wie viele Eier habe ich jetzt noch?
existierenWei et al. (2022) (öffnet in einer neuen Registerkarte)Die in eingeführten Chained Thinking (CoT) Prompts ermöglichen komplexe Denkfähigkeiten durch Zwischenschritte beim Denken. Sie können dies mit beispiellosen Aufforderungen kombinieren, um bessere Ergebnisse bei komplexeren Aufgaben zu erzielen, bei denen das Denken der Beantwortung vorausgeht.
Der Grundgedanke der Gedankenverkettung besteht darin, den Denkprozess in Stichproben zu erklären, indem dem großen Sprachmodell eine kleine Anzahl von Beispielen gezeigt wird, die auch den Denkprozess bei der Beantwortung der Aufforderungen anzeigen. Diese Erklärung des Denkens führt oft zu genaueren Ergebnissen.
Beispiele aus der Praxis
Das CoT-Kettendenken ist auch im täglichen Leben überall zu finden. Wenn wir zum Beispiel kochen, müssen wir zuerst die Zutaten vorbereiten, sie dann kochen und schließlich servieren. Dies ist ein typischer Prozess des CoT-Kettendenkens. Wenn wir zum Beispiel ein neues Wissen lernen, müssen wir zuerst die Grundlagen verstehen und dann den fortgeschrittenen Inhalt lernen.
Wir können die Gedankenkette mit einem Puzzle vergleichen, bei dem jedes Teil einen Aspekt eines Problems darstellt, und nur wenn wir diese Teile verbinden, können wir eine vollständige Antwort erhalten. Wenn wir zum Beispiel ein neues Wissen lernen, können wir die Gedankenkette nutzen, um die Beziehung zwischen verschiedenen Wissenspunkten herzustellen, um das Wissen besser zu verstehen und zu behalten; wenn wir ein Problem lösen, können wir die Gedankenkette nutzen, um das Problem in mehrere Teilprobleme zu zerlegen und diese dann Schritt für Schritt zu lösen, um schließlich eine vollständige Lösung.
Vor- und Nachteile
chain-of-thought (CoT) ist eine Denkmethode, die die Effizienz und Qualität des Denkens verbessert, indem sie den Denkprozess in eine Reihe organisch miteinander verbundener Schritte unterteilt. Ihre Vorteile umfassen:
1. den Menschen zu helfen, ihren Ideenfluss besser zu organisieren und zu kontrollieren, was zu einer besseren Problemlösung führt.
2. die Unterstützung des kontinuierlichen Denkens und die Förderung des kreativen Denkens.
3. durch die Verfolgung des Denkprozesses kann die Qualität des Denkens besser überprüft und optimiert werden.
4. kann zur Lösung komplexer Probleme eingesetzt werden, die von der Organisation bis zur Innovation reichen.
Nachteile des CoT:
1. die CoT erfordert ein umfangreiches Wissen und analytische Fähigkeiten und ist für Anfänger nicht geeignet
2. der CoT erfordert Zeit und Denkarbeit und ist unter Zeitdruck nur schwer zu nutzen
3. die Denkmuster eines jeden Menschen können unterschiedlich sein, so dass die CoT für verschiedene Menschen nicht unbedingt die beste Denkweise darstellt.
Klassifizierung der COT-Methoden
Least-to-Most (Weniger-zu-Mehr-Tipps)
CoT funktioniert gut bei leichten Problemen, aber nicht bei schweren Problemen. Und Least-to-Most Prompting wird hauptsächlich zur Lösung schwerer Probleme eingesetzt.
Geringste bis größte Aufforderung
Die Idee des Least-to-Most Prompting ist ebenfalls sehr einfach, nämlich die Frage in einfachere Unterfragen zu zerlegen und dann die Unterfragen eine nach der anderen zu beantworten, um die Antwort auf die ursprüngliche Frage zu erhalten:
Ein weiterer Trick besteht darin, der Eingabeaufforderung einige Stichproben (few-shots) hinzuzufügen, was die Ergebnisse erheblich verbessern kann. Dieser Trick findet sich auch in CoT und ist eine sehr vielseitige Methode zur Verbesserung der Ergebnisse.
In dem Papier werden die folgenden zwei Hauptprompt-Strukturen für verschiedene Aufgaben in der konkreten Umsetzung entworfen (eine kleine Anzahl von Mustern im Prompt wird weggelassen):
1.Let’s break down this problem:
Dieser Ansatz isteinmal aufrufenLLM, so dass er zunächst Teilprobleme und dann die Antwort auf jedes Teilproblem sowie die endgültige Antwort generiert. Es liegt also weitgehend an den Proben, die Ausgabe des LLM zu standardisieren.
Um "****" zu lösen, müssen wir zunächst "****", "****", "****", ... lösen. Teilproblem2>**", "****", ...
Dieser Ansatz istIteration (math.)Erstellen Sie Antworten auf die Unterfragen, fassen Sie alle Informationen zusammen und erstellen Sie dann die endgültige Antwort.
Ich verstehe, dass die spezifischen Stichworte, die bei der Eingabeaufforderung verwendet werden (**aufschlüsseln** oder **erste Lösung**), nicht wichtig sind, wichtig ist, dassZerlegen Sie die Aufgabe zunächst in Teilaufgabenwieder einmalfallweise AntwortDer Denkprozess.
Wirkung: