通往AGI之路:思维链提示过程

所有文章8个月前发布 aiziy
0 0

今天分享提示词的进阶学习内容,思维链提示。思维链(Chain of ThoughtCoT) 提示过程是一种最近开发的提示方法,它鼓励大语言模型解释其推理过程。

一、什么是思维链

思维链这种技术旨在通过向大语言模型展示少量的样例,解释推理过程,让大语言模型学会在生成答案时展示推理过程,引导其得到更准确的答案。

下面这个图就显示了标准的提示词以及使用了思维链之后的提示词的效果,可以看出,经过思维链提示之后的大模型能够输出更多的信息,并且正确回答用户提出的问题。

通往AGI之路:思维链提示过程

二、思维链使用技巧

思维链的核心是提供示例的同时,并提供详细的中间过程。我们可以根据这个思路,指导自己的提示词书写。比如下面这个提示词:

哪种方法是更快的上班方式?

选项1:乘坐1000分钟的公共汽车,然后半小时的火车,最后10分钟的自行车骑行。

选项2:乘坐800分钟的公共汽车,然后1小时的火车,最后30分钟的自行车骑行。

让我们一步一步来思考,首先计算每一种上班方式的总时间,然后对比两个时间的大小,并选出最佳路线。

如果,我们没有添加蓝色部分的内容,在一些性能比较弱的大模型上,很有概率就输出了错误的答案。而蓝色部分的内容,正是我们 COT 的核心理念,即告诉大模型处理这个问题的步骤

在这里,我们告诉大模型,首先要计算总时间,然后进行对比才能选出最佳路线,这个就是计算步骤。你可以用自己喜欢的方法去尝试这种方法,尤其是对于数学类或者推理类的问题,能大幅度提高模型的输出质量。

这相当于将黑盒深度学习的多步推理过程的中间步骤拆开,解耦各个步骤的工作,简化每一步工作上模型的压力,在提高可解释性的同时提升模型性能。

人在日常生活中也会随时随地使用思维链来解决问题,比如工作、读书经常用到的思维导图,就是为了尽可能全面拆解步骤,不忽略重要细节,从而充分地考虑问题。

© 版权声明

相关文章

暂无评论

暂无评论...