提升大型语言模型响应质量的26条黄金法则
创作时间:
作者:
@小白创作中心
提升大型语言模型响应质量的26条黄金法则
引用
CSDN
1.
https://m.blog.csdn.net/m0_51030297/article/details/140057993
在探索大型语言模型(LLMs)的潜力时,设计有效的提示(prompt)至关重要。Sondos Mahmoud Bsharat、Aidar Myrzakhan和Zhiqiang Shen的研究提出了26条原则,以优化用户与这些强大模型的沟通,提升响应质量。这些原则是提示工程的关键,帮助我们更好地利用大模型的自然语言处理能力。
一、26条原则
# 提示原则 指令提示原则
1. 如果您偏好更简洁的答案,与大型语言模型(LLM)交流时无需使用礼貌用语,比如不必添加“请”,“如果你不介意”,“谢谢”,“我想要”等,直接了当。
2. 在提示中整合目标受众,例如,受众是该领域的专家。
3. 将复杂任务分解为一系列更简单的提示,以进行交云对话。
4. 使用肯定指令,如“做”,避免使用否定语言,如“不要”。
5. 当您需要对某个主题、观点或任何信息有更清晰的理解时,请使用以下提示:
a. 用简单的术语解释[插入特定主题]。
b. 像对11岁的我解释一样。
c. 假设我是[领域]的初学者,向我解释。
d. 像你在向5岁小孩解释事情一样,用简单的英语写[文章/文本/段落]。
6. 添加“我将为更好的解决方案提供$xxx打赏!”
7. 实施基于示例的提示(使用少量示例提示)。
8. 格式化提示时,以“###指令###”开始,如果相关,接着是“###示例###”或“###问题##”。然后呈现您的内容。使用一个或多个换行符分隔指令、示例、问题、上下文和输入数据。
9. 整合以下短语:“你的任务是”和“你必须”。
10. 整合以下短语:“你将受到惩罚”。
11. 在提示中使用短语“以自然、类人的方式回答问题”。
12. 使用引导词,如“逐步思考”。
13. 在您的提示中添加以下短语:“确保你的回答无偏见,不依赖于刻板印象”。
14. 允许模型通过向您提问来获取精确的细节和要求,直到它拥有提供所需输出的足够信息(例如,“从现在开始,我希望你向我提问……”)。
15. 要询问特定主题或观点或任何信息,并希望测试您的理解,您可以使用以下短语:“教我任何[定理/主题/规则名称]并在最后包含一个测试,让我知道我在回答后答案是否正确,不要提前提供答案。”
16. 为大型语言模型分配角色。
17. 使用分隔符。
18. 在提示中多次重复特定的单词或短语。
19. 结合思维链(CoT)与少量示例提示。
20. 使用输出引子,即以期望输出的开始结束您的提示。通过在提示结束时加上预期响应的开始来利用输出引子。
21. 写一篇文章/文本/段落/文章或任何类型的详细文本:“请为我详细写一篇关于[主题]的[文章/文本/段落],添加所有必要的信息。”
22. 更正/更改特定文本而不改变其风格:“尝试修改用户发送的每个段落。您应该只改进用户的语法和词汇,并确保它听起来自然。您应该保持原始写作风格,确保正式段落保持正式。”
23. 当您有一个可能在不同文件中的复杂编码提示:“从现在开始,每当您生成跨越多个文件的代码时,生成一个[编程语言]脚本,可以运行以自动创建指定的文件或更改现有文件以插入生成的代码。[你的问题]。”
24. 当您想使用特定的单词、短语或句子启动或继续一段文本时,请使用以下提示:
a. 我提供给你以[歌词/故事/段落/文章...]开头:[插入歌词/单词/句子]。
根据提供的词语完成它。保持流程一致。
25. 清楚地说明模型必须遵循的要求,以关键词、规定、提示或指令的形式。
26. 编写任何文本,如文章或段落,旨在与提供的样本相似,请包括以下说明:
a. 根据提供的段落[/标题/文本/文章/答案]使用相同的语言。
大型语言模型如GPT和LLaMA在处理复杂任务方面表现出色,但它们的潜力往往因提问方式不当而受限。为了提升模型的响应质量,研究者们提出了26条原则,这些原则涉及提示设计的不同方面,如结构、清晰度和用户交互,旨在更有效地挖掘模型的能力。
这些原则被分为五个主要类别:
- 提示结构与清晰度:确保提示简洁、明确,避免使用不必要的信息。
- 具体性与信息:在提示中包含具体的例子和详细信息,帮助模型更好地理解任务。
- 用户交互与参与:允许模型通过提问来获取更多必要的信息。
- 内容与语言风格:根据需要调整语言风格,直接了当。
- 复杂任务与编码提示:将复杂任务分解为一系列简单的步骤。
三、实验结果
3.1 不同规模LLMs的结果
- 提升(Boosting)
- 应用新引入的原则后改进的结果显示在图4中。
- 所有原则普遍在小规模、中等规模和大规模LLMs上带来显著提升。
- 特别是原则2、5、15、16、25和26,在大规模模型中通过原则性提示获得最大改进。
- 特别地,原则14对所有应用该原则的问题都有所改进。
准确性(Correctness)
【绝对准确性】
- 在不同规模的模型上应用原则后,我们考察了它们的绝对性能。
- 这些模型在平均性能上达到了20%至40%的准确率,如图5所示。
- 小规模和中等规模模型的准确率通常在10%至40%之间,而大型模型的准确率可以超过40%。
- 【相对准确性】
- 图6展示了应用原则普遍在不同模型上平均带来超过10%的性能提升。
- 对于更大的模型,这种性能提升可以超过20%。
3.2 更多结果
四、结论——迈向更智能的交互
这项研究不仅为研究人员提供了一套实用的工具,也为普通用户提供了与LLMs有效沟通的方法。随着LLMs的不断发展,这些原则有望成为提升模型性能和用户体验的关键。
结语
26条原则为我们提供了一个起点,帮助我们更有效地利用LLMs的能力,开启人机交互的新篇章。如果你对如何与LLMs进行有效沟通感兴趣,不妨尝试应用这些原则,看看它们能为你的项目带来怎样的改变。
热门推荐
生肖配对分析:属猴和属猪在2024年生猪宝宝的影响
在笑氧镇静下拔牙是一种什么体验?
2025年火车票明日开售,12306平台新功能全攻略
三观不合,到底是哪三观?
翁凯旋 | 在构图与色彩的形式变化中找到隐藏其间的“诗意”
揭秘!颌垫治疗颞颌关节的原理:包括改变咬合关系、调整垂直距离、增加咀嚼功能等!
别让成绩定义孩子!成长型思维教你正确看待分数!
不到3000个深圳人中就有1个盲人……深圳无障碍环境建设如何?
激光脱毛后的护理指南:保湿与防晒的重点
脱毛五大误区:你中招了吗?
团队战术:如何有效防守足球场上的进攻
喝茶喝出肾结石?别慌,真相在这里!
加不加功放,不是你说了算
邂逅是什么意思?
海南秋季旅游攻略:热门景点、特色活动及深度游推荐指南
水晶是天然的吗?天然水晶的形成过程与鉴别方法
RX 9070 XT vs RTX 5070 Ti:全面对比评测
AR虚拟试衣技术的挑战与发展方向
情侣之间,如何培养共同的兴趣爱好?
空调辅热和制热有什么区别?三种关键差异帮你做出明智选择
手板制作的选用:CNC加工还是3D打印?——以东莞长安手板厂宏晶佳的专业视角分析
CSGO跳投指令详解:如何精准掌握跳跃投掷技巧
香辣手撕鸡秘籍:厨房小白也能做的美味,撕着吃更快乐!
水晶放哪个方位更旺财
八字七杀为何克比劫
炽焰天穹战斗系统玩法介绍 炽焰天穹战斗系统玩法设定
自行车过斑马线:必须下车推行,违者将被罚款
明装电线用线槽好还是线管好
长途运车用什么物流最好
凡人修仙传元瑶的结局