提升大型语言模型响应质量的26条黄金法则
创作时间:
作者:
@小白创作中心
提升大型语言模型响应质量的26条黄金法则
引用
CSDN
1.
https://m.blog.csdn.net/m0_51030297/article/details/140057993
在探索大型语言模型(LLMs)的潜力时,设计有效的提示(prompt)至关重要。Sondos Mahmoud Bsharat、Aidar Myrzakhan和Zhiqiang Shen的研究提出了26条原则,以优化用户与这些强大模型的沟通,提升响应质量。这些原则是提示工程的关键,帮助我们更好地利用大模型的自然语言处理能力。
一、26条原则
# 提示原则 指令提示原则
1. 如果您偏好更简洁的答案,与大型语言模型(LLM)交流时无需使用礼貌用语,比如不必添加“请”,“如果你不介意”,“谢谢”,“我想要”等,直接了当。
2. 在提示中整合目标受众,例如,受众是该领域的专家。
3. 将复杂任务分解为一系列更简单的提示,以进行交云对话。
4. 使用肯定指令,如“做”,避免使用否定语言,如“不要”。
5. 当您需要对某个主题、观点或任何信息有更清晰的理解时,请使用以下提示:
a. 用简单的术语解释[插入特定主题]。
b. 像对11岁的我解释一样。
c. 假设我是[领域]的初学者,向我解释。
d. 像你在向5岁小孩解释事情一样,用简单的英语写[文章/文本/段落]。
6. 添加“我将为更好的解决方案提供$xxx打赏!”
7. 实施基于示例的提示(使用少量示例提示)。
8. 格式化提示时,以“###指令###”开始,如果相关,接着是“###示例###”或“###问题##”。然后呈现您的内容。使用一个或多个换行符分隔指令、示例、问题、上下文和输入数据。
9. 整合以下短语:“你的任务是”和“你必须”。
10. 整合以下短语:“你将受到惩罚”。
11. 在提示中使用短语“以自然、类人的方式回答问题”。
12. 使用引导词,如“逐步思考”。
13. 在您的提示中添加以下短语:“确保你的回答无偏见,不依赖于刻板印象”。
14. 允许模型通过向您提问来获取精确的细节和要求,直到它拥有提供所需输出的足够信息(例如,“从现在开始,我希望你向我提问……”)。
15. 要询问特定主题或观点或任何信息,并希望测试您的理解,您可以使用以下短语:“教我任何[定理/主题/规则名称]并在最后包含一个测试,让我知道我在回答后答案是否正确,不要提前提供答案。”
16. 为大型语言模型分配角色。
17. 使用分隔符。
18. 在提示中多次重复特定的单词或短语。
19. 结合思维链(CoT)与少量示例提示。
20. 使用输出引子,即以期望输出的开始结束您的提示。通过在提示结束时加上预期响应的开始来利用输出引子。
21. 写一篇文章/文本/段落/文章或任何类型的详细文本:“请为我详细写一篇关于[主题]的[文章/文本/段落],添加所有必要的信息。”
22. 更正/更改特定文本而不改变其风格:“尝试修改用户发送的每个段落。您应该只改进用户的语法和词汇,并确保它听起来自然。您应该保持原始写作风格,确保正式段落保持正式。”
23. 当您有一个可能在不同文件中的复杂编码提示:“从现在开始,每当您生成跨越多个文件的代码时,生成一个[编程语言]脚本,可以运行以自动创建指定的文件或更改现有文件以插入生成的代码。[你的问题]。”
24. 当您想使用特定的单词、短语或句子启动或继续一段文本时,请使用以下提示:
a. 我提供给你以[歌词/故事/段落/文章...]开头:[插入歌词/单词/句子]。
根据提供的词语完成它。保持流程一致。
25. 清楚地说明模型必须遵循的要求,以关键词、规定、提示或指令的形式。
26. 编写任何文本,如文章或段落,旨在与提供的样本相似,请包括以下说明:
a. 根据提供的段落[/标题/文本/文章/答案]使用相同的语言。
大型语言模型如GPT和LLaMA在处理复杂任务方面表现出色,但它们的潜力往往因提问方式不当而受限。为了提升模型的响应质量,研究者们提出了26条原则,这些原则涉及提示设计的不同方面,如结构、清晰度和用户交互,旨在更有效地挖掘模型的能力。
这些原则被分为五个主要类别:
- 提示结构与清晰度:确保提示简洁、明确,避免使用不必要的信息。
- 具体性与信息:在提示中包含具体的例子和详细信息,帮助模型更好地理解任务。
- 用户交互与参与:允许模型通过提问来获取更多必要的信息。
- 内容与语言风格:根据需要调整语言风格,直接了当。
- 复杂任务与编码提示:将复杂任务分解为一系列简单的步骤。
三、实验结果
3.1 不同规模LLMs的结果
- 提升(Boosting)
- 应用新引入的原则后改进的结果显示在图4中。
- 所有原则普遍在小规模、中等规模和大规模LLMs上带来显著提升。
- 特别是原则2、5、15、16、25和26,在大规模模型中通过原则性提示获得最大改进。
- 特别地,原则14对所有应用该原则的问题都有所改进。
准确性(Correctness)
【绝对准确性】
- 在不同规模的模型上应用原则后,我们考察了它们的绝对性能。
- 这些模型在平均性能上达到了20%至40%的准确率,如图5所示。
- 小规模和中等规模模型的准确率通常在10%至40%之间,而大型模型的准确率可以超过40%。
- 【相对准确性】
- 图6展示了应用原则普遍在不同模型上平均带来超过10%的性能提升。
- 对于更大的模型,这种性能提升可以超过20%。
3.2 更多结果
四、结论——迈向更智能的交互
这项研究不仅为研究人员提供了一套实用的工具,也为普通用户提供了与LLMs有效沟通的方法。随着LLMs的不断发展,这些原则有望成为提升模型性能和用户体验的关键。
结语
26条原则为我们提供了一个起点,帮助我们更有效地利用LLMs的能力,开启人机交互的新篇章。如果你对如何与LLMs进行有效沟通感兴趣,不妨尝试应用这些原则,看看它们能为你的项目带来怎样的改变。
热门推荐
尼采《权力意志》:德国强者文化的基石
中国春节 绽放中华文化之美
长株潭城际铁路与地铁实现融通,提升交通出行服务质量
京雄城际铁路获詹天佑奖:智能高铁的“新标杆”
章台柳:千古绝唱,诗情画意
蛇年新春,你用AI拜年了吗?科技与文化融合,创造新年俗
如何培养孩子的沟通能力:从日常对话到团队协作
家庭幸福力指导师教你高效沟通
从家庭到职场:高效沟通的艺术
宋立老师详解青春期亲子沟通:从理解到实践
亲子沟通新招:化解家庭矛盾
老君山自驾游停车攻略:13号停车场最方便!
怀孕八个月:胎儿发育关键期,准妈妈必知要点
怀孕八个月:关键营养素摄入指南
孕期B超揭秘:8个月胎儿关键指标大起底!
COP16热议:科学如何助力生物多样性保护?
吴国盛新作:揭秘科学本质
厦门八市:百年市场的美食与文化
闽之未姜母鸭带你玩转厦门美食街
百家村的悠闲午后:厦门必打卡美食之旅
南航加密延吉至符拉迪沃斯托克航线至每周两班
南京三大美食街:童家巷、三牌楼、明瓦廊的地道美味
沉鱼落雁、闭月羞花:中国古代四大美女中,竟然有一位是虚构的?
中国古典四大美女:身份与历史作用诠释
罗素谈强者为尊:社会的本质是人吃人?
从马斯克身上学职场强者精神
会议纪要如何写才算专业?
大脑如何科学调节你的情绪?
AI在医疗影像识别中的应用与实践
AI突破:新型病理模型CHIEF将癌症诊断准确率提升至94%