零样本与少样本提示技术详解：定义、区别与应用场景

创作时间:

作者:

@小白创作中心

零样本与少样本提示技术详解：定义、区别与应用场景

引用

CSDN

https://blog.csdn.net/2401_85373396/article/details/142256209

零样本提示（Zero-shot Prompting）和少样本提示（Few-shot Prompting）是两种重要的提示技术，它们利用大语言模型（LLM）的强大预训练知识，通过最小化的示例输入，实现对复杂任务的快速适应和高效处理。本文将深入探讨这两种技术的使用方式、区别、使用场景以及局限性。

零样本提示（Zero-shot Prompting）

零样本提示的定义是直接向AI大模型提出任务，但不提供如何执行的方法或步骤。大模型必须使用其预训练的知识来生成答案。

简单示例

一个简单的零样本提示示例是询问LLM「中国的首都是什么」。

再比如以下这个例子：

Prompt：从下面的文本中提取技术规格，并以JSON格式表示：
Google Pixel 7, 5G network, 8GB RAM, Tensor G2 processor, 128GB of storage, Lemongrass

复杂示例

想象这样一个场景，公司在招聘人员进来的时候，需要考虑人员的职位、技能、以往职称等因素，然后将其映射到每个公司里自身设置的职级序列和职称。这种场景下，零样本提示就可以完成这个任务。

Prompt：
你的任务是将提供的职位名称标准化为以下列表中的一个：
“数据分析师”，“数据科学家”，“数据架构师”，“数据工程师”，“数据库管理员”，“数据库设计师”，“首席信息官”，“首席技术官”，“IT主管”，“开发经理”，“数据处理经理”，“安全经理”。
你的目的是确保标准化和准确性，必须用最接近匹配的职位名称来回应。
如果没有合适的匹配职位名称，你可以回应“其他”。
职位名称：“高级数据工程师”

与之前的Prompt类似，这里也没有提供任何示例，LLM需要自己找出最佳匹配。为了确保数据质量和可靠性，这个Prompt允许LLM在职称不符合预定义列表时选择“其他”。

少样本提示（Few-shot Prompting）

少量样本提示同样只需要向LLM发送单个Prompt。但与零样本提示的关键区别在于：少量示例被添加到了Prompt中，这些示例可以帮助LLM理解并完成任务。

示例数量的影响

如果示例能够让LLM给出准确回答的话，那是不是意味着给的示例越多，LLM给出的回答就会越准确的？事实证明，添加更多示例并不一定会提高准确性。在某些情况下，添加更多示例反而会降低准确性。多篇研究论文指出，在提供2个示例后准确率会有显著提升，然后趋于平稳。提供超过2个示例可能会浪费资源，也就是浪费Token。

示例顺序的影响

在编写Prompt的时候，提供示例的顺序重要吗？顺序很重要，LLM的预测会根据示例的顺序而发生巨大变化。但是，这取决于你所使用的LLM，不同的LLM，顺序对输出结果的影响程度不一样。其中一个策略就是将最关键的示例放在最后，LLM会对它们处理的最后一部分信息给予重要的权重。

研究案例

这个案例来自于2024年4月的一篇论文，由伦敦大学的研究人员发表。该论文主要围绕「在开源项目中通过Prompt中的示例来解决Bug」的话题。研究方法以及步骤如下：

事实收集：研究人员收集了一组与Bug相关的示例。包括有Bug的代码、错误消息和一些未来用于解决Bug的文档；
Prompt构建：在Prompt中加入示例；
评估：评估这些示例的不同组合会如何影响LLM正确解决Bug的能力。

结论：

每个示例都有独特的作用，突出了拥有多样化示例的重要性；
更多的示例并不意味着更好的输出：添加更多的示例并不总是导致更好的结果，如果Prompt变得过于杂乱或复杂，有时甚至会降低性能。

少样本提示的局限性

尽管少样本提示很有用，但它依然存在很大的局限性。其中，最大的局限性就是它依赖于所提供示例的质量和多样性，也就是说，垃圾进，垃圾出。正如上文所提到的，示例还有可能会降低LLM的性能，或者将其引向错误的方向。此外，还有过拟合的风险——LLM可能不会泛化示例，从而创建出完全照搬模仿示例的回答，这样的回答有可能根本不符合逻辑。