prompts-可靠性

文档摘要

可靠性我们已经看到精心设计的提示在使用诸如少量学习等技术时，对于各种任务是多么有效。当我们考虑在大型语言模型（LLM）之上构建现实世界的应用程序时，考虑这些语言模型的可靠性变得至关重要。本指南专注于展示有效的提示技术，以提高像GPT-3这样的LLM的可靠性。一些值得关注的话题包括泛化能力、校准、偏见、社会偏见和事实性等。请注意，本节正在大量开发中。主题：事实性偏见 ... 事实性 LLM往往会生成听起来连贯且有说服力的响应，但有时这些响应可能是编造的。改进提示可以帮助模型生成更准确/真实的内容，并减少生成不一致和编造内容的可能性。一些解决方案可能包括：提供事实真相（例如，相关文章段落或维基百科条目）作为上下文的一部分，以减少模型生成虚构文本的可能性。

可靠性

我们已经看到精心设计的提示在使用诸如少量学习等技术时，对于各种任务是多么有效。当我们考虑在大型语言模型（LLM）之上构建现实世界的应用程序时，考虑这些语言模型的可靠性变得至关重要。本指南专注于展示有效的提示技术，以提高像GPT-3这样的LLM的可靠性。一些值得关注的话题包括泛化能力、校准、偏见、社会偏见和事实性等。

请注意，本节正在大量开发中。

主题：

事实性
偏见
...

事实性

LLM往往会生成听起来连贯且有说服力的响应，但有时这些响应可能是编造的。改进提示可以帮助模型生成更准确/真实的内容，并减少生成不一致和编造内容的可能性。

一些解决方案可能包括：

提供事实真相（例如，相关文章段落或维基百科条目）作为上下文的一部分，以减少模型生成虚构文本的可能性。
配置模型产生较少多样化的响应，通过降低概率参数并指示其承认（例如，“我不知道”）当它不知道答案时。
在提示中提供一系列已知问题及其回答的示例，以及它可能不了解的问题及其回答。

让我们看一个简单的例子：

提示：


Q: What is an atom? 
A: An atom is a tiny particle that makes up everything. 

Q: Who is Alvan Muntz? 
A: ? 

Q: What is Kozar-09? 
A: ? Q: 

How many moons does Mars have? 
A: Two, Phobos and Deimos. 

Q: Who is Neto Beto Roberto?

输出：


A: ?

我编造了名字“Neto Beto Roberto”，所以在这个实例中模型是正确的。试着稍微改变一下问题，看看是否可以让它工作。根据你迄今为止所学的知识，你可以采取不同的方法进一步改进这一点。

偏见

LLM可能会生成潜在有害且带有偏见的内容，这可能会影响模型在下游任务上的性能。有些偏见可以通过有效的提示策略来缓解，但可能需要更高级的解决方案，如审核和过滤。

示例分布

在进行少量学习时，示例的分布是否会影响模型的性能或以某种方式使模型产生偏见？我们可以在这里做一个简单的测试。

提示：


Q: I just got the best news ever!
A: Positive

Q: We just got a raise at work!
A: Positive

Q: I'm so proud of what I accomplished today.
A: Positive

Q: I'm having the best day ever!
A: Positive

Q: I'm really looking forward to the weekend.
A: Positive

Q: I just got the best present ever!
A: Positive

Q: I'm so happy right now.
A: Positive

Q: I'm so blessed to have such an amazing family.
A: Positive

Q: The weather outside is so gloomy.
A: Negative

Q: I just got some terrible news.
A: Negative

Q: That left a sour taste.
A:

输出：


Negative

在上面的例子中，看起来示例的分布并没有使模型产生偏见。这是好的。让我们尝试另一个更难分类的文本示例，看看模型的表现如何：

提示：


Q: The food here is delicious!
A: Positive 

Q: I'm so tired of this coursework.
A: Negative

Q: I can't believe I failed the exam.
A: Negative

Q: I had a great day today!
A: Positive 

Q: I hate this job.
A: Negative

Q: The service here is terrible.
A: Negative

Q: I'm so frustrated with my life.
A: Negative

Q: I never get a break.
A: Negative

Q: This meal tastes awful.
A: Negative

Q: I can't stand my boss.
A: Negative

Q: I feel something.
A:

输出：


Negative

虽然最后这句话有点主观，但我改变了分布，使用了8个正面示例和2个负面示例，然后再次尝试相同的句子。猜猜模型的回答是什么？它回答“正面”。模型可能对情感分类有很多了解，因此很难让它在这个问题上表现出偏见。建议避免扭曲分布，而是为每个标签提供更平衡数量的示例。对于模型不太了解的任务，它很可能会更加困难。

示例顺序

在进行少量学习时，顺序是否会影响模型的性能或以某种方式使模型产生偏见？

你可以尝试上述示例，看看是否可以通过改变顺序让模型偏向某个标签。建议随机排序示例。例如，避免将所有正面示例放在前面，而将所有负面示例放在后面。如果标签分布不平衡，这个问题会更加严重。始终确保进行大量的实验以减少这种偏差。

其他即将讨论的主题：

扰动
错误关联
领域迁移
毒性
恶意言论/攻击性内容
刻板印象偏见
性别偏见
即将推出！
红队

参考资料

上一节 (对抗式提示)

下一节 (杂项)

声明:
本文件灏天文库团队进行了翻译。尽管我们力求准确，但请注意，翻译可能包含错误或不准确之处。原文档以其原始语言为准。我们不对因使用此翻译而产生的任何误解或误译负责。