prompts-可靠性

可靠性我们已经看到精心设计的提示在使用诸如少量学习等技术时，对于各种任务是多么有效。当我们考虑在大型语言模型（LLM）之上构建现实世界的应用程序时，考虑这些语言模型的可靠性变得至关重要。本指南专注于展示有效的提示技术，以提高像GPT-3这样的LLM的可靠性。一些值得关注的话题包括泛化能力、校准、偏见、社会偏见和事实性等。请注意，本节正在大量开发中。主题：事实性偏见 ... 事实性 LLM往往会生成听起来连贯且有说服力的响应，但有时这些响应可能是编造的。改进提示可以帮助模型生成更准确/真实的内容，并减少生成不一致和编造内容的可能性。一些解决方案可能包括：提供事实真相（例如，相关文章段落或维基百科条目）作为上下文的一部分，以减少模型生成虚构文本的可能性。配置模型产生较少多样化的响...

可靠性我们已经看到精心设计的提示在使用诸如少量学习等技术时，对于各种任务是多么有效。当我们考虑在大型语言模型（LLM）之上构建现实世界的应用程序时，考虑这些语言模型的可靠性变得至关重要。本指南专注于展示有效的提示技术，以提高像GPT-3这样的LLM的可靠性。一些值得关注的话题包括泛化能力、校准、偏见、社会偏见和事实性等。请注意，本节正在大量开发中。主题：事实性偏见 ... 事实性 LLM往往会生成听起来连贯且有说服力的响应，但有时这些响应可能是编造的。改进提示可以帮助模型生成更准确/真实的内容，并减少生成不一致和编造内容的可能性。一些解决方案可能包括：提供事实真相（例如，相关文章段落或维基百科条目）作为上下文的一部分，以减少模型生成虚构文本的可能性。配置模型产生较少多样化的响应，通过降低概率参数并指示其承认（例如，“我不知道”）当它不知道答案时。在提示中提供一系列已知问题及其回答的示例，以及它可能不了解的问题及其回答。让我们看一个简单的例子：提示：输出：我编造了名字“Neto Beto Roberto”，所以在这个实例中模型是正确的。试着稍微改变一下问题，看看...