prompts-可靠性


可靠性 我们已经看到精心设计的提示在使用诸如少量学习等技术时,对于各种任务是多么有效。当我们考虑在大型语言模型(LLM)之上构建现实世界的应用程序时,考虑这些语言模型的可靠性变得至关重要。本指南专注于展示有效的提示技术,以提高像GPT-3这样的LLM的可靠性。一些值得关注的话题包括泛化能力、校准、偏见、社会偏见和事实性等。 请注意,本节正在大量开发中。 主题: 事实性 偏见 ... 事实性 LLM往往会生成听起来连贯且有说服力的响应,但有时这些响应可能是编造的。改进提示可以帮助模型生成更准确/真实的内容,并减少生成不一致和编造内容的可能性。 一些解决方案可能包括: 提供事实真相(例如,相关文章段落或维基百科条目)作为上下文的一部分,以减少模型生成虚构文本的可能性。 配置模型产生较少多样化的响...

可靠性 我们已经看到精心设计的提示在使用诸如少量学习等技术时,对于各种任务是多么有效。当我们考虑在大型语言模型(LLM)之上构建现实世界的应用程序时,考虑这些语言模型的可靠性变得至关重要。本指南专注于展示有效的提示技术,以提高像GPT-3这样的LLM的可靠性。一些值得关注的话题包括泛化能力、校准、偏见、社会偏见和事实性等。 请注意,本节正在大量开发中。 主题: 事实性 偏见 ... 事实性 LLM往往会生成听起来连贯且有说服力的响应,但有时这些响应可能是编造的。改进提示可以帮助模型生成更准确/真实的内容,并减少生成不一致和编造内容的可能性。 一些解决方案可能包括: 提供事实真相(例如,相关文章段落或维基百科条目)作为上下文的一部分,以减少模型生成虚构文本的可能性。 配置模型产生较少多样化的响应,通过降低概率参数并指示其承认(例如,“我不知道”)当它不知道答案时。 在提示中提供一系列已知问题及其回答的示例,以及它可能不了解的问题及其回答。 让我们看一个简单的例子: 提示: 输出: 我编造了名字“Neto Beto Roberto”,所以在这个实例中模型是正确的。试着稍微改变一下问题,看看...

发布者: 作者: 转发
评论区 (0)
U