3.2.1.2 Temperature控制与多样性-准确性权衡 3.2.1.2 Temperature控制与多样性-准确性权衡:一次因Temperature配置不当导致的“幻觉”事故复盘 你是否曾遇到过这样的场景?你的模型在测试集上表现稳健,但在真实业务中却频频“胡说八道”——明明要求它输出一个确定的答案,它却给出多个看似合理但彼此矛盾的选项;或者在客服对话中,它突然开始编造不存在的政策条款。更令人困惑的是,这些“幻觉”并非随机发生,而是集中在某些特定请求类型上。经过层层排查,最终发现罪魁祸首竟然是一个看似微不足道的超参数:temperature。 这并非虚构的案例。就在去年,我们团队在部署一个金融问答系统时,就遭遇了这样一场“温控失灵”引发的生产事故。