基于Secret Hitler游戏评估LLM欺骗能力的新框架与多维指标


文档摘要

Evaluating Large Language Models in a Complex Hidden Role Game:一项面向AI安全的多层社会推理压力测试深度解读 📋 论文基本信息 标题:Evaluating Large Language Models in a Complex Hidden Role Game 作者:Niklas Bauer ArXiv ID:arXiv:2605.22826v1(注:ID中年份“26”为未来编号,属预印本系统常规占位;实际发布日期为2026年5月25日) 学科分类:cs.CL(计算语言学)、cs.AI(人工智能)、cs.GT(博弈论)、cs.MA(多智能体系统) 发布平台:arXiv.


发布者: 作者: 转发
评论区 (0)
U