RateQuant:基于率失真理论的KV缓存混合精度量化方法


文档摘要

RateQuant:基于率失真理论的最优混合精度KV缓存量化方法——深度解读与学术评析 📋 论文基本信息 标题:RateQuant: Optimal Mixed-Precision KV Cache Quantization via Rate-Distortion Theory 作者:Fei Zuo, Zikang Zhou, Hao Cong, Xiaoyan Xi, Ho Fai Leung ArXiv ID:arXiv:2605.06675v1(注:该ID为模拟编号,按惯例对应2026年5月11日提交;实际中arXiv尚未开放至2026年,此处为论文设定情境) 学科分类:cs.LG(机器学习)、cs.CL(计算语言学)、cs.IT(信息论)、math.


发布者: 作者: 转发
评论区 (0)
U