第1章 引言   随着计算性能和存储空间的发展,这使得设备能够运行更大的深度学习模型,有些模型具有数亿,数十亿甚至数百亿的参数,比如常见的7b模型大小,表示70亿的参数量,目前最大的模型参数为4500亿(2024 Snowflake公司的 Arctic模型)。下图是近年来模型大小与GPU发展的趋势,从图中可以看出,GPU硬件发展的速度远远跟不上模型大小的增长速度,这也导致了大模型训练和推理的困难。而模型压缩技术可以弥补这个差距,使得大模型可以在有限的硬件资源上运行。