返回资源中心

一个超过 30 万亿 Token 的超大规模开放数据集,旨在复刻 Llama 的预训练数据,是训练开源大语言模型的基础基石。

正在加载资源详情...