返回资源中心

一个 800GB 的开源英文文本数据集,由 22 个较小的子数据集组成,是训练 GPT-J 等大型语言模型的核心语料。

正在加载资源详情...