返回资源中心

一个 800GB 的开源英文文本数据集,包含 22 个高质量子数据集,是训练 GPT 系列等大语言模型的重要数据来源。

正在加载资源详情...