返回资源中心

包含超过 30 万亿个 Token 的大规模开源数据集,经过严格清洗,是训练高性能基础语言模型的核心资源。

正在加载资源详情...