返回资源中心

包含数万亿个网页抓取数据的海量开源数据集,是训练大规模语言模型 (LLM) 最核心的基础语料库之一。

正在加载资源详情...