返回资源中心

由 AI2 发布的包含 3 万亿 Token 的超大规模开源数据集,用于训练 OLMo 等开放语言模型,涵盖网页、书籍、代码等。

正在加载资源详情...