首页
>
资源中心
>
Dolma Open Dataset
返回资源中心
由 AI2 发布的包含 3 万亿 Token 的超大规模开源数据集,用于训练 OLMo 等开放语言模型,涵盖网页、书籍、代码等。
正在加载资源详情...
加载失败,请稍后重试
Dolma Open Dataset
0
次浏览
0
个赞
资源描述
详细内容
相关资源
ImageNet
MNIST 手写数字集
RedPajama-V2 Dataset
Hugging Face Hub Datasets
RedPajama-Data-1T
OpenHermes 2.5 Dataset