首页
>
资源中心
>
RedPajama-Data-1T
返回资源中心
一个超过 1.2 万亿 token 的开源数据集,旨在完全复制 LLaMA 训练数据,是训练开源大模型的首选基座。
正在加载资源详情...
加载失败,请稍后重试
RedPajama-Data-1T
0
次浏览
0
个赞
资源描述
详细内容
相关资源
ImageNet
MNIST 手写数字集
RedPajama-V2 Dataset
Hugging Face Hub Datasets
OpenHermes 2.5 Dataset
MMLU Benchmark