首页
>
资源中心
>
RedPajama-V2 Dataset
返回资源中心
包含超过 30 万亿个 Token 的开放数据集,专为训练大规模语言模型设计,提供多维度质量过滤和元数据标注。
正在加载资源详情...
加载失败,请稍后重试
RedPajama-V2 Dataset
0
次浏览
0
个赞
资源描述
详细内容
相关资源
ImageNet
MNIST 手写数字集
Hugging Face Hub Datasets
RedPajama-Data-1T
OpenHermes 2.5 Dataset
MMLU Benchmark