首页
>
资源中心
>
RedPajama-V2
返回资源中心
一个包含 30 万亿 Token 的超大规模开源数据集,经过严格去重和质量评估,是训练大模型的理想选择。
正在加载资源详情...
加载失败,请稍后重试
RedPajama-V2
0
次浏览
0
个赞
资源描述
详细内容
相关资源
Kaggle Titanic Dataset
RedPajama-Data-v2
MovieLens
OpenWebText
FineWeb-Edu
FineWeb