首页
>
资源中心
>
FineWeb 15T Dataset
返回资源中心
正在加载资源详情...
加载失败,请稍后重试
FineWeb 15T Dataset
数据集
机器学习
0
次浏览
0
个赞
数据集
训练数据
LLM
访问链接
点赞
资源描述
由 Hugging Face 发布的超大规模、高质量网页文本数据集,经过严格清洗,是训练顶级大语言模型的基础。
详细内容
https://huggingface.co/datasets/HuggingFaceFW/fineweb
相关资源
ImageNet
MNIST 手写数字集
Hugging Face Hub Datasets
RedPajama-V2 Dataset
LAION-5B Open Dataset
Hugging Face Datasets Library