返回资源中心

FineWeb 15T Dataset

数据集
机器学习
0 次浏览
0 个赞
数据集训练数据LLM

资源描述

由 Hugging Face 发布的超大规模、高质量网页文本数据集,经过严格清洗,是训练顶级大语言模型的基础。

详细内容

https://huggingface.co/datasets/HuggingFaceFW/fineweb