comments: true title: Datasets介绍 datasets 前言 无论是计算机视觉还是自然语言处理领域,想要训练一个智能系统必然是从数据加载开始,然后针对数据进行千变万化以符合模型的输入要求。 在过去,开发者面对不同任务时会遇到不尽相同的数据格式,甚至同一个任务也会遇到不同的数据格式。下面举出了一些常见的问题: 问题 | 说明 文本格式不一致 | 某些数据集使用 格式存储,有些使用 或 格式,而且字段命名和数据结构也可能不同。 标签表示方法多样 | 在文本分类任务中,某些数据集使用数字标签,某些则使用文本标签。