情感分析与酒店评论——处理数据 在本节中,你将使用前几课中学到的技术对一个大型数据集进行探索性数据分析。一旦你很好地理解了各个列的有用性,你将学习: 如何删除不必要的列 如何基于现有列计算一些新数据 如何保存最终挑战中使用的数据集 课前测验 引言 到目前为止,你已经了解了文本数据与数值型数据非常不同。如果这是人类写的或说的文字,可以对其进行分析以找出模式和频率、情感和意义。本课程将带你进入一个真实的数据集,并面临真正的挑战:欧洲515K酒店评论数据,该数据集包含CC0: 公有领域许可。它从Booking.com上公开获取。数据集的创建者是Jiashen Liu。 准备工作 你需要以下内容: 使用Python 3运行.