3.1.2 数据分析


文档摘要

# 数据分析 数据分析的价值主要在于熟悉了解整个数据集的基本情况包括每个文件里有哪些数据,具体的文件中的每个字段表示什么实际含义,以及数据集中特征之间的相关性,在推荐场景下主要就是分析用户本身的基本属性,文章基本属性,以及用户和文章交互的一些分布,这些都有利于后面的召回策略的选择,以及特征工程。 建议:当特征工程和模型调参已经很难继续上分了,可以回来在重新从新的角度去分析这些数据,或许可以找到上分的灵感 导包 读取数据 数据预处理 计算用户点击rank和点击次数 数据浏览 用户点击日志文件训练集 image-20201119112706647 trainclicklog.


发布者: 作者: 转发
评论区 (0)
U