数据分析实例 分析MovieLens电影数据
- 导入数据
- 数据合并
- 按性别查看各个电影的平均评分
- 活跃电影排行榜
电影投票数据
grouplens.org/datasets/movielens
把文件放到这个路径下
导入数据
数据合并
按性别查看各个电影的平均评分
查看男女评分差别最大的
按照diff去排序 找出分歧最大的就好啦
活跃电影排行榜
评分个数
这些就是最热门的电影(前十大热门电影)
下面找评分最高的电影
但是现在结果是很多评分高的用户少的不知名的电影排行很高
为了解决这个问题
先看一下前十大热门电影的评分
前二十大高分电影
下面看一下前二十大高分电影的热度,我们用前二十大电影作为索引
我们用前二十大热门电影作为索引
我们为了避免上面问题的出现,我们首先要找热度比较高的电影,有足够的评分次数
然后用热度足够高的电影去找到这个评分
我们再来看一下前二十啊