“史上最强春节档”来袭!数据解读值得看的影片是......

戳蓝字“CSDN云计算”关注我们哦!


作者介绍:徐麟,目前就职于互联网公司数据部,哥大统计数据狗,从事数据挖掘&分析工作,喜欢用R&Python玩一些不一样的数据

个人公众号:数据森麟(ID:shujusenlin),知乎同名专栏作者。


前言


随着春节脚步的临近,想必各位读者都已经开始规划幸福的春节长假该如何度过。阖家团聚,探亲访友,与好久没见的好基友一起谈天说地,怼天怼地,想想都是让人感到幸福。


除此之外,每年的春节档电影都会如约而至与大家见面,春节档诞生了许多的经典电影,2019的春节档电影也是佳片云集,被称作“史上最强春节档”,今天我们就带大家一起用数据去解读其中最值得看的影片


数据获取


本次我们的数据主要来源于猫眼,一部分是猫眼的实时预售票房数据:


640?wx_fmt=png


这部分数据可以通过selenium去获取,代码如下:


driver = webdriver.Chrome()
driver.maximize_window()    
driver.close() 
driver.switch_to_window(driver.window_handles[0])  
url = 'https://piaofang.maoyan.com/dashboard?date=2019-02-05'
js='window.open("'+url+'")'
driver.execute_script(js)
driver.close() 
driver.switch_to_window(driver.window_handles[0])


另一部分数据则来源于猫眼的观众评论,由于电影目前都还没有上映,观众评论给出的分数,表示了其对电影的期待值。需要注意的是,有许多观众在评论中并没有给出评分,会直接显示为0,在后续计算时需要排除,数据如下:


640?wx_fmt=png


这部分数据的获取方法可以参照之前3天破9亿!上万条评论解读《西虹市首富》是否值得一看,我们就直接省略爬取代码


预售票房


衡量一个电影关注度的重要方法就是去看首日的预售情况,我们此次选取八部春节档最主要的影片进行对比,代码如下:


p<-ggplot(data[order(data$sale,decreasing = T),][1:8,],
         aes(x=reorder(name,sale),y=sale,fill=name))+
 geom_bar(stat='identity',width = 0.5)+
 geom_image(aes(x=name,y=0,image=image),size=0.08)+
 geom_text(aes(x=name,y=2500,label=label_sale),size = 7,col='black',fontface='bold')+
 ggtitle('春节档电影预售票房排名(万)') + theme_economist()+ scale_fill_tableau()+                 
  theme(axis.text.x = element_blank(),
       axis.text.y = element_blank(),
       plot.title = element_text(hjust=0.5,size=30),
       panel.grid = element_blank(),
       legend.position = 'none',
       panel.background = element_blank(),
       axis.title  = element_blank(),
       axis.line = element_blank(),
       axis.ticks = element_blank()
 )+coord_flip()+ylim(0,6500)
ggsave("春节档上映前预售排名.png", pwidth = 10, height = 16)


看一下最终的结果:


640?wx_fmt=png


目前预售排名前三位的都是喜剧题材,看来在春节的时候大家还是更加希望能够放松自己,看一下轻松题材的影评。但是预售票房并不能完全觉得最终的票房走势,可以参考之前上映后口碑崩塌的《地球最后的夜晚》和《爱情公寓》。


排名前两位的影片都有沈腾的参与,看来目前沈腾的票房认可度还是不错的,希望两部影片最终都会取得不错的结果。


从预售票房上看,《廉政风云》和《神探蒲松龄》都有比较大的扑街危险,考虑到港片近期略显低迷的表现,希望这两部影片能够带来一些惊喜。


上映前口碑


另外我们也看一下上映之前,观众对于影片的整体评价情况,这也会在一定程度上体现观众的期待值


代码如下:


p<-ggplot(data[order(data$score,decreasing = T),][1:8,],
         aes(x=reorder(name,score),y=score,fill=name))+
 geom_bar(stat='identity',width = 0.5)+
 geom_image(aes(x=name,y=0,image=image),size=0.08)+
 geom_text(aes(x=name,y=2,label=label_score),size = 7,col='black',fontface='bold')+
 ggtitle('春节档电影上映前评价') + theme_wsj()+ scale_fill_tableau()+                 
  theme(axis.text.x = element_blank(),
       axis.text.y = element_blank(),
       plot.title = element_text(hjust=0.5,size=30),
       panel.grid = element_blank(),
       legend.position = 'none',
       panel.background = element_blank(),
       axis.title  = element_blank(),
       axis.line = element_blank(),
       axis.ticks = element_blank()
 )+coord_flip()+ylim(0,5)
ggsave("春节档上映前评分排名.png", pwidth = 8, height = 12)


看一下最终的结果:


640?wx_fmt=png


《熊出没》出人意料的在评分中排在首位,这也一定程度上提高了作者对这部影片的期待值,虽然以作者的年龄,应该是不适合去看这部影片u1F602.png《小猪佩奇》凭借此前的超强营销,成功引起了大家的主要,然而最终表现如何,还是需要上映后接受观众的检验。


 同时我们看到成龙大哥领衔的《神探蒲松龄》在评分上要落后于其他影片,看来大家对于这类题材的影片持保留意见比较多一些,我们也期待上映后口碑是否能够实现翻盘。


影片看点


我们最后通过评论去挖掘上映前大家比较关注的点,主要采用jieba分词,需要注意的是,我们需要在分词前增加一些自定义词典,比如“黄景瑜”,如果不加这个自定义词典,就会被分为“黄景”,之后我们会根据词语出现频率筛选出重要的关键词:


def key_words(df):
   comment_str =  ' '.join(df)
   words_list = []
   jieba.load_userdict('spring_film_dict.txt')
   word_generator = jieba.cut(comment_str)  # 返回的是一个迭代        f.close()  # stopwords文本中词的格式是'一词一行'
    for word in word_generator:
       words_list.append(word)
   words_list = Counter([k for k in words_list if len(k)>1])
   return list(dict(words_list.most_common(30)).keys())


最后我们在每个影片中选取了五个能够体现其看点的词语,并进行可视化:


640?wx_fmt=png


我们选取一些比较有趣的看点组合,进行一下深刻(suixing)解读


《神探蒲松龄》:大家都在期待成龙大哥的表演,虽然有很多人提前给其打上了“烂片”的标签,但是依然期待影片口碑的翻盘。同时大家也会认真关注影片特效,不知是否会致敬此前5毛钱“duang”的特效。


《飞驰人生》《疯狂的外星人》:感觉沈腾大有承包今年春节档的态势,预售排名前两位影片中,观众最关注的看点都是沈腾,期待沈腾春节霸屏同时也能收获不错的口碑。沈腾又是和外星人打交道,又是要体验飞驰的人生,喜欢沈腾的观众在春节档可以大饱眼福了。


《小猪佩奇过大年》:一部适合孩子观看的影片,也是一部宣传片获得极大讨论度的影片,希望不要步此前《地球最后的夜晚》上映后口碑崩盘的后尘。


《新喜剧之王》:显然大部分观众对这部影片的期待来自于星爷,有了此前经典版的《喜剧之王》珠玉在前,《新喜剧之王》不可避免地会被哪来与原作对比,我们期待能够简直有一部经典的影片出现。



推荐阅读

  • Spring-Data-JPA尝鲜:快速搭建CRUD+分页后台实例

  • 孟岩:区块链的原则与价值观

  • 嫁人当嫁程序员

  • 原子互换:一统公链江湖的神来之笔

  • 春晚鬼畜 B 站日排行最高,赵本山:我的时代还没有结束!

  • PDF翻译神器,再也不担心读不懂英文Paper了

  • 新闻联播也可以拿来做数据分析?



1.微信群:

添加小编微信:color_ld,备注“进群+姓名+公司职位”即可,加入【云计算学习交流群】,和志同道合的朋友们共同打卡学习!


2.征稿:

投稿邮箱:liudan@csdn.net;微信号:color_ld。请备注投稿+姓名+公司职位。

640?wx_fmt=png喜欢就点击“好看”吧!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/524738.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

大厂必问的分布式究竟是什么鬼?

戳蓝字“CSDN云计算”关注我们哦&#xff01;新的一年又开始了&#xff0c;各大招聘咨询机构都会对过去一年市场上的人才供需进行盘点。根据高端招聘平台100 offer发布的Java人才盘点报告&#xff0c;在过去的2018年&#xff0c;Java仍然是最流行、招聘供需量最大的技术语言。在…

为什么不用原生Spring-Cloud-Config

戳蓝字“CSDN云计算”关注我们哦&#xff01;引言近几年传统应用架构已经逐渐朝着微服务架构演进。那么随着业务的发展&#xff0c;微服务越来越庞大&#xff0c;此时服务配置的管理变得会复杂起来。为了方便服务配置文件统一管理&#xff0c;实时更新&#xff0c;配置中心应运…

cesium实现区域贴图及加载多个gif动图

1、cesium加载多个gif动图 Cesium的Billboard支持单帧纹理贴图&#xff0c;如果能够将gif动图进行解析&#xff0c;获得时间序列对应的每帧图片&#xff0c;然后按照时间序列动态更新Billboard的纹理&#xff0c;即可实现动图纹理效果。为此也找到了相对于好一点的第三方库libg…

DevOps“兵器”60样,你都会使哪几样?

戳蓝字“CSDN云计算”关注我们哦&#xff01;编前按&#xff1a;获得开发者社区支持的自动化&#xff0c;开源的工具是大家梦寐以求的。这里列举了 60 多款最棒的开源工具&#xff0c;可以帮助你很好的实行 DevOps。一、开发工具版本控制&协作开发1.版本控制系统 GitGit是一…

云漫圈 | 腾讯面试,我竟然输给了final关键字

戳蓝字“CSDN云计算”关注我们哦&#xff01;作者&#xff1a;乔戈里来源&#xff1a;程序员乔戈里腾讯面试现场——————final 在 Java 中是一个保留的关键字&#xff0c;可以声明变量、方法、类。什么是final变量 / 类 / 方法&#xff1f;任何变量前被 final 修饰就是 fin…

学习微服务网关zuul,看这篇就够了

戳蓝字“CSDN云计算”关注我们哦&#xff01;作者&#xff1a;爱撒谎的男孩 原文&#xff1a;https://chenjiabing666.github.io/2018/12/25/zuul%E6%9C%8D%E5%8A%A1%E7%BD%91%E5%85%B3/本文系读者投稿&#xff0c;已获作者原创授权。如果你有好文章&#xff0c;可以戳这里投稿…

写给程序员的裁员防身指南

戳蓝字“CSDN云计算”关注我们哦&#xff01;大家都知道 18 年底许多大公司都开始了「人员优化」动作&#xff0c;不仅仅美团等大厂有所行动&#xff0c;就连一些平时求贤若渴的小公司也有所动作。本来我以为关于劳动法的事情&#xff0c;许多人应该多多少少都应该了解。但最近…

使用Kubernetes和Docker将Spring Boot与MongoDB作为容器部署

戳蓝字“CSDN云计算”关注我们哦&#xff01;对于本教程&#xff0c;您将拥有一个Docker化Spring-Boot实例程序&#xff0c;该应用程序与MongoDB通信以获取GET/POST API请求&#xff0c;并部署在Kubernetes集群中。前提条件MinikubeKubectlDockerMavenDocker是一个具有"社…

5种数据分析常用的思维方法!

戳蓝字“CSDN云计算”关注我们哦&#xff01;转自&#xff1a;中国统计网来源&#xff1a;网络大数据在数据分析中&#xff0c;数据分析思维是框架式的指引&#xff0c;实际分析问题时还是需要很多“技巧工具”的。就好比中学里你要解一元二次方式&#xff0c;可以用公式法、配…

分布式系统与消息投递

戳蓝字“CSDN云计算”关注我们哦&#xff01;原文&#xff1a;https://draveness.me/message-delivery消息是一个非常有趣的概念&#xff0c;它是由来源发出一个离散的通信单元&#xff0c;被发送给一个或者一群接受者&#xff0c;无论是单体服务还是分布式系统中都有消息的概念…

“迁移策略+新容器运行时”应对有状态应用的冷热迁移挑战

戳蓝字“CSDN云计算”关注我们哦&#xff01;作者&#xff1a;稻农来源&#xff1a;阿里系统软件技术稻农&#xff08;叶磊&#xff09;阿里云智能事业群高级技术专家参与主导容器运行时及网络创新工作&#xff1b;目前的工作侧重于基于进程虚拟化的研究及增强&#xff08;网络…

C语言 main 函数参数 main(int argc, char *argv[]) - C语言零基础入门教程

目录 一.main 函数写法二.main 函数参数简介三.使用 main 函数参数 1.打印 main 函数参数 a.直接运行 exe 文件b.打开 cmd 命令行窗口执行 exe 文件c.打开 cmd 命令行窗口执行 exe 文件并设置 main 函数参数 2.使用 main 函数参数 三.猜你喜欢 零基础 C/C 学习路线推荐 : C/C …

网络通信的两个要素

如何实现网络通信&#xff1f; 通信双方地址&#xff1a; ip 端口号 192.168.16.124:5900 规则&#xff1a;网络通信的协议 TCP/IP参考模型&#xff1a; 小结&#xff1a; 1.网络编程两个主要问题&#xff1a; 定位一台或多台主机 找到主机如何通信 2.网络编程要素 …

讲讲亿级PV的负载均衡架构!

戳蓝字“CSDN云计算”关注我们哦&#xff01;来源&#xff1a;孤独烟引言本来没想写这个题材的&#xff0c;为了某某童鞋能够更好的茁壮成长&#xff0c;临时写一篇负载均衡的。负载均衡&#xff0c;大家可能听过什么3层负载均衡、4层负载均衡、7层负载均衡什么的&#xff1f;那…

云漫圈 | 学Python还是Java, 8张漫画带你全面分析

戳蓝字“CSDN云计算”关注我们哦&#xff01;作者&#xff1a;Leoxin来源&#xff1a;菜鸟学PythonJava和Python两门语言都是目前非常热门的语言&#xff0c;可谓北乔峰南慕容&#xff0c;二者不分上下&#xff0c;棋逢对手。但是对于初学者来说&#xff0c;非常困惑&#xff0…

史上最全SQL优化方案

戳蓝字“CSDN云计算”关注我们哦&#xff01;作者&#xff1a;惨绿少年来源&#xff1a;Hollis在进行MySQL的优化之前&#xff0c;必须要了解的就是MySQL的查询过程&#xff0c;很多查询优化工作实际上就是遵循一些原则&#xff0c;让MySQL的优化器能够按照预想的合理方式运行而…

趣挨踢栏目精华汇总

出品 | CSDN云计算 有问有答&#xff0c;一问一答的形式&#xff0c;帮助大家快速解决更多专业难题。 出品 | CSDN云计算 趣挨踢&#xff0c;用最轻松活泼的形式&#xff0c;让你看尽生活百态。 趣挨踢 | 30 个让程序员崩溃的瞬间&#xff0c;笑死我了&#xff01; 趣挨踢 …

趣挨踢 | 只有挨踢人才能读懂的西游记

戳蓝字“CSDN云计算”关注我们哦&#xff01;作者 | 刘超本文转载自公众号&#xff1a;刘超的通俗云计算一、我佛造经传极乐话说我佛如来为度化天下苍生&#xff0c;有三藏真经&#xff0c;可劝人为善。就如图中所示&#xff0c;真经所藏之处&#xff0c;在于云端。佛祖所管辖之…

react虚拟和真实DOM

<!DOCTYPE html> <html> <head> <meat charset"UTF-8"> <title>1_使用jsx创建虚拟DOM</title> </head> <body> <!-- 准备好一个容器 --> <div id"test"></div> <div id"demo…

什么是5G,我们能从中得到什么?

戳蓝字“CSDN云计算”关注我们哦&#xff01;本文转载自公众号&#xff1a;SDNLAB今年&#xff0c;全球首个5G网络开通&#xff0c;向用户承诺了更快的数据传输速度和更低的延迟。此外&#xff0c;5G还为新的工业应用开辟了道路&#xff0c;成为实现“智能城市”的关键因素。5G…