首页 > Python教程 > Python应用 > 我用Python纪念了那些被烂片收割的智商税!

我用Python纪念了那些被烂片收割的智商税!

时间:2019-10-26    作者:徐麟   来源:数据森麟公众号

前言 

随着电影行业的蓬勃发展,越来越多的电影出现在了观众的视野中,丰富了大家的生活,好的电影也能让大家在放松自我的同时收获一些对人生的思考。

然而,也有那么一些“烂片”,让大家在看过之后“添堵”,后悔为这种“烂片”贡献票房,白白被收割了“智商税”,今天,我们就用Python来几年那些被烂片收割走的智商税。

数据获取 

这次的数据源也是大家的老朋友,被亲切地称之为“马蜂窝”的豆瓣网,现在有很多平台会对电影进行打分,包括了猫眼和淘票票,但是相较之下,豆瓣的评分更加全面,一些冷门的“烂片”只能在豆瓣中被大家挖掘出来。

诚然,豆瓣的评分会存在一些“文艺滤镜”,对文艺片比较宽容,对此我们认为,“豆瓣评分高的不一定是真的高,但是被豆瓣打了低分的是真的低”。此次选择的影片范围是 2010 年至今的国产影片:

最终获取到了 3000 多部电影的数据,代码如下:

image.png

整体数据 

首先要做的事情就是看一下豆瓣对国产电影的整体打分情况,以此确定之后对“烂片”的划分依据,首先看一下整体评分的柱形图:

可以看到豆瓣用户对国产片还是比较严格,大多数电影都是在 6 分一下, 8 分以上的电影可以说是“凤毛麟角”,因此后续对烂片的标准也要相应放低,下面看一下各个将分数向下取整后的统计数量:

2010 年之后获得 9 分的国产电影只有一部,可以说是非常的不易,大家可以猜一下是哪部电影,看看是不是你心中的 9 分电影

下面为大家揭开谜底:

唯一一部获得 9 分的就是 18 年上映的《我不是药神》,未来也希望能有更多这样的优秀影片,而且这种期望也是有依据的,我们看一下每一年烂片和非烂片的占比:

可以看到从烂片和超级烂片占比在 16 年达到顶峰之后,从 17 年开始烂片占比在逐渐下降,相信未来烂片的占比也会逐渐下降

人气榜 

有了整体的综述后,我们确定了烂片和超级烂片的划分依据,将 4 分之下的影片划分为烂片, 3 分以下的影片划分为超级烂片,下面就分别来看看各自的人气榜:

可以看到在所有的影片中,人气TOP10 的影片评分都还是不错,流浪地球,药神和哪吒也都在票房中有非常不错的表现,显然,这不是我们需要,我们下面就来看下烂片和超级烂片中的人气榜:

热烈恭喜《上海堡垒》凭借2. 9 分的评分和 217110 的评价数喜提两项人气榜的冠军,《爱情公寓》因为“大忽悠”式的营销也跻身榜单,不知道即将上映的《爱情公寓5》能否为这一系列挽回一些口碑

票房榜 

同样,我们来分别看下所有影片、烂片和超级烂片的票房排行,看看究竟是哪些“烂片”在疯狂收割着大家的智商税,首先看一下左右影片的票房榜:

排名第 10 的西虹市首富票房都已经到了 25 亿,可见票房市场发展之迅速,今年国庆档的两部影片《我和我的祖国》以及《中国机长》分列八九名,相信未来这份榜单会不断的发生变化。

《西虹市首富》同样以6. 5 分的评分在榜单中评分最低,看来《西虹市首富》已经成为了一个标杆,6. 5 分也是一部票房卖座影片的底线,下面进入重点了,看一下那些疯狂收割大家智商税的烂片和超级烂片:

烂片票房榜中的TOP10 都超过了2. 6 亿,大闹天竺和爱情公寓更是分别收获了7. 5 亿和5. 5 亿的票房,疯狂收割着大家的智商税,相信未来随着大家对影片要求的提高,疯狂收割智商税的现象会逐渐减少

令人意想不到的是,就连超级烂片的TOP10 都可以收割 5000 万以上的票房,更是有四部票房过亿,在此提醒大家“观影有风险,选片需谨慎”

演员榜

一部烂片的诞生想必也离不开“演员”的努力,下面就来分别看看所出演电影平均分最高和最低的演员:

评分高的演员就无须赘述了,都是经过了市场和观众的挑战,但是目前还没有一位演员在主演影片数量超过 5 部之后,分数可以上7,诚然有一部分是因为豆瓣对国产的严格要求,但另一方面也在敦促电影人不断进步

下面看一下评分排在倒数的演员,首先看下BOTTOM10:

看到这份榜单,有种恍惚的感觉,确认这不是主持人或者相声、小品演员的榜单,我们不禁要问:大家有事吗?快乐家族更是“霸榜”,杜海涛凭借精湛的演技和出众的外形在榜单中独占鳌头,相信他未来会给大家带来更为“惊艳”的作品,吴亦凡也代表说唱歌手在榜单中出现,填补了榜单中歌手的空白。

由于过多的“跨界”演员出现在了榜单BOTTOM10 中,导致很多大家心目中的演员没有上榜,于是我们继续看BOTTOM11-20,这份榜单似乎正常了一点,但是好多更加应该在电视剧中出现的名字也位列其中。

看来电影和电视剧还是有所区别,在电视剧中能够大放异彩的演员未必能在电影中有同样精彩的表现,考虑到电视剧演员们的加入,继续把榜单范围放大到BOTTOM21-30:

这份榜单终于正常了很多,很多大家心目中的“种子选手”都不负众望地出现在了榜单中,特别是黄晓明和Angelababy这对模范夫妻的上榜,进一步提高了榜单的公信力,未来也希望他们能够继续联袂为大家带来精彩作品,很多人可能会表示怀疑,对此我们的回复很简单:我不要你相信,我要我相信!

相关推荐
七星彩开奖时间登入
Python教程:如何用xlrd和xlwt库读和写Excel表格?
Python安装MySQL-python:EnvironmentError的解决办法
分享:Python2和Python3有那些差异?
Python正在吞噬世界:它为何会赢又将走向何方?
Python 的内置对象都藏了哪些小秘密?
实战干货!用案例让你一文搞懂python网络爬虫
Python教程:图像处理模块ndimage用法实例分析
Python教程:代理IP爬虫的使用方法
Python教程:如何使用scipy模块实现一维卷积运算示例?
Python:关于内存分配时的那些小秘密分享
python技巧:global关键字的用法详解
Python教程:深入了解python在HDA中的应用
python技巧:SSLerror的requests证书问题解决方法
PyCharm教程:搭建Spark开发环境的几个步骤
分享:Django Admin中增加导出CSV功能过程详解
Python开发技巧:openpyxl读取单元格字体颜色过程解析
Python教程:面向对象之Web静态服务器
Python教程:如何为终端提供持久性历史记录
Python技巧分享:自动登录淘宝并保存登录信息的方法
Python数据分析:利用Flask动态展示 Pyecharts 图表数据方法
python3教程:如何搭建微型的web服务器?
python技巧:xlwt如何设置单元格的自定义背景颜色
Python开发:Django中间件拦截未登录url实例详解
如何解决Python字符串和正则表达式中的反斜杠('\')问题?
Python开发技巧:编写一个简单登录功能过程解析
Python编程:postman传递当前时间戳实例详解
Python爬虫教程:使用beautifulSoup4爬取名言网案例代码分享
python开发:动态迁移solr数据过程分享
python数据分析:用线性回归预测股票价格的代码分析
Python教程:数据分析模块pandas用法详解
Python3教程:pandas.merge用法详解
Python爬虫案例:如何爬取豆瓣电影信息?附代码实例
python开发:如何编写简单端口扫描器?
Django框架教程:Pagination分页实现代码实例
python爬虫实例:猫眼电影和电影天堂数据csv和mysql存储过程

精彩推荐

热门教程

网站地图 新葡京彩票注册登入 南国时时彩登入 金巴黎彩票官方网登入
太阳城集团彩票游戏 申博游戏娱乐 太阳城集团官方网站 申博娱乐游戏ag国际馆
bet足球开户 盛源彩票平台 lhf乐豪发娱乐 j8网登入
七星彩票开户登入 澳彩网彩票游戏登入 威尼斯人有多少被黑的登入 新葡京彩票网址登入
500vip彩票是正规的吗登入 易博娱乐登入 东方彩票app下载登入 易博娱乐网址登入
118jbs.com 988TGP.COM 133DC.COM 785DC.COM 77sbsun.com
8RQS.COM 1112932.COM 101ib.com 986XTD.COM 911XTD.COM
188TGP.COM 298psb.com 984XTD.COM 158jbs.com 877TGP.COM
uk138.com 4444XSB.COM 9TGP.COM 8JZS.COM 498SUN.COM