数据视角可视化分析豆瓣电影评分爬虫数据

豆瓣已经成为国内影迷和影评人的聚集地。

由Kaizong Ye,Weilong Zhang撰写

豆瓣评分已经成为评价电影的重要指标。

豆瓣积累了大量的电影数据,为电影行业分析提供了重要资源。


豆瓣电影被用来衡量国内外电影的发展。

中国与其他国家对比

汇总年电影总产量。 一直在快速推进的电影产业在2017年出现转折,电影产量开始下滑。

与现在相比,相差1500部左右。 这种趋势一直持续。 


视频

Python的天气数据爬虫实时抓取采集和可视化展示

探索见解

去bilibili观看

探索更多视频

 
中国大陆的评分低于整体评分,然后我们选择电影数量排名前三的国家与中国大陆进行比较。 日本电影的质量非常好,评分一直保持在平均水平以上。 中国大陆、美国和日本的电影评分差距很大。 美国电影评分更高。

总体而言,近年来电影产量有所下降,但评分有所上升。 怀疑两者之间存在联系。

电影类型烂片分析

再来看看拍摄偏好和烂片率。 现在烂片越来越多。 现在让我们从数据的角度来看。

按烂片率降序排列,不良片定义为:评分低于3.35分(5.9-1.5*(7.6-5.9))。 每种类型的电影数量需要大于200。

众所周知,日本有丰富的情色和动画电影,战争片的烂片率最低,其次是悬疑片。


关联规则APRIORI挖掘豆瓣读书评论爬虫采集数据与可视化

阅读文章


中国恐怖惊悚片的烂片率非常高,不建议观看。 而且,国产电影包揽了豆瓣烂片前五名:女娲日记拿下豆瓣烂片之王,得分倒数第,接着是怨灵宿舍之白纸女生、女导演连环杀人案、灵异实录


随时关注您喜欢的主题


电影数量分析

统计每个国家的电影数量,选出前4名的观察值:

豆瓣采用打星的方式,所以最低分是一星,也就是两分。

影片数量超过500部,综合评分和数量后,前4名的国家或地区:

在豆瓣,收录在电影里。 虽然美国、中国大陆、日本都有大量的电影。 但平均评分低于法国、英国、德国和意大利。 其中,德国的电影评分均值最高,英国的电影数量最多,这意味着相对而言,德国电影的质量最高。 从离散值也可以看出,英国部分数据的离散值非常低,比如:《围攻唐宁街》,豆瓣评分2.4分,但还是没有国产神剧2.0分低。 豆瓣包括电影500+的国家或地区,大部分为发达国家,或中国、印度等人口大国,说明电影数量可能与一个国家或地区的发展水平有一定的关系。

本文章中的所有信息(包括但不限于分析、预测、建议、数据、图表等内容)仅供参考,__拓端数据(__tecdat__)__不因文章的全部或部分内容产生的或因本文章而引致的任何损失承担任何责任。


可下载资源

关于作者

Kaizong Ye拓端研究室(TRL)的研究员。在此对他对本文所作的贡献表示诚挚感谢,他在上海财经大学完成了统计学专业的硕士学位,专注人工智能领域。擅长Python.Matlab仿真、视觉处理、神经网络、数据分析。

本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。

​非常感谢您阅读本文,如需帮助请联系我们!

 
QQ在线咨询
售前咨询热线
15121130882
售后咨询热线
0571-63341498

关注有关新文章的微信公众号


永远不要错过任何见解。当新文章发表时,我们会通过微信公众号向您推送。

技术干货

最新洞察

This will close in 0 seconds