知乐空间

国产好看电影介绍几部(豆瓣排名前50电影)

豆瓣电影50强(部分国产好看电影介绍)

1个报价

中国电影产业发展迅速,网络大数据对电影的影响也越来越大。豆瓣平台是更方便快捷的传播方式,更贴近现代生活节奏,逐渐成为影评文化的主流。豆瓣电影提供最新的电影介绍和评论,包括已上映电影的信息查询和购票服务。可以录制想看的电影电视剧,看着看着,顺便打分写影评,大大方便了人们的生活。电影豆瓣是这样介绍自己的:“国内最权威的影评和精彩的影评,百万粉丝的真情流露,为你的观影做决定。”确实如此。然而,前几天,朋友圈又沸腾了。中国电影报12月27日发表了一篇题为《豆瓣电影评分面临信用危机》的文章,随后人民日报客户端转发了该文,并将标题改为《豆瓣和猫眼电影评分面临信用危机,差评伤害电影行业》。在这个互联网将渗透到整个电影产业链的时代,网络数据对电影的影响越来越大。2010年,国产电影票房首次突破100亿,中国电影进入百亿时代。2015年,中国电影票房突破440亿元,电影市场的大踏步前进吸引了世界的目光。国产电影中,不乏评价高、票房高的影片,但面对巨大的市场,中国电影的发展方向仍不明朗,部分影片好评率与票房不成正比。在这种情况下,分析国产电影的数据,指出其发展方向就显得尤为重要。

2个数据来源

数据来自豆瓣电影TOP250。我们通过python爬取了网站数据,共爬取了250条豆瓣电影的电影信息,包括评分、评分数、导演、编剧、主演、流派、制片人国家/地区、语言、上映日期、片长、剧情简介、热门影评、豆瓣会员常用标签等。同时抓取了前三部电影的热评进行文本分析。

3豆瓣电影数据

本文主要分析豆瓣电影Top 250(https://movie . douban . com/Top 250)的相关电影,通过Python获取。技术分析过程分为以下三个步骤:网络数据采集、数据读取和数据清洗、数据可视化分析。经过网站爬虫,我们整理了七个字段,分别是评分、评分数、导演、编剧、主演、流派、制片人国家/地区、语言、上映日期、片长、剧情简介、热门影评、豆瓣会员常用标签。

3.1发布年份分析

图1豆瓣电影TOP250各十年电影数量

1990年后,大多数电影都获得了好评。1990年之前和1990年之后的两个部分,好评电影数量波动不大。艺术会随着时代而改变,如今的观影者会更容易接受现代电影艺术,豆瓣排名前250的电影中,时间跨度从1931年到2017年,大部分电影集中在1990年之后。入围人数最多的年份是1994年、2004年和2010年,占14.4%。1994年被称为电影年,这一年产生了很多优秀的电影,比如豆瓣全年最高评价的电影《肖申克的救赎》,当年奥斯卡最佳影片《阿甘正传》,还有这部《黑仔不太冷》,也都是在1994年上映的。不仅是外国电影,1994年也是国产电影的高峰期。中国有五部电影入围当时豆瓣电影Top250。《红玫瑰与白玫瑰》、《饮食男女》和《重庆森林》也于1994年发行。进入21世纪后,出现了大量广受好评的电影。最受欢迎的电影出现在2000年至2009年之间。

3.2生产国/地区分布分析

图2豆瓣电影前20名国民电影数量

好评如潮的电影制作国以美国为首,占比近50%。从图中可以看出,美国大片榜上有名,其次是日本、英国和中国。中外电影的上榜率还是有差距的。美国电影产业相对成熟,引领着这个时代电影艺术的潮流。

图3豆瓣电影前20名国民电影数量

国内的片长普遍比国外短。国外片长集中在100-150分,平均125分,国产片长集中在100-120分,平均110分。国外分数普遍比国内高,但集中程度差不多。

3.3导演/主演分析

图4豆瓣电影前10名导演电影数量

在广受好评的电影中,许多导演的不止一部电影上榜,上榜电影数量最多的两位导演是克里斯托弗·诺兰和宫崎骏其人。之后有很多中国导演。导演对一部电影有很大的影响。可以说,一个好的导演可以决定一部电影的成败。影片的主题、创作风格和视听语言,以及导演的地位和价值,也可以从影片中相应演员的表演和后期制作中看出。

图5豆瓣电影排名前10的主演电影数量

演员是电影创作过程中的另一个重要角色。导演认可的演员在电影中扮演角色。张国荣、梁朝伟、周星驰等港演员主演的多部电影榜上有名。其他的基本都是国外的影星,说明国内的影星还有待提高。也说明演员在电影中的表现也是决定电影受欢迎程度的重要因素。明星引发的“粉丝效应”不容忽视。当电影获得高票房或高分时,演员扮演着重要的角色。

3.4影片类型分布分析

图6豆瓣电影前20名国民电影数量图7标签分布

在广受好评的电影中,剧情类电影一骑绝尘,贴有“剧情”标签的电影多达186部。此后,爱情、喜剧、冒险等多种体裁的电影层出不穷。电影的类型决定了电影的基调和主题,是决定电影内容的重要因素之一。随着电影产业的不断发展,电影的类型也越来越多样化。2010年后,中国电影市场主要由三种类型组成:爱情片、喜剧片和动作片。但是警匪、谍战、歌舞、传记等电影的市场反响也很好。电影市场形成了以武侠、动作、爱情、喜剧、剧情为主要类型,以警匪、战争、历史为媒介梯度,以魔幻、传记、歌舞为新品种的稳定格局。在众多高分电影中,喜剧电影占19%,犯罪电影和悬疑电影分别占17%和15%。和喜剧电影一起,是占比最高的前三大类型电影。观众对喜剧片、犯罪片、悬疑片的关注度要比其他类型的电影高一点。观众爱看剧情、喜剧、言情,而这些只是高分,说明在未来国产电影的发展中,在新的电影产业格局的影响下,电影的类型会越来越丰富,传统的喜剧、言情等类型的电影会与悬疑、犯罪等新类型联手搬上银幕。一部电影的类型会很难用一两种类型来概括,多种类型的电影会越来越多,结构和手法也会更加成熟。单一电影类型的多样化将成为电影类型发展的必然趋势。

3.5评级/评级数量分析

图8分数分布

看图8,我们可以看到,我们收集的电影数据得分主要在8.0到10.0之间,呈现出向两极逐级下降的趋势。这里我们可以根据分数把区间分为8.25-8.55,8.55-8.85,8.85-9.15,9.15-9.45,9.45-9.45。

图9评定等级

细化评分数据每年观察,可以发现30年的影片数量与年度影片平均分呈负相关,年度影片平均分整体呈下降趋势。2016年电影平均分最低,数量最多。进一步,各年不同评分等级的电影数据占比可以发现,近年来,评分为[2.0,6.0]的电影数据占比显著上升,评分为[6.0,7.0]的保持数据占比不变,而评分为[7.0,10.0]的数据占比下降。可能的原因如下:1。幸存者偏差,1990-2000年的劣质作品很少有人关注,资料保存困难。豆瓣数据库只收集了相对优质的作品。2.近年来低质量的影视作品较多,拉低了平均分。

图10豆瓣电影排名及评分数

得分的人越多,排名越高。图片颜色越深,分数越低。我们发现分数低的人少,分数低。得分最高的人数越多,得分越高。豆瓣电影可以说是国内最大的电影分享和评论社区,聚集了几千万热爱电影的人。2012年,每月覆盖用户超过1亿。在这个平台上,观众可以对电影进行评级,并做出相关评论。如今豆瓣的评分已经成为衡量一部电影是否“可看”的重要因素。无论是在网上买票还是在网络平台搜索电影,评分结果都会显示在显眼的位置,很多观众会根据评分结果选择是点击了解还是观看电影。点击率和评分结果成正比。

4豆瓣文本数据

本文将豆瓣文本数据分为两类,一类是剧情梗概、影片类型(标签),一类是热门影评。每部电影都会有这样的文本数据。当我们拿到电影简介的网址,比如《肖申克的救赎》(https://movie . douban . com/subject/1292052/),剧情简介如下;

图11

对应源代码:一桩命案把银行家安迪(TimRobbins饰)冤送进了监狱。谋杀他妻子和她的情人的指控将使他终身监禁。他在肖申克监狱的第一次亮相,让监狱大哥Red (MorganFreeman)对他刮目相看。瑞德帮他拿到了一把石锤和一张女明星的海报,两人成为了患难之交。很快,安迪在监狱里大显身手,充当监狱图书管理员,利用自己的金融知识帮助监狱官员避税,引起了监狱长的注意,被邀请去帮他洗钱。一次偶然的机会,他得知一个新入狱的小偷可以作证帮助他逃脱谋杀。抱着一线希望的安迪找到了监狱长,希望他能帮自己翻案。阴险虚伪的典狱长假装答应安迪,却派人在背后追杀小偷,让他合法出狱的唯一希望破灭。沮丧的安迪并没有绝望。在一个电闪雷鸣的暴风雨之夜,一个隐藏了几十年的越狱计划让他救赎了自己,重获自由!老朋友瑞德,在他的鼓励和帮助下,也勇敢地奔向自由。


这部电影在1995年获得了10项奥斯卡提名,还有金球奖和土星奖。

热门影评在标签链接-报告上,如下图:

图12

当我们使用for recycling requests+bs4来抓取上述信息时。

图13

4.1流行影评的探索与分析

表1

等级

电影

主管

类型

国家

标签

一个

肖申克的救赎

弗兰克·达拉邦特

阴谋,犯罪

美利坚合众国

经典,励志,信仰,自由,人性,生活,美国,希望

2

霸王别姬

陈凯歌

剧情,爱情,同性

中国

经典,人文,文艺,爱情,生活,文革,情节,同志

《阿甘正传》

罗伯特·泽米基斯

情节,爱情

美利坚合众国

励志,经典,生活,成长,美国,信仰,剧情,人性

1)《肖申克的救赎》

图14

这部电影主要讲述了银行家安迪被错误地杀害了他的妻子和她的情人,并被监禁的故事。一个小偷因盗窃入狱,知道安迪妻子及其情人死亡的真相,典狱长不愿意帮他翻案。得知真相后,安迪决定通过自己的救赎获得自由,最终成功越狱。整部电影的主题是“希望”,整部电影通过监狱这种强制剥夺自由、高度强调纪律的特殊背景,表现了个人对“时间的流逝和环境的改造”的恐惧。影片结尾有基督山伯爵的复仇宣泄。《肖申克的救赎》是一部难得的优秀励志电影。我个人之所以保留它作为电影,是因为它的主题意义深远。它给了人一种无形的力量,它让我知道了人的一生中应该拥有的最珍贵的东西。以便珍惜你还拥有它的机会。

2)《霸王别姬》

图15

主演:张国荣(霸王,被称为'兄弟')、程蝶衣(于吉),导演陈凯歌。这是一部震撼和感动观众的经典中国历史电影。它讲述了霸王项羽和于吉的情感故事。

3)阿甘正传

图16

阿甘和珍妮是青梅竹马,阿甘喜欢珍妮。两个人成年后走上了不同的道路。阿甘天生智商低,一心一意做事情老实坦白。毕业后,她去服兵役。珍妮叛逆,喜欢冒险,四处游荡。在经历了人生的种种磨难之后,阿甘一直保持着自己的本心,一直深爱着珍妮,傻人有傻福,事业一直在走上坡路。珍妮迷失了人生的方向,想过自杀。阿甘从来没有放弃过珍妮。珍妮终于想通了,放弃了放荡的生活,回到了阿甘身边。

4.2常见标签分析

图17

下表显示了PMI最高的前15组标签:

表2

一个

默片

卓别林

6.965784285

2

清新

敏感

6.965784285

情绪

旅行

6.965784285

英雄

诺兰

5.965784285

记忆

中国制造

5.965784285

人种

非洲

5.965784285

自然

清新/美食

5.965784285

大块

新西兰

5.795859283

张国荣

梁朝伟

5.64385619

10

生活

清新/美食

5.64385619

11

信仰;相信

钢琴

5.380821784

12

“文化大革命”(1966年至1976年)

姜文

5.380821784

13

灾难

大块

5.380821784

14

温暖

环境保护

5.380821784

15

理由

法律

5.380821784

本节使用KMeans进行聚类,k- Medoids聚类不以类对象的平均值为中心点。中心对象是数据集中的真实对象,而k- means聚类中的类中心对象是通过计算其类中每个对象的均值得到的虚拟对象。它对中小数据集有效,但不适合对大数据集进行聚类。构建词袋模型后,生成文档词矩阵cv_fit,并对其进行聚类。然后绘制聚类结果的散点图,如下图所示。

图18

4.3分类模型和预测电影类别

K-最近邻分类算法(kNN)是一种“以邻定类”的分类算法,属于一种基于案例匹配的算法。本节将使用分类或监督机器学习方法(Knn算法)对文档进行分类,预测一朵小红花的类别,并预测其属于剧情,准确率为0.7572,召回率为100%。

流程:

1.标准化训练数据(街霸分词)

2.使用CountVectorizer类建立词袋模型,从数据中提取特征或属性(豆瓣Top250剧情梗概)。对于每个数据点,我们将具有特征集(大纲的文档词矩阵DTM)和相应的类型(电影是否属于‘情节’的逻辑值(1,0))。

3.该算法从训练数据中学习每个分类的不同模式。经过学习,我们得到一个训练有素的模型KNN。

学习步骤:计算距离:给定测试对象,计算它与训练集中每个对象的距离。寻找邻居:圈出最近的K个训练对象作为测试对象的邻居。决定类别:根据这K个邻居所属的主要类别对测试对象进行分类。简单投票法:少数服从多数,邻里那一类的点最多分到那一类。

3.未来,测试数据样本的特征(一朵小红花的梗概)将被送入模型KNN,模型可以预测它是否属于‘情节’。

4.制作混淆矩阵,评估分类模型。过程:训练,从训练集中统计两种概率:各种类型标注的文档数和各种类型出现的词的频率。分类:计算类标记的先验概率和条件概率。

概念公式:

召回率=系统检索到的相关文件/系统所有相关文件的总数。

准确率=系统检索到的相关文件/系统检索到的所有文件总数。

F1=2PR/(P+R)

KNN算法预测的混淆矩阵图示如下:

图19

准确率=184/(184+59)=75.72%

召回率=184/(184+0)=100%

5结论

本文通过探究豆瓣电影Top250的各项指标,并对其榜单中的数据进行分析,得出以下结论。

艺术随着时代的变化而变化,大多数电影观众在这个时候更容易接受类似时代的电影。21世纪前十年的电影是最受推崇的时期。制片方可以选择翻拍10到20年前的电影,用口碑吸引观众。观众也可以选择这段时间的电影在休息时间观看。艺术将随着时代而变化,今天的电影观众将更容易接受现代电影艺术。导演是一部电影的关键因素之一,好的导演才能拍出电影。在选择导演的时候,制作方可以选择榜单上作品多的导演。观众可以选择克里斯托弗·诺兰和宫崎骏其人导演的电影。导演对一部电影有很大的影响。可以说,一个好的导演可以决定一部电影的成败。3.好的电影一般来自于好的电影氛围,制作国可以影响电影。在电影中,美国电影占了将近一半。制片方可能会借鉴美国电影的流行趋势,观众可能会选择美国电影来观看。影片的主题、创作风格和视听语言,以及导演的地位和价值,也可以从影片中相应演员的表演和后期制作中看出。4.电影类型是观众选择是否观看这部电影的重要因素之一。“剧情”“爱情”“喜剧”是观众的主流。电影制片人可以把它们作为口碑的保守选择,电影观众可以选择这些类型来观看。一部电影的类型会很难用一两种类型来概括,多种类型的电影会越来越多,结构和手法也会更加成熟。单一电影类型的多样化将成为电影类型发展的必然趋势。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请发送邮件至 ZLME@xxxxxxxx@hotmail.com 举报,一经查实,立刻删除。

留言与评论(共有 0 条评论)
验证码: