利用线性回归分析中国电影票房
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
利用线性回归分析中国电影票房
中国电影产业
中国电影产业正处于高歌猛进的快车道。据中国电影产业网数据显示,2016年中国电影票房达457亿元,略超2015年的440亿元票房。I P电影的出现为中国电影市场增加了不少票房收益,如《同桌的你》《栀子花开》《十二公民》等电影未映先火。作为观影者,如果没听说过IP电影就out了。
数据来源和说明
本案例使用的是中国电影发行放映协会统计的某年度年票房过千万元的电影数据,共275个样本,数据包括电影票房、影片类型、发行方等13 个变量。数据说明如表1所示。
表1数据说明
票房收入
本案例的因变量Y是票房收入,其直方图呈现右偏分布(见图1)。票房最高为127168.1万元,是影片《人再囧途之泰囧》,导演:徐峥;票房最低为1010.16万元,是影片《举起手来(之二)追击阿多丸》,导演:冯小宁。不过,电影票房过2亿元的影片数量较少。由于低票房的影片数量较多,从而降低了整体影片票房的平均水平。
图1 票房收入直方图
描述性分析
首先,对月份进行分组描述,重新定义影片上映档期,即贺岁档、暑期档、普通档、黄金档1期(含“五一”)、黄金档2期(含“十一”)。从图2中可以清晰看到贺岁档的平均票房比其他档期的平均票房要高,而黄金档期的平均票房却很不理想。
图2
再来考察IP电影。简单来说,IP就是知识产权,可以是一首歌、一部网络小说、一部广播剧、一台话剧,或者某个经典的人物形象,哪怕只是一个字、一个短语,把它们改编成电影,就可以称作I P电影,比如《栀子花开》《狼图腾》《十二公民》等都是I P电影。通过描述性分析(见图3),可以看到IP因素将电影的平均票房推向了新的高度,即改编的真人真事、翻拍以及有(是)续集的电影票房都高于虚构的、非翻拍的电影。比如样本中的《人再冏途之泰囧》《将爱情进行到底》《叶问2:宗师传奇》《武林外传》等均是IP电影。
图3
最后看导演因素。导演是一部电影中最核心的元素,实力派导演丰富的拍摄经验会为影片增色不少,有一些观众会因为导演的声望而去关注其更多的作品。另外,从演员转型的导演比导演会演,比演员会拍,是不是会演电影的导演才是好导演呢?从箱线图(见图4)的描述结果可以看到,获过奖的导演的电影平均票房更高,比如样本中的冯小刚、张艺谋、周星驰、陈凯歌等均是获过奖的导演;从演员转型的导演所拍电影的平均票房比非转型的导演所拍电影的平均票房要高,比如样本中的赵薇、徐峥、冯德伦等均是从演员转型的导演。
图4
回归分析
本案例建立了电影票房对影片类型、上映年份、上映档期、宣发公司类型、影片时长、是否原创、是否真人真事、是否续集、导演是否获奖、导演是否从演员转型10个变量的对数线性回归模型,调整后的R2为45.95%,回归结果如图5、图6和图7所示。
图5 图6 图7
总结与讨论对数线性模型的系数估计解读为“增长率”,在控制其他因素不变的情况下,对于影片类型这一变量,悬疑影片、魔幻影片的票房比爱情影片票房平均依次高101%、87%,爱情类影片与动画类影片票房没有显著差异;影片时长与票房显著相关。相比其他档期的电影,贺岁档影片对票房的影响最大;对宣发公司这一变量,小私营企业与联合公司宣发的影片票房有显著差异。