利用BRP模型预测电影票房
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
利用BRP模型预测电影票房
摘要
本文通过利用神经网络、回归模型对电影票房进行了研究,确定了决定电影票房的六大因素。并讲述、论证了预测电影票房是决定电影投资的至关重要的环节。通过对电影票房预测技术的发展、国内电影票房机制的探讨,深度剖析了电影票房预测这个研究课题。
一、 电影票房预测发展简介
(一) 西方电影票房的研究
美国电影的票房研究起始于上个世纪80年代,由李特曼(B. R. Litman)在1989年以1981到1986年在美国播出的697部电影作为研究样本,通过多元回归分析,初步建立了电影票房的预测模型。李特曼用影片的租金收入作为考量电影票房的因变量,影响电影经济成功的自变量被划分为三大部分:创意、发行/上映时间以及电影营销。创意部分的变量有影片类型、美国电影协会(MPAA)的电影分级、熟悉的故事、出品国、明星、导演、生产成本、影评等,其中影片类型的确定主要参考美国杂志《电视指南》(TV Guide)。发行/上映部分的自变量有发行商、发行日期、发行模式、市场力量等,而电影营销部分的自变量有发行公司的营销能力和是否获奖等。1李特曼的票房研究模型为后来电影票房预测以及电影经济成功的预测性研究提供了基本思路和方法。
美国的R. Sharda以及D. Delen在2005年的研究中运用了神经网络技术,创建了新的电影票房预测模型。模型最终选取了美国MPAA评级、同行竞争、明星价值、影片类型、特技效果、是否为续集以及银幕数量七个指标作为模型输入变量,利用多层感知神经网络模型,准确预测了北美影片票房。2同时,Sharda和Delen的研究也开创了电影票房预测模型研究的新方向。
(二) 我国电影票房的研究
我国对电影票房预测的研究相对西方而言起步较晚,曾有由CHR首席研究架构师林俊毅博士带领研究,在2010年推出了以回归模型为基础的电影票房估值模型。3而此次由艾亿新融资本管理有限公司总工程师张文云带领团队,利用前向反馈神经网络技术开发的中国第一套电影票房预测系统(BRP)无疑开创了国内电影票房量化研究的先河,将电影票房的预测带上了理论、技术的新高度。
二、 国内电影票房机制
一个简单的乘法关系表示了票房的计算:
其中在我国,电影票价是由影院房租水平、地方政府指导价格、以及制片方议价能力三方面所共同决定的。总体来看,电影票价在一段时间内是稳定的,因此电影票房主要取决于观影人次的变化。
而观影人次则受电影的若干要素所影响,随着人群的口碑效应而扩散。同时,先后上映的电影之间可能存
在一定的票房冲突,造成票房分布的多样性。一部电影从早期筹拍到在院线公映完毕,可分为制作、发行、上映三个阶段。其中,制作阶段从剧本创意开始,经历融资、组建剧组和拍摄四个阶段;放映阶段从电影首映开始至撤出院线结束;发行阶段则是在影片制作完成之后、上映之前的阶段,通常大量的媒体宣传、商业活动会在这一时期进行。而一部电影最早从剧本阶段,就会由于自身的宣传或媒体的讨论而吸引受众。通常,电影的不同要素,例如:导演、主演、题材等会吸引不同受众。随着影片从制作过程进入发行阶段,持续的媒体宣传都旨在将受众群最大化。而当影片结束发行阶段,开始首映之时,所有受众则构成了初始观影人次N0,此时电影也正式进入了放映阶段。研究表明,放映阶段的票房累计主要取决于人群的口碑效应高过发行方的宣传效应。最初观众在观看影片之后通过扩散效应传播至更大的观众群,逐级扩散至放映结束时的累计观影人次N。因此,在首映之后,根据最初观众的反馈在之后的票房可能出现大幅上升、持平、稍有下降等几种现象,此外,在同一时期上映的其他影片也会对票房带来负面影响。
三、 为什么要预测电影票房?
在西方,一部电影可产生的收入来源主要有以下几大块:票房收入;其他收入(如DVD、网络版权、电影频道等);以及基于电影的外围衍生品的销售(如玩具、文化用品、服装等)。即使如此,电影的票房收入仍然占据了影片总收入的一半以上。并且,影片的上映票房收入也直接、或间接的决定了影片其他收入的水平。
在我国,由于电影下游产业链的不完整,票房收入几乎是电影综合收入的全部来源,占到95.7%。因此可见,电影的票房收入决定了影片成败与否。
电影投资一直都被视作高风险投资,且投资金额动辄几千万、上亿。因此,如果能在影片制作初期筹集资金阶段对票房收入有准确的预估,那么就可在制作期间合理的投入、利用成本,从而在一定程度上规避了风险,保障了电影的收益率。作为理性的电影投资人,应当根据电影的预测收入考虑到贴现率的因素而确定电影的成本。尤其是当电影制作过程中,资金出现缺口,需要融资时,根据WACC确定贴现率,重新计算电影资产价格并进行融资决策。
图1 电影投资过程
有了电影票房预测系统,可以帮助投资方在投前准确进行投资定价;而在投中即影片制作中进行现场督促保障制作进度,同时尽职调查核算投资成本;在投后运用票房预测系统进行投后宣传测算。整个过程的执行降低了电影投资风险,保
障了收益。由此可见,对电影票房的准确预测是电影投资定价的基础,也是电影投资能否收回成本、得到收益的基石。
四、 电影票房的预测方法
如前所述,影片制作阶段的不同要素影响、映射到了不同的观众群上,而这些不同映射群的合集则构成了影片的初始观影人次(N0)。而观影人数通过逐级扩散构成了最终观影人次(N)。根据历史累计的票房纪录数据,应如何建立电影票房预测模型?
传统的建模步骤如下图所示:
图2 建模过程示意图
经过最初的数据收集、筛选,我们获得了国内近三年拍摄、上映的300余部电影的原始数据。然而,如何利用这些数据建立可靠的票房预测模型?
有关于电影票房预测的研究指出4:电影的票房预测是一个典型的非线性问题,而人工神经网络是一种模拟人类思维的方法,可以通过训练、学习产生一个非线性映射,自适应的对数据产生聚类,可实现有导师和无导师的学习。同时,神经网络方法有较好的抑制噪声干扰的能力和泛化能力,在有噪声污染的环境中使用时,具有较好的噪声抑制能力和较强的鲁棒性。因此,本文所述BRP系统使用了神经网络算法来预测电影票房收入。同时,为了辅助票房预测,更准确的估算出电影价值,BRP系统也使用了回归算法,二者同时提供给使用者准确的票房预测。
五、 BRP票房预测模型
BRP是"艾亿新融"在系统考察导演、演员、制片、发行及市场营销、电影生命周期、电影类型、发行地区等影响电影票房的诸多因素基础上,基于资产定价模型,综合采用金融工程和回归统计分析方法研发出的预测系统。它能分析预测不同种类电影的票房价值,是电影产品定价的重要参考工具,对电影产业投融资具有较强的指导作用的创新型系统。
BRP系统可预测电影的前五周累计票房、单周票房、以及票房区间。其中,周累计票房、以及票房区间预测使用的是前向反馈神经网络(Back Propagation Neuron Net)算法,单周票房预测使用的是回归模型。在投资初期,周累计票房可用来预测票房、确定收益;而单周票房预测则帮助验证预测收益;票房区间预测则可锁定风险。在应用时,三个数据相辅相成,帮助投资人做出理性的判断。
(一) 神经网络算法基本原理
如图3所示,神经网络算法分输入层、隐含层、输出层,建模时将数据库中的候选因素(30~40个)通过输入层导入系统中。系统在隐含层通过自我学习找出因素间的相关性,剔除冗余信息,最终在输出层给出选定因素。此过程为正向推导过程,确定模型相关因素。
图3 神经网络建模正向推导
过程
在正向推导确定了预测电影票房的模型相关因素后,下一步目标则是确定各相关因素的权重。在此次建模中,我们使用了逆向检验法来修正权重。过程如图4所示。经过逆向检验修正的模型就是我们最终得到的BRP票房预测模型。
图4 逆向检验修正权重
预测的神经网络结构共有4层:输入层、2个隐藏层、输出层。根据输出层的不同建立了两种预测模型作为互补(数值预测法和范围预测法),数值预测模型收敛较快,准确度较高,范围预测模型预测的结果较稳定。预测的神经网络每次预测都取5次成功收敛的神经网络预测的平均值,取最接近这个平均值的预测数据作为预测结果。
(二) BRP系统的预测对象及输出内容
1. 周累计票房:
周累计票房使用的是BP神经网络的预测模型,分数值预测法与范围预测法两类。数值预测法输出层只有1个神经元,即只输出一个具体的票房数值,但是带有一定的波动性,多次预测同一部电影的票房数值时会出现小范围的波动,因此才引入了范围预测法作为对比。范围预测法的输出层带有分类器,即输出票房归属于哪个区间,并且其波动性比数值预测法小,但由于数据库中电影数据不够充分,因此预测的范围区间比较大,随着数据库中收录的历史电影数据增多,预测的范围区间越精确。这两种方法是互补的,因此才在同一页面上分别展示了这2种方法的预测结果,方便对比。
2. 单周票房:
单周票房使用的是多元线性回归的方法,将电影的各个特征值作为变量,即拟合票房关于电影特征值的线性关系y=f(x),其中x表示电影特征值,y表示每周票房。
3. 系统输出:
为了增加系统输出的可读性,系统使用可视化的柱状图、折线图等展示票房预测结果。当同时预测的电影数在两部或以上时,系统还可将数据以柱状图形式输出在同一张图上用以直观对比。同时,所有报表都提供了打印功能。
(三) BRP系统数据基础(即系统输入变量)
总票房预测和单周票房预测模型建立是以近3年近186部历史电影统计作为数据基础,预测的准确度很大程度上依赖于数据库中电影样本数据统计的准确性和电影的数量。而现在BRP数据库中的电影已达到600多部。从实际电影市场的影响因素出发,暂定预测模型的输入变量为电影导演、电影演员(取前2个演员)、电影类型(取前2个电影类型)、发行地区。候选输入变量为:制片人、发行公司、制片公司、编剧、档期(正在统计中),输出变量为周电影票房或者电影票房区间。
预测电影时所输入的电影演员、导演需要根据他们的历史电影票
房成绩确定他们的权重,因此对于数据库中已经存在的导演、演员,在预测他们参与拍摄的电影票房时准确度较高。
1. 导演、演员影响力量化:
通过统计现有电影数据库中某位导演或演员参与拍摄的电影历史票房成绩作为该演员/导演的影响力量化凭据。
2. 电影发行地区:
统计现有电影样本中分属于中国、欧美、港台、日韩和其他地区这五个大类的电影票房成绩作为电影发行地区的影响力量化凭据。
3. 影片类型:
统计现有电影样本中分属于爱情、卡通、灾难、悬疑(冒险/犯罪)、恐怖(惊悚)、战争、纪录(传记/历史)、家庭、喜剧、戏剧(音乐、戏曲)、科幻(魔幻/奇幻)、喜剧、动作(武侠/古装)、故事(剧情)这几个大类的历史票房成绩作为这些类型的影响力量化凭据。
(四) BRP票房预测系统模型验证
在BRP系统研发完成后,我们选取了几部在中国内陆院线上映的影片做了票房预测,并将结果与真实票房进行对比。以2010年1月上映的引进大片《阿凡达》为例,我们用BRP系统对影片前五周的单周票房进行了预测。而其结果与真实结果非常接近。(如图5所示)
图5 影片《阿凡达》单周票房预测结果
当我们把影片前五周的票房总和相加,预测值为9.3326亿元,而真实值为9.9100亿元,二者相差5774万元,即误差为5.8%。由此可见,BRP系统的预测相当精准。
在利用神经网络算法预测周累计票房时,由于模型创建时考虑到了多部电影同时上映时的票房相互间影响,因此,当多部电影同时预测时,准确性更高。图6以国内同时上映的5部电影为例,预测了他们的第一周累计票房。
图6 多部电影周累计票房预测
由此可见,在同时预测多部电影周累计票房时,BRP系统的准确性相当高。
神经网络算法的结果具有波动性,实际风险控制应用中可通过多次计算得到票房预测分部(近高斯分布),以此确定电影票房的置信区间,来达到风险控制的目的。
下图以《金陵十三钗》连续20次的预测结果为例:
图7 《金陵十三钗》多次票房预测结果
由图7可见,20次的计算已经显示出了近高斯的票房分布,而在实际应用中计算的次数可达到1000甚至10000次,以此来得到可信的票房分布。
六、 结论
本文以近3年近189部历史电影统计作为数据基础,使用了前向反馈神经网络(Back Propagation Neuron Net)作为理论基础,建立了数值预测法和范围预测法两种预测模型,根据用户输入的电影特征,预测该电影在上映期间(前五周)的每周累计票房。同时,使用了
多元线性回归作为理论依据,拟合票房关于电影特征值的线性函数,预测该电影在上映期间(前五周)每周的单周票房收入,输出电影每周的票房趋势供用户参考。根据此模型建立的BRP系统采用B/S结构,利用JSP+Tomcat+MySQL技术架构实现MVC架构,系统共分为四个功能模块。
在西方,尤其是北美电影业,对票房的量化预测起始于上个世纪八十年代,发展至今已建立了票房预测模型,实现对票房的成功预测,这是西方电影票房研究的基本特点。相对北美票房预测的发展而言,国内的电影票房预测还处在初级阶段。目前,国内一些知名的院线公司在票房预测上主要采取的是头脑风暴法,这种方法一般由公司内部负责发行的工作人员进行简单猜测,之后结合专家的经验汇总信息对票房进行估测,结果往往差强人意,甚至影响票房的产出。BRP系统作为国内领先的票房量化预测系统,无疑开创了国内电影票房预测的先河,在技术上具有优越、创新性,并且为国内未来票房预测模型的发展指明了方向,树立了行业标杆。
BRP系统考察了导演、主要演员、制片、发行及市场营销、生命周期、类型、发行地区等因素对票房的影响,最终选定了导演、影片类型等六个最显著因素建立票房预测模型。同时,统计研究发现了六个有趣的现象:
* 低成本的影片投资往往更安全;
* 无名小卒主演的影片要比明星主演的影片利润率更高;
* 影片类型的艺术特征跟利润之间不存在直接关联,但评论的多寡(好评或者劣评) ;
* 不含暴力、色情成分的家庭影片最容易赚钱;
* 大片的续集要比普通新片更容易赚钱。明星在为影片带来更高票房的同时,也往往拉低了利润率,因为对大部分收入进了明星的口袋。
1 Litman, B. R.(1989). Predicting Success of Theatrical Movies:The 80's Experience. Journal of Media Economics, 2, 35-50.
2 R. Sharda, D. Delen / Expert Systems with Applications 30 (2006) 243-254
3 《中国电影整合营销关键报告》
4 《基于粗糙基于神经网络的数据分类研究及应用》,罗建华,大连理工大学
??
??
??
??