人工智能与机器学习项目报告
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.
2.1原始数据
表11994-2016年冠军票房
序列
年份
电影名称
票房(亿元)
1
1994
亡命天涯
0.258
2
1995
真实的谎言
1.03
3
1996
简单任务
0.8
4
1997
侏罗纪公园4
0.721
5
1998
泰坦尼克号
ห้องสมุดไป่ตู้3.6
6
1999
不见不散
0.43
7
2000
生命抉择
12
8
2001
珍珠港
1.04
9
2002
英雄
2.48
10
2003
手机
0.53
11
2004
功夫
1.73
12
2005
无极
1.81
13
2006
满城尽带黄金甲
2.91
14
2007
变形金刚1
2.82
15
2008
非诚勿扰
3.25
16
2009
2012
4.66
17
2010
阿凡达
13.28
18
2011
变形剑
10.81
19
2012
人再囧途之泰囧
12.67
20
2013
通过MATLAB对数据进行处理,通过MATLAB内部线性回归算法得到一次、二次、三次、四次、五次回归模型如下:
一次线性回归模型:
二次线性回归模型: s
三次线性回归模型:
四次线性回归模型:
五次线性回归方程:
3.
当模型的未知参数估计出来后,就初步建立了一个回归模型。建立回归模型的目的是应用它来研究问题,但如果直接用这个模型去做预测、控制和分析,是不够慎重的。因为这个模型是否真正揭示了自变量与因变量之间的关系,必须通过对模型的评估才能决定。通过验证集评估和验证最好的模型,同时也必须了解到拟合的三种误差:过拟合、训练误差、泛化误差。如果模型过于简单,就有较大的训练误差。如果模型过于复杂就有较大的泛化误差。
如果一个回归模型没有通过某种统计检验,或者通过了统计检验而没有合理的经济意义,就需要对回归模型进行修改
4
西游降魔篇
12.46
21
2014
变形金刚4:绝迹重生
19.79
22
2015
速度与激情7
24.26
23
2016
美人鱼
33.9
24
2017
战狼2
56.39
25
2018
红海行动
36.22
26
2019
哪吒之魔童降世
49.34
图1. 历年冠军票房折线图
2.2
线型回归的目标是找到一个函数,能够将输入属性映射到输出属性或目标属性。
需求带动生产,影视作品的数量都以每年惊人的速度增长,每年优秀的影视作品经过广大人们的选择都会产生,这其中的一个标准就是票房的多少,这些影视作品或具有现实的教育意义,或具有生动的艺术效果而打动观众。每年的票房冠军总是一定程度上反应社会上的需求或潮流。票房冠军更能反映国家的发展和经济状况。
本次将根据26年的冠军票房来预测之后四年的冠军票房。
《人工智能与机器学习》课程项目报告
国内年度冠军电影票房预测
姓名:111111111
课程名称:人工智能与机器学习
指导教师:111111111111
日期:202022222222
1.
电影业中,票房已经成为衡量一部电影是否成功的重要指标之一,可以用观众人数或门票收入来计算,一般直接用来衡量一部电影的热播程度。随着现代化建设的发展在,中国城乡居民收入水平显著提高,精神文化生活伴随着物质生活水平的提高也日益成为城乡广大消费者追求的目标,从数据可以看出以往只有少数人可以到的影视作品,现在已经成为大宗消费品,遍布各个城市,成为人们精神生活的寄托以及茶余饭后的谈资,电影作品已经成为一种潮流的象征,日益丰富着我们日常的生活。
2.1原始数据
表11994-2016年冠军票房
序列
年份
电影名称
票房(亿元)
1
1994
亡命天涯
0.258
2
1995
真实的谎言
1.03
3
1996
简单任务
0.8
4
1997
侏罗纪公园4
0.721
5
1998
泰坦尼克号
ห้องสมุดไป่ตู้3.6
6
1999
不见不散
0.43
7
2000
生命抉择
12
8
2001
珍珠港
1.04
9
2002
英雄
2.48
10
2003
手机
0.53
11
2004
功夫
1.73
12
2005
无极
1.81
13
2006
满城尽带黄金甲
2.91
14
2007
变形金刚1
2.82
15
2008
非诚勿扰
3.25
16
2009
2012
4.66
17
2010
阿凡达
13.28
18
2011
变形剑
10.81
19
2012
人再囧途之泰囧
12.67
20
2013
通过MATLAB对数据进行处理,通过MATLAB内部线性回归算法得到一次、二次、三次、四次、五次回归模型如下:
一次线性回归模型:
二次线性回归模型: s
三次线性回归模型:
四次线性回归模型:
五次线性回归方程:
3.
当模型的未知参数估计出来后,就初步建立了一个回归模型。建立回归模型的目的是应用它来研究问题,但如果直接用这个模型去做预测、控制和分析,是不够慎重的。因为这个模型是否真正揭示了自变量与因变量之间的关系,必须通过对模型的评估才能决定。通过验证集评估和验证最好的模型,同时也必须了解到拟合的三种误差:过拟合、训练误差、泛化误差。如果模型过于简单,就有较大的训练误差。如果模型过于复杂就有较大的泛化误差。
如果一个回归模型没有通过某种统计检验,或者通过了统计检验而没有合理的经济意义,就需要对回归模型进行修改
4
西游降魔篇
12.46
21
2014
变形金刚4:绝迹重生
19.79
22
2015
速度与激情7
24.26
23
2016
美人鱼
33.9
24
2017
战狼2
56.39
25
2018
红海行动
36.22
26
2019
哪吒之魔童降世
49.34
图1. 历年冠军票房折线图
2.2
线型回归的目标是找到一个函数,能够将输入属性映射到输出属性或目标属性。
需求带动生产,影视作品的数量都以每年惊人的速度增长,每年优秀的影视作品经过广大人们的选择都会产生,这其中的一个标准就是票房的多少,这些影视作品或具有现实的教育意义,或具有生动的艺术效果而打动观众。每年的票房冠军总是一定程度上反应社会上的需求或潮流。票房冠军更能反映国家的发展和经济状况。
本次将根据26年的冠军票房来预测之后四年的冠军票房。
《人工智能与机器学习》课程项目报告
国内年度冠军电影票房预测
姓名:111111111
课程名称:人工智能与机器学习
指导教师:111111111111
日期:202022222222
1.
电影业中,票房已经成为衡量一部电影是否成功的重要指标之一,可以用观众人数或门票收入来计算,一般直接用来衡量一部电影的热播程度。随着现代化建设的发展在,中国城乡居民收入水平显著提高,精神文化生活伴随着物质生活水平的提高也日益成为城乡广大消费者追求的目标,从数据可以看出以往只有少数人可以到的影视作品,现在已经成为大宗消费品,遍布各个城市,成为人们精神生活的寄托以及茶余饭后的谈资,电影作品已经成为一种潮流的象征,日益丰富着我们日常的生活。