2015重庆大学数理统计大作业综述
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
研究生课程考核试卷
(适用于课程论文、提交报告)
科目:数理统计教师:刘琼荪
姓名:xxx 学号:20150702xxx 专业:机械工程类别:学术
上课时间:2016 年 3 月至2016 年 4 月
考生成绩:
卷面成绩平时成绩课程综合成绩阅卷评语:
阅卷教师(签名)
我国上世纪70-90年代民航客运量回归分析
摘要:中国民航从上实际50年代发展至今已有60多年的历史,这期间中国民航经历了曲折的发展。随着改革开发以来,中国人民的生活水平日渐提高,出行坐乘飞机逐渐人们可选的交通方式。我国民航客运量逐年提高,为了研究其历史变化趋势及其成因,现以民航客运量作为因变量y,假设以国民收入x1、消费额x2、铁路客运量x3、民航航线里程x4、来华旅游入境人数x5为影响民航客运量的主要因素。利用SPSS和excel软件通过建立回归模型分析我国民航客运量主要受到其中哪些因素的影响,并就回归模型分析具体可能的成因。
关键词:民航客运量影响因素回归模型
一、问题提出及问题分析
2004年,民航行业完成运输总周转量230亿吨公里、旅客运输量1.2亿人、货邮运输量273万吨、通用航空作业7.7万小时。截止2004年底,我国定期航班航线达到1200条,其中国内航线(包括香港、澳门航线)975条,国际航线225条,境内民航定期航班通航机场133个(不含香港、澳门),形成了以北京、上海、广州机场为中心,以省会、旅游城市机场为枢纽,其它城市机场为支干,联结国内127个城市,联结38个国家80个城市的航空运输网络。民航机队规模不断扩大,截止至2004年底,中国民航拥有运输飞机754架,其中大中型飞机680架,均为世界上最先进的飞机。2004年中国民航运输总周转量达到230亿吨公里(不包括香港、澳门特别行政区以及台湾省),在国际民航组织188个缔约国中名列第3位。
从上述事实可以看出我国民航的发展所取得的成果显著。当前我国民航客运量相当巨大,而影响我国航运客运量的因素有很多,例如第三产业增加值(亿元),城市居民消费水平(绝对元),定期航班航线里程(万千里)等[1]。为了研究过去的情况,从中国统计年鉴[2]得到1994年统计摘要,分析类似因素对我国航空客运量的影响。
二、数据描述
如下为所得统计数据:
表1 1978-1993年统计数据
年份
y
民航客运
量(万人)
x1
国民收入
(亿元)
x2
消费额
(亿元)
x3
铁路客运量
(万人)
x4
民航航线里
程(万公里)
x5
来华旅游入境
人数(万人)
1978231 301018888149114.89180.92 1979298 335021958638916420.39 1980343 368825319220419.53570.25 1981401 394127999530021.82776.71 1982445 425830549992223.27792.43 1983391 4736335810604422.91947.7 1984554 5652390511035326.021285.22 1985744 7020487911211027.721783.3 1986997 7859555210857932.432281.95 19871310 9313638611242938.912690.23 19881442 11738803812264537.383169.48 19891283 13176900511380747.192450.14 19901660 1438496639571250.682746.2 19912178 16557109699508155.913335.65 19922886 20223129859969383.663311.5 19933383 248821594910545896.084152.7
三、模型建立:
(1)提出假设条件,明确概念,引进参数;
参考相关书籍[3],设随机变量民航客运量为Y (万人),解释变量1X ,2X ,
3X ,4X ,5X 分别为国民收入(亿元),消费额(亿元),铁路客运量(万人),
民航航线里程(万公里),来华旅游入境人数(万人),且回归函数
11225501155(|,,,)E Y X x X x X x x x βββ==⋅⋅⋅==++⋅⋅⋅+,称
201155,0,Y x x E D DY βββεεεσ=++⋅⋅⋅++===,为多元线性回归模型,
015,,,βββ⋅⋅⋅为回归系数,ε为随机误差。
125(,,,,),1,2,,5i i i i x x x y i ⋅⋅⋅=⋅⋅⋅为上述来自多元线性回归模型的样本值,满足:
201155125,0,,1,2,,5,
,,,i i i i i i y x x E D i βββεεεσεεε⎧=++⋅⋅⋅++===⋅⋅⋅⎨
⋅⋅⋅⎩相互独立
为了便于对模型进行参数估计、模型检验、变量选择等,有必要对模型作如下一些基本假定。
1. 解释变量1X ,2X ,3X ,4X ,5X 是可控制的、非随机变量,互不相关。
2. 随机误差项具有零均值和同方差的性质,即2,1,2,,5i D i εσ==⋅⋅⋅,并且
125,,,εεε⋅⋅⋅相互独立,则有(),0,,,1,2,5i j Cov i j i j =≠=…,εε。 3. 随机变量误差项服从正态分布,即()2~0,,1,2,5i N i =…εσ (2)模型构建:
由表1通过EXCEL 绘制变量,1,2,,5i X i =⋅⋅⋅对因变量Y 的关系散点图如下: