中国民航客运量的回归模型
北京理工大学数学专业应用回归分析期末试题(MTH17095)
课程编号:07000237 北京理工大学2011-2012学年第二学期2009级应用回归分析期末试题A 卷1.(35)Consider the following model:0112233i i i i i y x x x ββββε=++++,where y=labor force paticipation (%)by family heads of poor families, x 1=mean family income ($), x 2=mean family size,x 3=unemployment rate (% of civilian labor force unemployed).Two versions of the model were estimated as follows (the standard errors are in the brackets).(A)123ˆ33.460.01915.520.813i i i i yx x x =-+++ (48.78) (0.019) (9.46) (1.911)()Re 15,5130.13,3716.98T s n SS SS A ===(B) 12ˆ26.510.01815.30i i i yx x =-++ (44.37) (0.018) (9.12)()Re 3778.11s SS B =(1)Interpret the coefficient of mean family income in model (B);(2)Carry out a t-test to test whether in model (A) mean family size has a significant effect upon labor force paticipation;()0.05α=(3) Carry out a partial F-test to test whether in unemployment rate has a significant effect upon labor force paticipation;()0.05α=(4)What is the adjusted coefficient of determination 2R in model (A); (5)Test the significance of model(B);()0.05α=(6)Find a 95% confidence interval for the coefficient 1β of 1x in model (B); (7)Interpret the confidence coefficient 95% in (6).x 1=national income (100 million yuan) x 2=volume of consumption (100 million yuan) x 3=volume of passengers on railway (ten thousands persons) x 4=length of airline of civil aviation (ten thousands persons) x 5=number of inbound tourist arrivals (ten thousands persons) y=volume of passengers of civil aviation (ten thousands persons)(1)What problem do the VIFs imply? (2)Which regression coefficients may have the wrong sign? (3)Discuss the reasons for the problem in (2).3.(12)Consider the following model (n=8):2012y x x βββε=+++where y=body temperature of a pig (centi) x=time length after the pig is infected (hours)(1)Test the significance of 2x ;()0.05α= (2)Predict body temperature at x=80; (3)If the observations of x lie in (8,64),what ’s your suggestion about the prediction in (2); 4.(18)()()()2,:,,0,,0y X X n p rk X p E Var V V βεεεσ=+⨯===>, (1)Find GLSE for β;(2)Find an unbiased estimator for 2σ.5.(20)Full model ()()112220,,1,2,,,cov ,0,i i i i i i j y x x E i j n i ji j ββεεσεε⎧⎪=++⎪⎪==⎨⎪⎧=⎪=⎨⎪≠⎩⎩subset model ()()1120,,1,2,,,cov ,0,i i i i i j y x E i j n i ji j βεεσεε⎧⎪=+⎪⎪==⎨⎪⎧=⎪=⎨⎪≠⎩⎩(1)Under subset model caculate OLSE 1ˆβfor 1β; (2)Assume full model is true,caculate ()()11ˆˆ,E Var ββ. Attached list:()()()()()0.0250.0250.0250.050.0511 2.201,12 2.1788,5 2.5706,1,11 4.8443,2,12 3.8853t t t F F =====课程编号:MTH17095 北京理工大学2012-2013学年第二学期2010级应用回归分析期末试题A 卷Attached list:()()()0.050.050.041,22 4.30,1,23 4.28,3,22 3.418,F F F ===()()0.0250.02522 2.074,23 2.0687t t ==1.(28)Consider the following model:01122ˆyx x βββ=++,n=25,where y=deliver time (minutes), x 1=number of cases of product, x 2=distance walked by the route driver (feet).Two versions of the model were estimated as follows (the standard errors are in the brackets).(A)12ˆ 2.341 1.6160.014yx x =++ (1.097) (0.171) (0.004)()Re 5784.543,233.732T s SS SS A ==(B) 1ˆ 3.321 2.176yx =+ (1.371) (0.124)()Re 402.134s SS B =(1)Interpret the coefficient of number of cases of product in model (A);(2)Carry out a t-test to test whether for model (A) number of cases of product has a significant effect upon deliver time;()0.05α=(3)Carry out a partial F-test to test whether distance has a significant effect upon deliver time;()0.05α=(4)Test the significance of model(B);()0.05α=(5)Find a 95% confidence interval for the parameter 1β from model (B);(6)Find a 90% Bonferroni confidence interval for the parameter 0β and 1β from model (B); (7)Explain the result in (6).2.(18) Consider the following model:01122ˆyx x βββ=++,n=25,where y=deliver time (minutes), x 1=number of cases of product, x 2=distance walked by the route driver (feet).(1)What are the horizontal scale and vertical scale in the following partial regression plot?What does the plot indicate?(2)It is reported that studentized residual at point 9 9993.2138,0.4983r h ==,where ii h is the ith diagonal element of hat matrix H,and COOK ’s distance 9 3.418D =.Interpret the results. (3)The correlation coefficients 12r between x 1 and x 2 is 120.824r =.What does the result imply? What are sources of the problem?3.(15)To study the relationship between the annual per capita expenditure on education and the annual per capita consumption expenditure,two models are used to fit the data,where y:The annual per capita expenditure on education, x:The annual per capita consumption expenditure.4.(21) Consider the simple linear regression model:011y x ββε=++,with ()()20,E Var εεσ==,and ε uncorrelated.(1)Show ()221R xx E MS S σβ=+; (2) Show ()2Re s E MS σ=.5.(18)A linear regression model is written as follows: 11223344y x x x x ββββε=++++,()()20,E Var εεσ==.The data is shown in the following table:(2)Caculate OLSE 1ˆβ for 1β; (3)Caculate ()1ˆVar β.课程编号:MTH17095 北京理工大学2013—2014学年第二学期2011级应用回归分析期末试题*卷(年份推断为2011,试卷类型未知)附表:()()0.050.0255,10 3.33,10 2.2281F t ==1.(28分)中国民航客运量回归方程为:(括号里是标准误差)12345ˆ450.90.3540.5610.007321.5780.435yx x x x x =+--++, (178.08)(0.085) (0.125) (0.002) (4.030) (0.052)16,13843371.750,13818876.769n SST SSR ===其中:y —民航客运量(万人) x 1—国民收入(亿元) x 2—消费额(亿元)x 3—铁路客运量(万人) x 4—民航航线里程(万公里) x 5—来华旅游入境人数(万人) (1)解释回归方程中民航航线里程的回归系数; (2)检验回归方程的显著性;()0.05α= (3)计算回归方程的决定系数,并作出解释; (4)计算回归的标准误差,解释这一结果; (5)对模型中来华旅游入境人数对民航客运量是否有显著影响进行t-检验; (6)建立x 4的回归系数4β的置信水平为95%的置信区间。
多元线性回归案例-公路客运量
计算回归系数
Intercept
X Variable 1 X Variable 2 X Variable 3 X Variable 4
Coefficient s -
3094216.283 26.63703524
3.161530019
Coefficients -3164044.02 -59.4619025 27.18225866 3.134301817 1459.857673 312.6659322
X X X X Yˆ X = - 3164044.02 - 59.46 1 + 27.18 2+ 3.13 3+ 1459.86 4+312.67 5
dL 0.49
4 dU DW d L 0.49
DW检验无结论
Excel技术支持
第二次检验总结
R检验
回归统计所得 复相关系数R 远大于查表所 得相关系数临 界值,说明数 据相关关系显 著
F检验
回归统计所得 F统计量远大 于查表所得临 界值,否定假 设,认为自变 量与因变量间 回归效果显著
综上判定:剩余四个因素均对公路客运量有显著影响
t检验通过
Excel技术支持
RESIDUAL OUTPUT
观测值 1 2 3 4 5 6 7 8 9
10 11 12 13 14 15
DW检验
预测 Y 643980.5197 638154.2071 679732.6268 752136.8213 843449.9506 959632.632 1054454.966 1134729.76 1194339.7 1236696.678 1286810.288 1336303.614 1411188.254 1459365.628 1474352.354
Spss对民航客运量的多元回归分析:
Spss对民航客运量的多元回归分析:1.首先方法选择:进入法。
然后分析相关性表格:国民收入,消费额,民航航线里程,来华旅游人数都与民航客运量高度相关,而铁路客运量和民航客运量的相关性较低。
通过观察调整后的判定系数为0.994,拟合优度较高,不被解释的变量较少。
回归方程的显著性小于0.05,说明被解释变量与解释变量的线性关系是显著的。
可以建立线性方程。
在显著性系数中,铁路客运量的sig 大于0.05,所以是不显著的,说明自变量铁路客运量对因变量的影响是不明显的,应该移除该变量。
回归方程:ˆY =-195.945+0.519X 1-0.771X 2+0.001X 3+15.983X 4+0.344X 52.方法选择:后退法。
然后分析相关性表格:由表可以看出:除了铁路客运量的相关性较低外,其余变量的相关性都较高。
采用后退法后,调整变量更高,拟合优度更高。
回归方程的显著性为0,认为被解释变量和解释的变量线性关系是显著的,可以建立线性方程。
在剔除变量铁路客运量后,剩余变量的sig 都变得更小,显著性更显著。
回归方程为:ˆY =-153.930+0.509X 1-0.754X 2+15.980X 4+0.347X 53.方法选择:逐步回归法。
然后分析相关性表格:铁路客运量相关性较低,其他变量相关性都较高。
采用逐步法后,调整值很高,拟合优度很高。
说明可以用该模型预测。
sig 值小于0.05,说明显著性很高。
采用逐步回归法后,变量得显著性很高。
变量为国民收入和民航航线里程。
回归方程为:ˆY =-299.004+0.083X 1+17.316X 4。
回归分析在数学建模中的应用
Keywords: Multiple linear regression analysis; parameter estimation;inspection
II
咸阳师范学院 2013 届本科毕业论文
目 录
摘 要.............................................................................................................................. I Abstract...................................................................................................................... II 目 录.......................................................................................................................... III 引言................................................................................................................................ 1 1 回归分析的背景来源及其概念................................................................................ 1 1.1 回归分析的背景............................................................................................. 1 1.2 回归分析的基本概念..................................................................................... 1 2 线性回归分析模型.................................................................................................... 2 2.1 一元线性回归的模型..................................................................................... 2 2.1.1 回归参数 0 , 1 和 2 的估计.............................................................. 3 2.1.2 一元线性回归方程的显著性检验.................................................... 3
我国民航客运量的因素分析
-56.288 200.864
.102
.018
1.456
-2.806
.908
-1.267
30.802
9.980
.518
.328
.134
.302
t -.280 5.683
-3.092 3.086 2.454
Sig. .782 .000 .005 .005 .022
多元线性回归分析
由回归分析得 回归方程为: yˆ 56.2880.102x1 2.806x2 30.802x3 0.328x4
yˆ 638.5070.023x1 0.01x2 19.892x3 0.294x4
多重共线性分析
模型
1
(常量)
x1
x2
x3
x4
a. 因变量: y
系数a
非标准化系数
标准系数
B
标准 误差 试用版
-56.288
200.864
.102
.018
1.456
-2.806
.908
-1.267
30.802
系数a
非标准化系数
B
标准 误差
标准系数 试用版
440.059
136.182
.069
.002
.991
354.269
213.272
.061
.016
.870
.269
.509
.121
158.874
219.303
.064
.015
.910
-.487
.593
-.220
.333
.156
.307
t 3.231
36.823 1.661 3.785 .528 .724 4.217 -.822 2.142
我国民航客运量影响因素分析及建模预测
我国民航客运量影响因素分析及建模预测在我国的民航业发展中,客运量一直是一个非常关键的指标。
因为随着社会经济的不断发展,民航客运量的增长需要充分考虑各种影响因素,从而制定出符合实际的发展策略。
本文将分析我国民航客运量的主要影响因素,并建立相应的预测模型,以期为我国民航业的可持续发展提供参考。
一、民航客运量影响因素分析1.宏观经济因素宏观经济因素是影响民航客运量的主要因素之一。
随着经济的不断增长,人民生活水平的提高以及旅游行业的发展,民航客运量也会相应增长。
此外,宏观经济、货币和财政等也会对民航客运量产生一定影响。
2.航空公司和航班因素航空公司的管理、经营和市场推广等因素都会直接影响到民航客运量的增长。
航班数量、航线网络、航班时刻的选择等也会对客运量产生影响。
航班的准点率、航班的服务质量等也是影响客运量的因素之一。
3.旅游业发展随着旅游业的发展和国际旅游的兴起,民航客运量也会相应增长。
旅游业的繁荣将引起人们的出游热情,提高机票需求量。
4.城市规划和交通发展城市规划和交通发展也是影响民航客运量的因素之一。
城市的繁荣和发展将带动航空客运的需求量,而交通工具密集度高的地区机场的使用率也会相应较高。
二、建模预测为了预测我国民航客运量的发展趋势,我们可以通过建立回归模型或时间序列模型来进行预测。
1.回归模型回归模型是一种基于相关分析的建模方法,可以通过分析各个影响因素对民航客运量的影响程度,建立预测模型。
例如,通过多元线性回归分析,可以得出民航客运量与宏观经济因素、旅游业发展和城市规划等因素的相关系数。
2.时间序列模型时间序列模型是一种基于历史数据的建模方法,可以将历史数据分析后得出的规律应用于未来的预测中。
例如,通过ARIMA模型或Holt-Winter模型等时间序列模型,可以预测出未来几年民航客运量的变化趋势。
三、结论综上所述,我国民航客运量的增长需要考虑各种影响因素,从而制定出符合实际的发展策略。
宏观经济因素、航空公司和航班因素、旅游业发展和城市规划和交通发展等都是影响民航客运量的主要因素。
如何使用逻辑回归模型进行航空客流预测(Ⅰ)
航空客流预测是航空公司和机场管理部门的重要工作之一。
通过对未来客流量的合理预测,可以更好地安排飞机的航线和座位,提高运营效率,减少资源浪费。
逻辑回归模型是一种常用的客流预测方法,它可以通过对历史数据的分析和建模,来预测未来客流的情况。
本文将探讨如何使用逻辑回归模型进行航空客流预测。
1. 数据收集与准备在使用逻辑回归模型进行航空客流预测之前,首先需要进行数据的收集和准备工作。
这包括收集历史客流数据、航班信息、机场情况等相关数据,并进行数据清洗和处理。
在数据清洗过程中,需要处理缺失数据、异常值和重复数据,以保证数据的质量和准确性。
同时,还需要对数据进行特征选择和转换,以便适应逻辑回归模型的要求。
2. 模型建立与训练在数据准备工作完成后,接下来就是建立逻辑回归模型并进行训练。
逻辑回归模型是一种广义线性模型,它可以用来预测二分类或多分类问题。
在航空客流预测中,通常将客流量划分为高、中、低三个等级,然后使用逻辑回归模型来预测客流量所属的等级。
在模型建立过程中,需要将数据集分为训练集和测试集,然后使用训练集数据来训练模型,并使用测试集数据来评估模型的性能。
3. 模型评估与优化在模型训练完成后,需要对模型进行评估和优化,以确保模型的预测性能达到要求。
评估模型的常用指标包括准确率、精确率、召回率和F1值等,这些指标可以帮助我们判断模型的预测效果。
如果模型的性能不理想,可以尝试调整模型的参数或者使用特征工程的方法来优化模型。
4. 模型应用与预测经过评估和优化后,逻辑回归模型就可以用来进行航空客流预测了。
在预测过程中,需要将实时的航班信息和机场情况输入到模型中,然后模型会根据历史数据和建立的模型来预测未来客流量的情况。
预测结果可以帮助航空公司和机场管理部门做出合理的决策,提高运营效率和服务质量。
5. 模型监控与更新最后,建立好的逻辑回归模型需要进行监控和更新,以适应不断变化的客流情况。
在模型应用的过程中,需要不断收集新的数据并更新模型,以确保模型的预测性能始终保持在一个较高的水平。
影响民航客运量的相关因素分析
影响民航客运量的相关因素分析影响民航客运量的相关因素分析摘要:民航客运量受到很多因素的影响,本⽂选取了国民收⼊、铁路客运量、民航⾥程数与来华旅游⼊境⼈数四个具有代表性的指标,通过运⽤线性回归的⽅法来对这些影响因素进⾏相关的定量分析,并建⽴相关模型。
试图为我国的民航业的发展提供⼀些有参考价值的预测和信息。
关键词:民航客运量、影响因素、线性回归、定量分析⼀、航空业现状与影响因素分析航空运输作为现代化运输⽅式,其发展程度直接能反映⼀个国家的经济⽔平。
我国航空业发展起步较晚,最近⼏年虽然发展⾮常迅速,但是和国际上的航空公司相⽐还是有很⼤差距,⽽随着改⾰开放的进⼀步加深,民航业要⾯临更多的激烈竞争。
因此,加强对民航业的重视与研究,提⾼民航业的改⾰和发展,可以有效提升民航业的竞争⼒。
(⼀)民航客运量的现状分析近年来,我国的民航业发展迅速,在起步的近20年的时间⾥,平均增长速度在年15%左右,最近两年增速加快。
但是相对于国内航线的迅猛发展,国际航线却很疲软。
进⼊21世纪以来,我国航空业开始采⽤统⼀的标准,2002年实⾏政企分离以来,我国航空运输量呈现明显的增长趋势。
(⼆)民航客运量影响因素分析影响民航客运量的因素有很多,综合有关学者和该领域的专家的观点和意见,我们得出有着最直接影响的是国民收⼊、铁路客运量、民航⾥程数与来华旅游⼊境⼈数四个指标。
国民收⼊是⼀个国家整体经济的直接反映,⽽航空业在本国的发展更是与经济的好坏息息相关;铁路客运作为我国客运最为重要的运输,会和航空业形成⼀定的竞争;民航⾥程数反映了⾏业的发展⽔平,最后⼊境旅游⼈数也是与航空客运量有直接关联。
⼆、数据来源与分析本⽂主要以中国统计年鉴2002-2012历年的数据作为数据来源,从中采集了国民收⼊、铁路客运量、民航⾥程数与来华旅游⼊境⼈数历年的数据,如下图⼀:数据分析:以年份为横轴,作出四个解释变量和被解释变量的⾛势图。
为了避免异⽅差,这⾥我们对原始数据去⾃然对数处理。
岭回归ppt
二、方差扩大因子法
选择k使得矩阵c(k ) ( X ' X kI ) 1 ( X ' X kI ) 主对角线元素c jj (k ) 10 ˆ(k)的协方差阵为 由于岭估计 ˆ(k) ˆ(k) ˆ(k) D( ) cov( , ) cov((X ' X kI ) 1 x' y, ( X ' X kI ) 1 X ' y ) ( X ' X kI ) 1 cov(y, y )( X ' X kI ) 1 2 ( X ' X kI ) 1 X ' X ( X ' X kI ) 1 2 c(k )
一、INCLUDE'C:\Program Files\SPSS\Ridge regression.sps'.
RIDGEREG DEP=y/ENTER X1 X2 X3 X4 X5. INCLUDE'C:\Program Files\SPSS\Ridge regression.sps'. RIDGEREG DEP=y/ENTER X1 X2 X3 X4 X5 /start=0.0/stop=0.2/inc=0.02. INCLUDE'C:\Program Files\SPSS\Ridge regression.sps'. RIDGEREG DEP=y/ENTER X2 X3 X4 X5 /k=0.08.
P193 图A,系数趋于0,变量不重要 图B.系数由正变负,变化大,对Y有显著影响 图C. 古典模型时系数为正,岭回归时系数为负. 图D. 两个系数不稳定,一个增大时另一个减少, 但其和稳定,可以考虑保留一个变量. 图E. 变量对Y不显著 图F. 变量对Y的影响趋于稳定
中国民航客运量的回归模型(1)
回归分析论文题目:中国民航客运量的回归模型我国民航客运量的变化趋势及其成因摘要改革开放以来,中国的经济飞速发展,人民的生活水平也发生了很大的变化;民航一直是交通运输中的一种不可少的方式,一定程度上也反映了人民的生活水平的提高,为了对民航客运量做出准确地评估和预测,本文利用多元线性回归分析方法研究我国民航客运量的变化趋势及其成因,数据来自《中国统计年鉴》(1981—2010年民航客运量),利用spss软件对数据进行处理和分析.关键词多元线性回归分析、回归方程、显著性检验、相关性、民航客运量一、模型的建立与分析(一)研究我国1981年至2010年民航客运量与各影响因素之间的关系1)数据来源:《中国统计年鉴》(1981—2010年民航客运量)如下表1表1.我国民航客运量与影响因素2)研究方法:建立y 与自变量53412,,,,x x x x x 的多元线性回归模型如下:10122334455y=+ββχ+βχ+βχ+βχ+βχ+ε其中 E(ε)=0 var (ε)=2σ3)实证分析:(1)对收集数据作相关分析,用spss 软件计算增广相关矩阵,输出结果如下表2.相关性从相关矩阵看出,y 与1x ,2x ,4x ,5x 的相关系数都在0.9以上,说明所选自变量与y 高度线性相关的,用y 与自变量做多元线性回归是合适的。
y 与3x 的相关系数3y r =0.809,p 值=0,这说明铁路客运量对民航客运量影响较弱。
一般认为铁路客运量与民航客运量之间呈负相关,铁路与民航共同拥有旅客,乘了火车就乘 不了飞机。
但就中国的实际情况分析我国居民收入普遍不高,一般外出、旅游乘火车的比较多,而且随着我国铁路建设越来越普遍,乘坐火车外出的人也越来y 民航客运总量(万人) x1GDP(万元)x2居民消费(万元) x3铁路客运量(千人)x4民航航线里程(万公里) x5来华旅游入境人数(万人) Pearson 相关性y 民航客运总量(万人) 1.000 .996 .994 .809 .936 .932 x1GDP (万元) .996 1.000 .995 .820 .929 .922 x2居民消费(万元) .994 .995 1.000 .784 .950 .937 x3铁路客运量(千人) .809 .820 .784 1.000 .597 .622 x4民航航线里程(万公里) .936 .929 .950 .597 1.000 .978 x5来华旅游入境人数(万人).932 .922 .937 .622 .978 1.000 Sig. (单侧)y 民航客运总量(万人) . .000 .000 .000 .000 .000 x1GDP (万元) .000 . .000 .000 .000 .000 x2居民消费(万元) .000 .000 . .000 .000 .000 x3铁路客运量(千人) .000 .000 .000 . .000 .000 x4民航航线里程(万公里) .000 .000 .000 .000 . .000 x5来华旅游入境人数(万人).000.000.000.000.000.愈多。
(完整word版)我国民航客运量的变化趋势及其成因
2011—2012学年第二学期《数据分析》期末论文题目我国民航客运量的变化趋势及其成因姓名杨艳学号20091021202系(院)数学系专业数学与应用数学2012年6 月27日我国民航客运量的变化趋势及其成因摘要:随着经济的发展,人民的生活水平也发生了很大的变化;经济的发展带动了人民消费观念的改变。
民航一直是交通运输中的一种不可少的方式,一定程度上也反映了人民的生活水平的提高,此题主要研究我国民航客运量的变化趋势及其成因,数据来源于《1994年统计摘要》,利用Eviews软件拟合数据,主要是根据线性回归和非线性回归的知识分析利用软件得出的结果。
关键词:(非)线性回归、相关性、最小二乘估计、逐步回归一、前言伴随着经济的发展,人们的生活水平也随之增加了,同时带来了消费水平和消费观念的改变;与此同时也促进了经济的增加.为了研究我国民航客运量的变化趋势及其成因,我们以民航客运量作为因变量y ,以国民收入、消费额、铁路客运量、民航航线里程、来华旅游入境人数为影响民航客运量的主要因素。
利用Eviews 软件通过建立回归模型分析我国民航客运量主要受到哪些因素的影响,通过回归模型的建立反映我国经济水平的发生的变化,在此也可以了解到我国居民的消费观念和消费水平。
二、预备知识2。
1多元线性回归模型2。
1。
1多元回归模型定义:根据多个自变量的最优组合建立回归方程来预测因变量的回归分析称为多元回归分析.多元线性回归分析的模型为:εββββ+++++=p p x x x y (22110)其中:p 为解释变量的数目,0β为回归常数,p βββ,...,,10称为回归参数(regression coefficient),ε为随机变量。
回归估计估计方程为:p p x b x b x b b y ++++=∧ (22110)其中:∧y 为根据所有自变量计算出的估计值。
0b 为常数项,p b b b ..,,21称为y 对应于p x x x ...,,21的偏回归系数估计。
对时间序列的ARIMA调整与回归分析——以民航客运统计为例
个有效的工具 。
关键词 :时间序列 ;季节调整 ;回归分析
中图分类号 :0 1 . 2 21 文献标识码 :A 文章编 号:10 — 8 X 2 1)3 0 8 —4 0 7 9 4 (0 00 — 0 2 0
我 国民航客运量 的定量研究文献 回顾
美 国麻省理工大学航空运输实验室的研究认为 , 市场预测准确度每提高 1%, 0 航空公司收益可以提高 1 4 %一 %。正确预测民航客运量 ,对国家的交通发展和资源配置优化 ,以及 民航企业 的投资 、经营管理有 重要作用… 。然而 ,笔者对 C K 数据库检索 “ NI 民航客运量”和 “ 预测”2 个关键词 ,发现我国关于民航客 运量预测方面的研究成果极为有限。20 —0 9 00 20 年间仅能检索到 8篇论文直接以民航客运量 的预测方法为
郑彦
( 厦门城市 职业学院 ,福建 厦门 3 10 6 0 8)
摘要 :以 20 — 0 9年我国民航客运统计 数据 为样本 。提出了采用 A I 0320 R MA模型对时 间序列进行预处理之后进行
回归分析的研究方法 。 实证分析表 明, RM A IA模 型与 回归分析相结 合为基 于月度数据 的时间序列定量分析提供 了
前 国内民航客运的定量研究 中普遍使用年度数据进行回归分 析主要是为了避免处理月度数据 的季节波动问题。这一解决
方法虽然避开了不稳定性的问题 ,却不可避免地造成了数据
E五垂圃
图 1 2 -0 9  ̄3 20 年我国民航客运量时间序列图 的浪费和样本容量大幅下降,影响了研究 的有效性 。 为 了研 究我 国 民航 客运 量 的季 节波 动性 ,本文采 用 E i s.软件中的季节调整模块配合西班牙 国家银行 ( ac e saa 开发的 T A OS A S v w5 e 0 B no pn ) dE R M / T 软件对上 E
第7章-回归分析
则有:
X Y
其对应的最小二乘估计为:
X X X TY
T 1
7.3 多元线性回归分析
土地问题是当今世界令人瞩目的重大经济问题,人口和经济 发展都和土地之间存在着密不可分的联系。人口数(X1)、 粮食总产量(X2)和粮食作物面积(X3)是影响土地面积 (Y)的重要因素。因变量土地面积与三个自变量之间呈线 形相关,因此用三元线形回归方程来分析
Q
2
y y
i
2
注意:1、r与Q成反比例关系; 2、以上为多元回归分析的相关系数的通用形式。 当r大于某一给定的临界值时,通过相关性检验,否则不通过。
7.2.3 相关性检验
1.
2.
r 的取值范围是 [0,1]
|r|=1,为完全相关
r =1,为完全正相关 r =-1,为完全负正相关
其中:x , y 是样本均值;
Sxy xi x yi y
7.2.2 结果及解释
最后得到我国技术贸易额与GDP的关系(亿元):
y 69.8587 0.0073x
技术贸易(Technology Transactions) 是我国市场体 系的重要部分,是链接科研和生产的桥梁和纽带,属 于市场体系中的生产要素市场.涉及与技术开发、技 术转让、技术咨询、技术服务相关的技术交易活动 及相关主体。
解释:1、技术贸易只有在GDP=69.8587/0.0073 =9452.1之后才能产生; 2、每单位GDP可带动0.0073个单位的技术贸 易交易。
7.2.3 相关性检验
对回归模型描述实际数据的近似程度,也即对所得的 回归模型的可信程度进行检验,称为相关性检验。
r 1
ˆ yi yi
因子分析的方法
三.关于中国民航客运量模型建立与研究为研究我国民航客运量的变化趋势及其成因,我们以民航客运量作为因变量Y,以国民收入,消费额,铁路客运量,民航航线里程,来华旅游入境人数为影响民航客运量的主要因素。
Y表示民航客运量(万人),X1表示国民收入(亿元),X2表示消费额(亿元),X3表示铁路客运量(万人),X4表示民航航线里程(万公里),X5表示来华旅游入境人数(万人)。
统计数据如下:现对该数据进行分析如下:回归分析Correlationsy x1 x2 x3 x4 x5(1)从相关阵看出,y与x1,x2,x4,x5的相关系数都在0.9以上,说明所选自变量与y高度线性相关,用y与自变量作多元线性回归是适当的。
(2)y与x3的相关系数ry3=0.227偏小,P值=0.398,x3是铁路客运量,这说明铁路客运量对民航客运量无显著影响。
Model SummaryModel R R Square Adjusted RSquareStd. Error of theEstimate1 .999a.998 .997 49.49240a. Predictors: (Constant), x5, x3, x4, x2, x1ANOVA bModel Sum of Squares df Mean Square F Sig.1 Regression 1.382E7 5 2763775.354 1.128E3 .000aResidual 24494.981 10 2449.498Total 1.384E715a. Predictors: (Constant), x5, x3, x4, x2, x1b. Dependent Variable: yCoefficients aModel Unstandardized CoefficientsStandardizedCoefficientst Sig.B Std. ErrorBeta1(Constant) 450.909178.078 2.532 .030 x1 .354 .085 2.447 4.152 .002 x2 -.561 .125 -2.485 -4.478 .001 x3 -.007 .002 -.083 -3.510.006 x4 21.578 4.030 .531 5.354 .000 x5.435.052.5648.440.000a. Dependent Variable: y(3)由上图知:回归方程为y=450.909+0.354x1-0.561x2-0.007x3+21.578x4+0.435x5(4)复相关系数R=0.999,决定系数R*R=0.998,由决定系数看回归方程高度显著。
北航数理统计大作业
北航数理统计大作业(逐步回归)(总14页)--本页仅作为文档封面,使用时请直接删除即可----内页可以根据需求调整合适字体及大小--应用数理统计第一次大作业学号:姓名:班级: B11班2015年12月民航客运量的多元线性回归分析摘要:本文为建立以民航客运量为因变量的多元线性回归模型,选取了1996年至2013年的统计数据,包含国民生产总值,民航航线里程,过夜入境旅游人数,城镇居民可支配收入等因素,利用统计软件SPSS对各因素进行了筛选分析,采用逐步回归法得到最优多元线性回归模型,并对模型的回归显著性、拟合度以及随机误差的正态性进行了检验,并采用2014年的数据进行检验,得到的结果达到预期,证明该模型建立是较为成功的。
关键词:多元线性回归,逐步回归法,民航客运量0.符号说明1铁路客运量X2民航航线里程X3入境过夜旅游人数X4城镇居民人均可支配收入X51.引言随着社会的进步,人民生活水平的提高,如何获得更快捷方便的交通成为人们日益关注的问题。
因为航空的安全性,快速且价格水平越来越倾向大众,越来越多的人们选择航空这种交通方式。
近年来,我国的航空客运量已经进入世界前列,为掌握航空客运的动态,合理安排班机数量。
科学地对我国民航客运量的影响因素的分析,并得出其回归方程,进而能够估计航空客运量是非常有必要的。
本文收集整理了与我国航空客运量相关的历年数据,运用SPSS软件对数据进行分析,研究1996年起至2013年我国民航客运量y(万人)与国民生产总值X1(亿元)、铁路客运量X2(万人)、民航航线里程X3(万公里)、入境过夜旅游人数X4(万人)、城镇居民人均可支配收入X5(元)的关系。
采用逐步回归法建立线性模型,选出较优的线性回归模型。
2.数据的统计与分析本文在进行统计时,查阅《中国统计摘要》,《中国统计年鉴2014》以及中国知网数据查询中的数据,收集了1996年至2013年各个自变量因素的数据,分析它们之间的联系。
计量经济学——民航客运分析gdm
我国民航客运量影响因素分析——计量经济学大作业——我国民航客运量影响因素分析改革开放以来,中国经济快速发展,我国民航业实现了持续、高速增长。
1978至1997年期间我国航空运输总周转量、旅客周转量均保持年平均增长率19%以上,大大超过世界同期6%的水平。
1997年我国民用飞机为915架,其中运输飞机485架,占国际民航组织缔约国商用飞机数量的2.9%,基本上都是大中型飞机,100座以上飞机397架,是全国各行业中国有经济比例最高的行业。
民航业已经成为我国重要的新兴产业之一,属于高增长弹性的朝阳产业。
1978-1997年间民航运输总周转量、旅客周转量对GDP的增长弹性值分别为1.92和1.95,即GDP每增长一个百分点,民航运输总周转量、旅客周转量分别增长1.92个百分点和1.95个百分点,在各产业中属于发展潜力最大、增长速度最快的新兴服务业之一。
据统计,1997年仅民航总局直属企业收入为552亿元(1998年下降为508亿元),若加上地方民航企业收入的话,至少在700亿元以上。
若按照民航直接收入与间接收入之比(例如:旅游收入、保险收入、邮政收入等)1:2-3倍(保守估计),平均每年产生的间接收入在1500-2000亿元。
“十五”曾计划明确提出我国民航产业发展目标:通过开放空中市场、大幅度降低运价,延长民航航线里程,大幅提高民航客运量,进一步扩大我国民航业的市场规模,使之成为我国重要的产业之一,以此推动航空制造业、旅游业、保险业、其他运输业的发展,同时也带动我国中心城市的基础设施建设和第三产业的蓬勃发展。
本文希望从众多影响我国民航事业发展的因素中找出几个代表性因素进行分析,根据近年国家统计数据,运用统计学与计量经济学原理,借助计算机软件的辅助,建立模型,明确其对我国民航客运量发展的具体影响关系,得出结论,为有关研究提供借鉴。
一、变量的选取人们乘坐飞机多是因为他们想到某地探亲、旅游或参加商务活动,从起始地到目的地的移动形成了运输需求,运输需求主要受当地经济、社会、地理、人口、交通环境的影响,而民航作为建设成本巨大、价格相对较高的一种出行途径,其受经济、替代运输工具、自身航线发展设置等因素的影响尤为突出。
SPSS实验回归分析
回归分析一.实验描述:中国民航客运量的回归模型。
为了研究我国民航客运量的变化趋势及其成因,我们以民航客运量作为因变量Y,以国民收入(X1)、消费额(X2)、铁路客运量(X3)、民航航线里程(X4)、来华旅游入境人数(X5)、为主要影响因素。
数据如下表。
试建立Y与X1--X5之间的多元线性回归模型。
二.实验过程描述及实验结果(1)该表格中输出了5个自变量和1个因变量的一般统计结果,包括各自变量与因变量的平均值,标准差和个案数16。
该表格中列出了各个变量之间的相关性,从该表格可以看出因变量Y和自变量X1之间的相关系数为0.989,相关性最大,。
因变量Y与自变量X3之间相关系数为0.227,相关性最小。
(3)该表格输出的是被引入或从回归方程中被剔出的各变量。
说明进行线性回归分析时所采用的方法是全部引入法Enter。
因变量为Y。
(4)该表格输出的是常用统计量。
从该表看出相关性系数R为0.999,判定系数R2为0.998,调整的判定系数为0.997,回归估计的标准误差为49.49240。
该表格输出的是方差分析表。
从这部分结果看出:统计量F为1.128E3;相伴概率值小于0.01,拒绝原假设说明多个自变量与因变量Y之间存在线性回归关系。
Sum of Squares一栏中分别代表回归平方和(1.382E7),残差平方和(24494.981)以及总平方和(1.384E7),df为自由度。
判定系数R2=0.99855。
该表格为回归系数分析。
其中Unstandardized Coefficients为非标准化系数,Standardized Coefficients为标准化系数,t为回归系数检验统计量,sig为相伴概率值。
由表知t检验的相伴概率值均小于0.01,拒绝原假设,说明个变量与因变量之间均有显著线性相关关系。
从表格中可以看出该多元线性回归方程为:y=450.909+0.354 X1-0.561 X2-0.007 X3+21.578 X4+0.435 X5该表格为残差统计结果表。
多元回归模型在新建机场客运量预测中的应用研究——基于动态聚类分析
2010年 第 2O期
多元 回归模 型在新 建 机 场客运量预测 中的应 用研究
— — 基 于动态聚类 分析
悦 慧 安 然
(中 国 民 航 大 学 ,天 津 300300)
设 7"/i表 示 第 i类 中 所 包 含 的 样 本 个 数 ,则
ni一 ∑ ( 1,… ,c)
设 -T∈RN 表 示 第 i类 的 中 心 ,则
 ̄ — 已 '
l-eijx j
=
—
i 耋 一 li
( ‘ ’ 一’'f。 )
所 以第 i类 的 类 内 差 异 为
(4)
( )
即 整 体 类 内差 异 为
(6)
s( )一蚤S‘ ( )一蚤 lJ l- z,一Xi。l (7)
动 态 聚 类 分 析 的 目 的 就 是 寻 找 = ( , )使 得 S( )
取 得 最 小 值 ,即
S( )一 ra in{S(tA )
(8)
聚 类 终 止 条 件 为 :第 一 ,迭 代 次 数 。 当 目前 的 迭 代 次 数
关 键 词 :新 建 机 场 ;客 运 量 预 测 ;动 态聚 类 分 析 ;多元 回 归
中 图 分 类 号 :F22
文 献 标 识 码 :A
文 章 编 号 :1672—3198(201O)20—001 3一O3
0 引 言
相 似 性 用 欧 氏距 离 度 量 ,其 表 达 式 为 :
机 场 是 航 空 运 输 最 重 要 的 基 础 设 施 。 从 全 国 机 场 体 系 看 ,我 国 面 临 着 机 场 总 量 不 足 、密 度 偏 低 的 挑 战 ,根 据 《全 国 民 用 机 场 布 局 规 划 》,未 来 十 年 国 内 将 新 增 70余 个 机 场 。 同 时 ,机 场 规 模 成 为 民 航 业 发 展 的 又 一 挑 战 ,它 直 接 影 响 机 场 的 建 设 投 资 成 本 和 运 营 成 本 ,规 模 过 大 会 造 成 资 源 的 浪 费 ,规 模 过 小 又 不 足 以 满 足 市 场 的 发 展 需 求 。 机 场 业 务 量 作 为 机 场 的 主 要 生 产 指 标 ,其 预 测 数 据 是 确 定 机 场 建 设 规 模 的 重 要 依 据 ,对 机 场 的 建 设 、运 营 和 管 理
实验报告
统计09—1班0907060129 钱春萍实验报告例:中国民航客运量的回归模型。
为了研究我国民航客运量的变化趋势及其成因,我们一民航客运量作为因变量y,以国民收入、消费额、铁路客运量、民航航线里程、来华旅游入境人数为影响民航客运量的主要因素。
y表示民航客运量(万人),x1表示国民收入(亿元),x2表示消费额(亿元),x3表示铁路客运量(万人),x4表示民航航线里程(万公里),x5表示来华旅游入境人数(万人)。
根据《1994年统计摘要》获得1978——1993年统计数据,见下表:年份y x1 x2 x3 x4 x51978 231 3010 1888 81491 14.89 180.921979 298 3350 2195 86389 16.00 420.391980 343 3688 2531 92204 19.53 570.251981 401 3941 2799 95300 21.82 776.711982 445 4258 3057 99922 23.27 792.431983 391 4736 3358 106044 22.91 947.701984 554 5652 3905 110353 26.02 1285.221985 744 7020 4879 112110 27.72 1783.301986 997 7859 5552 108579 32.43 2281.951987 1310 9313 6386 112429 38.91 2690.231988 1442 11738 8038 122645 37.38 3169.481989 1283 13176 9005 113807 47.19 2450.141990 1660 14384 9663 95712 50.68 2746.201991 2178 16557 10969 95081 55.91 3335.651992 2886 20223 12985 99693 83.66 3311.501993 3383 24882 15949 105458 96.08 4152.70第一步,提出因变量与自变量,搜集数据。
何晓群:《应用回归分析》第四版-第八章主成分回归与偏最小二乘
返 回 前一页 后一页
为什么会产生多重共线性??
返 回 前一页 后一页
6.1 多重共线性产生的背景和原因
经济变量随时间变化往往存在共同的变化趋势。如我国国名消 费情况研究中,其影响因素有职工平均工资、农名平均收入、 全国零售物价总数等等,但这些因素之间存在很强的相关性。
如:影响某地区粮食产量的因素有很多,如:化肥用量,水浇 地面积、农业资金投入等,这些因素之间也有很强的相关性。 影响
X1:国民收入
X2:消费额
X3:铁路客运量
X4:民航航线里程
Coefficientsa X5:来华旅游入境人数
原因???U?nsta?ndar多diz重ed 共线S性tandardized
Co effi ci e nts
Co effi ci e nts
M od e l
B
Std. Error
1
(Constant) 450.909 178.078
Beta
x1
.354
.085
2.447
x2
-.561
.125
-2.485
x3
-.007
.002
-.083
x4
21.578
4.030
.531
x5
.435
.052
.564
a. Dependent Variable: y
t 2.532 4.152 -4.478 -3.510 5.354 8.440
Si g. .030 .002 .001 .006 .000 .000
23.27 792.43
ห้องสมุดไป่ตู้
22.91
947.7
26.02 1285.22
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
回归分析论文题目:中国民航客运量的回归模型学校:平顶山学院院系:数学与信息科学学院专业:10级统计学学号:101120154姓名:赵春杰日期:2012年10月26日我国民航客运量的变化趋势及其成因摘要改革开放以来,中国的经济飞速发展,人民的生活水平也发生了很大的变化;民航一直是交通运输中的一种不可少的方式,一定程度上也反映了人民的生活水平的提高,为了对民航客运量做出准确地评估和预测,本文利用多元线性回归分析方法研究我国民航客运量的变化趋势及其成因,数据来自《中国统计年鉴》(1981—2010年民航客运量),利用spss软件对数据进行处理和分析.关键词多元线性回归分析、回归方程、显著性检验、相关性、民航客运量一、模型的建立与分析(一)研究我国1981年至2010年民航客运量与各影响因素之间的关系1)数据来源:《中国统计年鉴》(1981—2010年民航客运量)如下表1表1.我国民航客运量与影响因素2)研究方法:建立y 与自变量53412,,,,x x x x x 的多元线性回归模型如下:10122334455y=+ββχ+βχ+βχ+βχ+βχ+ε其中 E(ε)=0 var (ε)=2σ3)实证分析:(1)对收集数据作相关分析,用spss 软件计算增广相关矩阵,输出结果如下表2.相关性从相关矩阵看出,y 与1x ,2x ,4x ,5x 的相关系数都在0.9以上,说明所选自变量与y 高度线性相关的,用y 与自变量做多元线性回归是合适的。
y 与3x 的相关系数3y r =0.809,p 值=0,这说明铁路客运量对民航客运量影响较弱。
一般认为铁路客运量与民航客运量之间呈负相关,铁路与民航共同拥有旅客,乘了火车就乘 不了飞机。
但就中国的实际情况分析我国居民收入普遍不高,一般外出、旅游乘火车的比较多,而且随着我国铁路建设越来越普遍,乘坐火车外出的人也越来y 民航客运总量(万人) x1GDP(万元)x2居民消费(万元) x3铁路客运量(千人)x4民航航线里程(万公里) x5来华旅游入境人数(万人) Pearson 相关性y 民航客运总量(万人) 1.000 .996 .994 .809 .936 .932 x1GDP (万元) .996 1.000 .995 .820 .929 .922 x2居民消费(万元) .994 .995 1.000 .784 .950 .937 x3铁路客运量(千人) .809 .820 .784 1.000 .597 .622 x4民航航线里程(万公里) .936 .929 .950 .597 1.000 .978 x5来华旅游入境人数(万人).932 .922 .937 .622 .978 1.000 Sig. (单侧)y 民航客运总量(万人) . .000 .000 .000 .000 .000 x1GDP (万元) .000 . .000 .000 .000 .000 x2居民消费(万元) .000 .000 . .000 .000 .000 x3铁路客运量(千人) .000 .000 .000 . .000 .000 x4民航航线里程(万公里) .000 .000 .000 .000 . .000 x5来华旅游入境人数(万人).000.000.000.000.000.愈多。
但是仅凭相关系数的大小是不能决定变量的取舍的,在初步建模时还是应该包含3x 的。
(2)对数据进行线性回归分析得出以下各表拟合优度用于描述回归方程对样本观测值的拟合程度,样本决定系数2R 的取值在[0,1]区间内,2R 越接近1,表明回归拟合的效果越好;2R 越接近0,表明回归拟合的效果差。
在实际应用中,人们用复相关系数R 来表示回归方程对原始数据拟合程度的的好坏,它衡量作为一个整体的12,,......,p x x x 与y 的线性关系的大小,由表3可以看出样本决定系数20.994R =,复相关系数0.997R =,则表明回归方程对样本观测值的拟合程度较高,整体的12,,......,p x x x 与y 的线性相关性较高。
再由表4可以看出:F=793.051,P 值=0.000,表明回归方程高度显著,说明53412,,,,x x x x x 整体上对y 有高度显著的线性影响可得回归方程为12345ˆ1579.8490.0520.0140.015 3.564+0.134yx x x x x =-++++从表5中可以看出并不是所有的自变量x 单独对y 都有显著影响,最大的p 值为2p =0.756远大于0.05,没有通过回归系数的显著性检验,这说明尽管回归方程通过了显著性检验,但也会出现某些单个自变量x (甚至于每个x )对y 并不显著的情况。
(3)由于某些单个自变量不显著,因而在多元回归中并不是包含在回归方程中的自变量越多越好,为了解决这个问题我们可以采取一种简单的剔除多余变量的方法:“后退法”得以下各表由表6可以看出:用“后退法”进行分析其各个回归方程模型对样本观测值的拟合程度,回归方程均通过了显著性检验。
由表7可知1F =793.051 2F =1028.372 3F =1407.901 4F =2159.2001P = 2P =3P = 4P =0.000表明在利用“后退法”进行分析得到的四个回归方程高度显著。
利用“后退法”首先剔除x2,得到回归模型2:1345ˆ1579.4840.0560.015 5.320+0.124yx x x x =-+++,其中4P =0.577>0.05,回归方程系数未通过检验,再剔除x4得回归模型3135ˆ837.4170.0590.009+0.180yx x x =-++,其中3P =0.530>0.05 回归方程系数未通过检验,再剔除x3得回归模型415ˆ90.1590.061+0.147yx x =+ 1P =0.000 5P =0.036 均小于0.05 回归方程系数通过检验通过以上的方法我们最终得到因变量y 与x1和x5保持着高度线性相关性,但在实际应用时,为了模型的结构合理,我们有时也保留个别对y 影响不大的变量,这种情况尤其是在建立宏观经济模型时常常如此。
(4)作散点图如下图9图9 .民航客运量随年份变化趋势图由该散点图可以看出,从1981年至1990年我国的民航客运量变化的幅度较小,1990年至2010年变化幅度较大,为了使所建的模型能对未来的情况进行预测,我把收集到的数据分成了两部分进行讨论:一部分是从1981年至1990年的数据,另一部分是1991年至2010年的数据。
(二)对1981年至1990年我国民航客运量与各影响因之间的关系进行分析表10.1981年至1990年我国民航客运量与各影响因之间数据表1)对该表的数据用spss 进行分析,得y 与自变量53412,,,,x x x x x 相关性如表表11.相关性y x1 x2 x3 x4 x5 Pearson 相关性y 1.000 .962 .957 .332 .945 .960 x1 .962 1.000 .999 .307 .979 .896 x2 .957 .999 1.000 .320 .975 .895 x3 .332 .307 .320 1.000 .195 .551 x4 .945 .979 .975 .195 1.000 .847 x5.960 .896 .895 .551 .847 1.000 Sig. (单侧) y . .000 .000 .174 .000 .000 x1 .000 . .000 .194 .000 .000 x2 .000 .000 . .183 .000 .000 x3 .174 .194 .183 . .295 .050 x4 .000 .000 .000 .295 . .001 x5.000.000.000.050.001.从相关矩阵看出,y 与1x ,2x ,4x ,5x 的相关系数都在0.9以上,说明所选自变量与y 高度线性相关的,用y 与自变量做多元线性回归是合适的。
y 与3x 的相关系数3y r =0.332 ,p 值=0,这说明铁路客运量对民航客运量影响较弱,就中国的实际情况分析我国居民收入普遍不高,一般外出、旅游乘火车的比较多,因此影响较弱。
2)对数据进行线性回归分析得出以下各表由表12可以看出样本决定系数20.994R =,复相关系数0.997R =,则表明回归方程对样本观测值的拟合程度较高,整体的34512,,,,x x x x x 与y 的线性相关性较高。
再由表13可以看出:F=143.806,P 值=0.000,表明回归方程高度显著,说明53412,,,,x x x x x 整体上对y 有高度显著的线性影响表14.系数a模型 非标准化系数标准系数 t Sig.B 标准 误差试用版1(常量) 742.011 396.7411.870.135 x1 -.058 .189 -.606 -.307 .774 x2 .126 .336 .662 .375 .727 x3 -.010 .004 -.182 -2.663 .056 x4 11.630 11.994 .252 .970 .387 x5.426.074.7985.757.0053)直方图:(三)对1991年至2010年我国民航客运量与各影响因之间的关系进行分析表15.1991年至2010年我国民航客运量与各影响因之间数据表1)做散点图:2)曲线估计:由上图可知,民航客运量y 随年份变化的情况用指数分布模型更适合。
3)对表15的数据用spss 进行分析,得y 与自变量53412,,,,x x x x x 相关性如表表16.相关性yx1 x2 x3 x4 x5 Pearson 相关性y 1.000 .995 .990 .947 .944 .908 x1 .995 1.000 .995 .945 .947 .904 x2 .990 .995 1.000 .928 .958 .908 x3 .947 .945 .928 1.000 .827 .777 x4 .944 .947 .958 .827 1.000 .962 x5.908 .904 .908 .777 .962 1.000 Sig. (单侧) y . .000 .000 .000 .000 .000 x1 .000 . .000 .000 .000 .000 x2 .000 .000 . .000 .000 .000 x3 .000 .000 .000 . .000 .000 x4 .000 .000 .000 .000 . .000 x5.000.000.000.000.000.由表16可得y 与自变量53412,,,,x x x x x 的相关系数都在0.9以上,说明y 与自变量53412,,,,x x x x x 之间高度相关;由表17可以看出样本决定系数20.992R =,复相关系数0.996R =,则表明回归方程对样本观测值的拟合程度较高,整体的34512,,,,x x x x x 与y 的线性相关性较高;再由表18可以看出:F=351.339,P 值=0.000,表明回归方程高度显著,说明53412,,,,x x x x x 整体上对y 有高度显著的线性影响,,但是仅凭相关系数的大小是不能决定变量的取舍的。