统计分析方法案例
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中国民航客运量变化趋势及其原因
1、统计数据的收集与汇总
2、了解变化趋势
(1)绘制散点图
(2)配合趋势线——指数趋势方程
βx
e Y α=
或
lnY=lnα+βX
回归参数0.176表明,客运量的增量每年约按17.6%速度增长。
截距10-149表明,当年份为0时,客运量达到的水平,无实际意义。应将时间变量转化一下。
截距187.42 表明,当年份为0(1977年)时,客运量达到的水平(对数),有实际意义。
用该模型可以进行预测:
预测1994年客运量:(1)Y = 187.42e0.176X = 187.42e0.176×17 = 8.225
(2)Y =3734.43万人。
3、寻找影响因素
(1)受国民收入(X1)的影响
用国民收入也能预测民航客运量,但角度与时间变量不同。(2)与消费额(X
)的关系
2
(3)受铁路客运量(X3)的影响
结论:可决系数太小,表明铁路客运量(X3)与民航客运量(Y)无显著相关。
(4)与民航航线里程(X4)有关系
(5)受来华旅游入境人数(X5)的影响
数
(
客
运
4、建立多元回归方程
Y^ = 442.91 + 0.355166X1-0.56331X2-0.00715X3 +21.5794X4+0.434021X5 (国民收入) (消费额) (铁路客运量) (民航航线里程数) (境外来华人数) 对偏回归系数进行经济关系上的解释。
其中,
消费额(X2)与民航客运量(Y)的偏回归的关系有问题,方向应一致。
铁路客运量(X3)的偏回归系数接近于0,为0.00715,表明二者关系微弱。
5、拟合优度检验
回归统计
Multiple R0.999124
R Square0.998249
Adjusted R Square0.997374
标准误差49.23349
观测值16
复相关系数R=0.999124
可决系数R2= 0.998249
修正后的可决系数R2 = 0.99737
结论:整体上通过检验。
6、方差分析
方差分析
df SS MS F
回归分析51381913227638261140.222
残差1024239.372423.937
总计1513843372
给定α=0.05,查F0.05(k,n-k-1)= F0.05(5,16-5-1)= F0.05(5,10)= 3.33
F =1140.22 >F0.05(5,10)= 3.33
方差分析表明,以上回归方程高度显著,说明X1、X2、X3、X4、X5整体上对民航客运量有显著的影响。
8、t检验
Coefficients标准误差t Stat P-value
Intercept442.9106174.2649 2.5415930.029283
X10.3551660.084504 4.2029580.00182
X2-0.563310.124402-4.528160.001094
X3-0.007150.002018-3.543180.005328
X421.5794 4.006502 5.3860960.000307
X50.4340210.051088.496928 6.92E-06
Y^ = 442.91 + 0.355166X1-0.56331X2-0.00715X3 +21.5794X4+0.434021X5
(2.54) (4.20) (4.53) (3.54) (5.386) (8.497)
结论:通过t检验。
9、偏相关分析
X1X2X3X4X5Y
X11
X20.9989581
X30.2512760.2822781
X40.9836090.9778040.207221
X50.9301670.9422930.4967990.8817981
Y0.9894680.985490.2201360.9870920.9242211可见,X3对Y的影响不显著,因为其偏相关系数为0.2201。
10、剔除X3,重建回归方程。
SUMMARY OUTPUT
回归统计
Multiple R0.998023
R Square0.996051
Adjusted R Square0.994615
标准误差70.49803
观测值16
方差分析
df SS MS F Significance F
回归分析4137887023447176693.6005 3.91E-13
残差1154669.74969.972
总计1513843372
Coefficients标准误差t Stat P-value Lower 95%Upper 95%下限 95.0%上Intercept-153.9363.93406-2.407640.03476-294.648-13.2119-294.648
X10.5089380.103825 4.9019090.000470.2804220.7374550.280422
X2-0.75420.160562-4.697260.000653-1.1076-0.40081-1.1076
X415.98047 5.271891 3.0312590.011424 4.37710827.58383 4.377108
X50.3470770.064149 5.4104710.0002130.2058860.4882690.205886
RESIDUAL OUTPUT
观测值预测 Y残差标准残差
1254.7829-23.7829-0.39395
2297.13480.8652440.014332
3324.16818.832040.311939
4359.05641.944040.694772
5356.695688.30444 1.462699
6418.8283-27.8283-0.46096
7639.3119-85.3119-1.41313
8800.9855-56.9855-0.94392
9968.744728.25530.468028
101324.994-14.9945-0.24837
111455.114-13.1144-0.21723
121364.756-81.756-1.35423
131641.81618.184030.301205