统计分析方法案例

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

中国民航客运量变化趋势及其原因

1、统计数据的收集与汇总

2、了解变化趋势

(1)绘制散点图

(2)配合趋势线——指数趋势方程

βx

e Y α=

lnY=lnα+βX

回归参数0.176表明,客运量的增量每年约按17.6%速度增长。

截距10-149表明,当年份为0时,客运量达到的水平,无实际意义。应将时间变量转化一下。

截距187.42 表明,当年份为0(1977年)时,客运量达到的水平(对数),有实际意义。

用该模型可以进行预测:

预测1994年客运量:(1)Y = 187.42e0.176X = 187.42e0.176×17 = 8.225

(2)Y =3734.43万人。

3、寻找影响因素

(1)受国民收入(X1)的影响

用国民收入也能预测民航客运量,但角度与时间变量不同。(2)与消费额(X

)的关系

2

(3)受铁路客运量(X3)的影响

结论:可决系数太小,表明铁路客运量(X3)与民航客运量(Y)无显著相关。

(4)与民航航线里程(X4)有关系

(5)受来华旅游入境人数(X5)的影响

(

4、建立多元回归方程

Y^ = 442.91 + 0.355166X1-0.56331X2-0.00715X3 +21.5794X4+0.434021X5 (国民收入) (消费额) (铁路客运量) (民航航线里程数) (境外来华人数) 对偏回归系数进行经济关系上的解释。

其中,

消费额(X2)与民航客运量(Y)的偏回归的关系有问题,方向应一致。

铁路客运量(X3)的偏回归系数接近于0,为0.00715,表明二者关系微弱。

5、拟合优度检验

回归统计

Multiple R0.999124

R Square0.998249

Adjusted R Square0.997374

标准误差49.23349

观测值16

复相关系数R=0.999124

可决系数R2= 0.998249

修正后的可决系数R2 = 0.99737

结论:整体上通过检验。

6、方差分析

方差分析

df SS MS F

回归分析51381913227638261140.222

残差1024239.372423.937

总计1513843372

给定α=0.05,查F0.05(k,n-k-1)= F0.05(5,16-5-1)= F0.05(5,10)= 3.33

F =1140.22 >F0.05(5,10)= 3.33

方差分析表明,以上回归方程高度显著,说明X1、X2、X3、X4、X5整体上对民航客运量有显著的影响。

8、t检验

Coefficients标准误差t Stat P-value

Intercept442.9106174.2649 2.5415930.029283

X10.3551660.084504 4.2029580.00182

X2-0.563310.124402-4.528160.001094

X3-0.007150.002018-3.543180.005328

X421.5794 4.006502 5.3860960.000307

X50.4340210.051088.496928 6.92E-06

Y^ = 442.91 + 0.355166X1-0.56331X2-0.00715X3 +21.5794X4+0.434021X5

(2.54) (4.20) (4.53) (3.54) (5.386) (8.497)

结论:通过t检验。

9、偏相关分析

X1X2X3X4X5Y

X11

X20.9989581

X30.2512760.2822781

X40.9836090.9778040.207221

X50.9301670.9422930.4967990.8817981

Y0.9894680.985490.2201360.9870920.9242211可见,X3对Y的影响不显著,因为其偏相关系数为0.2201。

10、剔除X3,重建回归方程。

SUMMARY OUTPUT

回归统计

Multiple R0.998023

R Square0.996051

Adjusted R Square0.994615

标准误差70.49803

观测值16

方差分析

df SS MS F Significance F

回归分析4137887023447176693.6005 3.91E-13

残差1154669.74969.972

总计1513843372

Coefficients标准误差t Stat P-value Lower 95%Upper 95%下限 95.0%上Intercept-153.9363.93406-2.407640.03476-294.648-13.2119-294.648

X10.5089380.103825 4.9019090.000470.2804220.7374550.280422

X2-0.75420.160562-4.697260.000653-1.1076-0.40081-1.1076

X415.98047 5.271891 3.0312590.011424 4.37710827.58383 4.377108

X50.3470770.064149 5.4104710.0002130.2058860.4882690.205886

RESIDUAL OUTPUT

观测值预测 Y残差标准残差

1254.7829-23.7829-0.39395

2297.13480.8652440.014332

3324.16818.832040.311939

4359.05641.944040.694772

5356.695688.30444 1.462699

6418.8283-27.8283-0.46096

7639.3119-85.3119-1.41313

8800.9855-56.9855-0.94392

9968.744728.25530.468028

101324.994-14.9945-0.24837

111455.114-13.1144-0.21723

121364.756-81.756-1.35423

131641.81618.184030.301205

相关文档
最新文档