侯家骥123统计学第二次作业(总)

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

相关。 用 excel 计算:
地区 GDP(亿元) 地区 GDP(亿元) 居民消费水平(元) 居民消费水平(元)
1 0.726439006 1
r=0.726,说明地区 GDP 与居民消费水平之间存在正相关关系,0.5<r<0.8,相关程度为 中度相关。 通过散点图可判断出变量之间存在相关关系,并对变量间的关系形态作出大致描述, 通过样本相关系数计算,可判断出变量之间存在中度的正相关关系。
������1 = 0.32028,������2 = 6146.97,������ = 6146.97 + 0.32028������,回归系数������1 = 0.32028,表 示地区 GDP 每增加 1 亿元,居民消费水平平均增加0.32028元。
3 计算判定系数和估计标准误差,并解释其意义。 手工计算:
F=
SSR/1
=
yi − y
2
/1
=
21921840.36 ≈ 5.5868 19619327.35/5
5.将手工计算结果与 Excel 分析输出结果相对照。 人工计算结果 相关系数(r) 回归方程(yi = β0 + β1 xi ) 判定系数(R ) 估计标准误差(se ) F值
2
Excel 分析输出结果 0.726439006 ������ = 6146.970854 + 0.320277521������ 0.527713629 1980.874925 5.586797139
2
������ ������ =1 ������ ������
������
=
77613 7
= 11087.57
相关系数r =
(x −������ ) (y −������ ) (x −������ ) (y −������ )
2
= 94221800.28 ≈ 0.726
68446390 .92
0<r<1, 说明地区 GDP 与居民消费水平之间存在正相关关系, 0.5<r<0.8 相关程度为中度
六、解:设销售量为 q,零售价格为 p,计算过程见下表: 产品名 称 甲 乙 丙 计量 单位 件 套 台 销售量 2011 q0 2000 500 1000 2012 q1 3000 500 2000 p0 200 1000 1000 单价 2011 2012 p1 180 1000 600 2011 p0q0 400000 500000 1000000 销售额(元) 2012 p1q1 540000 500000 1200000 p0q1 600000 500000 2000000
SUMMARY OUTPUT 回归统计 Multiple R R Square Adjusted R Square 标准误差 观测值 方差分析 Significance df 回归分析 残差 总计 1 5 6 SS 21921840.37 19619327.34 41541167.71 Upper Coefficients Intercept 地区 GDP 6146.970854 0.320277521 标准误差 2220.292437 0.135501782 t Stat 2.768541094 2.363640653 P-value 0.039433411 0.06445914 Lower 95% 439.5274451 -0.028040899 95% 11854.41 0.668596 下限 95.0% 439.5274 -0.02804 上限 95.0% 11854.41426 0.66859594 MS 21921840.37 3923865.468 F 5.586797139 F 0.06445914 0.726439006 0.527713629 0.433256355 1980.874925 7
所以以 2011 年为基期的 2012 年销售量综合指数为
Iq= IP=
������ 0������ 1 3100000 ������ 0������ 0 1900000
2
=
SSE = MSE = n−2
19619327.35 = 1980.87 7−2
意义:根据地区 GDP 来估计居民消费水平时,平均的估计误差为 1980.97 元。 用 excel 计算: 利用 Excel 数据分析工具中的【回归】可得输出结果:
SUMMARY OUTPUT 回归统计 Multiple R R Square Adjusted R Square 标准误差 观测值 方差分析 Significance df 回归分析 残差 总计 1 5 6 SS 21921840.37 19619327.34 41541167.71 Upper Coefficients Intercept 地区 GDP 6146.970854 0.320277521 标准误差 2220.292437 0.135501782 t Stat 2.768541094 2.363640653 P-value 0.039433411 0.06445914 Lower 95% 439.5274451 -0.028040899 95% 11854.41 0.668596 下限 95.0% 439.5274 -0.02804 上限 95.0% 11854.41426 0.66859594 MS 21921840.37 3923865.468 F 5.586797139 F 0.06445914 0.726439006 0.527713629 0.433256355 1980.874925 7
居民消费水平(元)
14000 12000 10000 8000 6000 4000 2000 0 0 5000 10000 15000 20000 25000
地区GDP(亿元)
手工计算相关系数:
x =
������ ������ ������
=
107981.99 7
= 15426.00,������ =
2.地区 GDP 作自变量,居民消费水平作因变量,利用最小二乘法求出估计的回归方程,并 解释回归系数的实际意义。 手工计算: ������1 = ������
������ ������ =1 ������������
������������ − −
������ ������ =1 ������������ ������ ������ =1 ������������
可见, t 双尾临界值为±2.06 > ������������ /2 = ±1.96, 落在拒绝域内, 拒绝������0 ,即两种方法有显著差 异。 五. 解:请分别采用手工计算和 Excel 的方法: 1.绘制散点图,并计算相关系数,说明二者之间的关系。
地区GDP与居民消费水平
18000 16000
2 2
=1−
y i −y i y i −y
≈ 52.77%
意义: 在居民消费水平取值的变差中, 有 52.77%可以由居民消费水平与地区 GDP 之间的 线性关系来解释,或者说,在居民消费水平取值的变动中,有 52.77%是由地区 GDP 所决 定的,也就是说居民消费水平取值的差异有一半以上是由地区 GDP 决定,居民消费水平 与地区 GDP 有中度相关线性关系。 估计标准误差: se = yi − yi n−2
Upper 95% 11854.41 0.668596
95.0% 439.5274 -0.02804
上限 95.0% 11854.41426 0.66859594
(1) R Square=(Multiple R) ,即相关系数的平方=判定系数 (2) 回归和残差的均方 MS=总平方和 SS/自由度 df (3) F 统计量=MSR/MSE,即平均回归方差/均方残值,MS1/MS2 (4)MS 一列:MSR=SSR/n
4.验回归方程线性关系的显著性(
) 。
提出假设:H0 :β1 = 0,两个变量之间的线性关系不显著 H1 :β1 ≠ 0 ,两个变量之间的线性关系显著 手工计算统计检验量 F
SSE/(n − 2) yi − yi 2 /(n − 2) 作出决策:当α = 0.05时,查表可得F0.05 1,5 = 6.608>F,不拒绝H0 ,没有证据表明地区 GDP 和居民消费水平之间的线性关系是显著的。 用 excel 计算: 由 3 中利用 【回归】 分析工具得出的输出结果中, 可得到 F=0.06445914>0.05, 不拒绝H0 , 没 有证据表明地区 GDP 和居民消费水平之间的线性关系是显著的。
侯家骥
2011212116
2011212101
二、
甲公司业务流量图
30 25 20 15 10 5 0 40 30
乙公司业务流量图
户数
户数
15以上
20 10 0
Mo手机上网业务流量(MB)
0--5
5--10
10--15
0--5
5--10
10--15
Mo手机上网业务流量(MB)
15以上
四、 用 excel 进行假设检验,如图所示,属于双样本异方差的 t 检验,原假设������0 :������1 − ������2 = 0; 备择假设������1 :������1 − ������2 ≠ 0
0.726 ������ = 6146.9307 + 0.3203������ 0.5277 1980.87 5.5868
由上表可得,人工计算结果的精确度与 excel 分析输出的结果略有不同,但差距不 大,并不影响对数据的分析判断,分析所得的结论均一致。
6.
SUMMARY OUTPUT 回归统计 Multiple R R Square Adjusted R Square 标准误差 观测值 方差分析 Significance df 回归分析 残差 总计 1 5 6 SS 21921840.37 19619327.34 41541167.71 下限 Coefficients Intercept 地区 GDP 6146.970854 0.320277521 标准误差 2220.292437 0.135501782 t Stat 2.768541094 2.363640653
MSE=SSE/n-2 (5)Significance F= P-value:Significance F 用于检验的显著性 F,即为 p 值,用于与 α进行大小比较,以判断两变量之间的是否存在显著的线性关系。P 值越小越拒绝原假设 (6)Coefficients 一列:Inetercept:截距,即为������0 = 6146.9709 地区 GDP:回归方程中的系数������1 = 0.32028 (7)Lower95%=下限 95%:置信区间的下限 Upper95%=上限 95%:置信区间的上限
2
0.726439006 0.527713629 0.433256355 1980.874925 7
MS 21921840.37 3923865.468
F 5.586797139
F 0.06445914
P-value 0.039433411 0.06445914
Lower 95% 439.5274451 -0.028040899
SST= ������������ − ������ 2 =41541167.71,SSR= ������������ 2 = 19619327.35
判定系数:R2 =
SSR SST
������������ − ������
2 2
2
= 21921840.36,SSE=
������������ −
=
y i −y y i −y
������
������ 2 ������ =1 ������������
������ ������ =1 �����பைடு நூலகம்������ 2
=
479124736.4 = 0.3203 1495967421
������2 = ������ − ������1 ������ = 11087.57 − 15426 × 0.3203 = 6146.62 即居民消费水平对地区 GDP 的估计方程为������ = 6146.62 + 0.3203������。回归系数 ������1 = 0.3203,表示地区 GDP 每增加 1 亿元,居民消费水平平均增加0.3203元。 用 excel 计算: 利用 Excel 数据分析工具中的【回归】可得输出结果:
相关文档
最新文档