一般线性回归分析案例
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(2)
表8 回归系数及显著性检验表
系数a
模型
非标准化系数 标准系 t 数
Sig.
B 标准 试用版
误差
(常 量)
1.528 1.474
1.037 .309
1 fe
.030 .003 .915 10.570 .000
ca -.041 .020 -.184 -2.124 .043
a. 因变量: y(g)
相关性 零阶 偏
.026 -.006 -.421 .000 .879 .888 .305 .305 .201
表5用方差分析对每个因变量做了偏回归分析,是关于回归系数及显著 性检验的计算结果如下: 在表中,常数项的t的显著性概率0.364大于0.05,表示常数项与0没有 显著性差异,它不应出现在方程中。 钙含量的t的显著性概率0.026小于0.05,表示钙含量的系数与0有显著 性差异,钙含量应作为解释变量存在于方程中。 铁含量的t的显著性概率0.000小于0.05,表示钙含量的系数与0有显著 性差异,钙含量应作为解释变量存在于方程中。 铜含量的t的显著性概率0.305大于0.05,表示铜含量的系数与0有显著 性差异,铜含量应作为解释变量存在于方程中。 由此可见,钙含量和铁含量可以作为解释变量在方程中来解释血红蛋白 含量的变化,而铜含量则应该被剔除。
(血红蛋白单位为g;钙、铁、铜元素单位为ug)
case 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
y(g) 7.00 7.25 7.75 8.00 8.25 8.25 8.50 8.75 8.75 9.25 9.50 9.75 10.00 10.25 10.50 10.75 11.00 11.25 11.50
a. 因变量: y(g)
表6中,最大特征值为2.969,其余依次快速减小。第三列各个条件指数 均不大,可认为多重共线性较弱。 图1:
图1是残差正态性的图形结果,可以看到参数围绕基准线仍存在一定规 律性。
图2 回归方程标准化预测值与标准化残差散点图
图2表明,不存在明显的异方差现象。 最终的回归方程为: Z=-0.184X+0.915Y 其中,Z表示儿童梅100毫升血中的血红蛋白的含量,单位为g; X表示儿童每100毫升血中钙元素的含量,单位为ug; Y表示儿童每100毫升血中铁元素的含量,单位为ug。 方程表明,铁元素含量与血红蛋白含量存在正相关,而钙元素含量与血 红蛋白含量存在负相关性,由此,当人体内血红蛋白浓度偏低时,就需 要补充铁元素,减少钙元素的摄入量,铜元素则没有显著性影响。
一般线性回归分析案例
1、案例
为了研究钙、铁、铜等人体必需元素对婴幼儿身体健康的影响,随 机抽取了30个观测数据,基于多员线性回归分析的理论方法,对儿童体 内几种必需元素与血红蛋白浓度的关系进行分析研究。这里,被解释变 量为血红蛋白浓度(y),解释变量为钙(ca)、铁(fe)、铜(cu)。
表一 血红蛋白与钙、铁、铜必需元素含量
3 37.196 37.743 .000b
1
残 差
25.623
26 .986
总 计
137.210
29
a. 因变量: y
b. 预测变量: (常量), cu, fe, ca。
表4是用方差分析对整个回归方程做了显著性检验,其中F=37.743,对 应的概率P值近似为0。若显著性水平ᵅ为0.05,则因概率小于ᵅ,拒绝回 归方程显著性检验的原假设,即回归系数不同时为0,解释变量全体与 被解释变量存在显著的线性关系,选择线性模型具有合理性。
表7 回归方差分析表(2)
Anovaa
模型 平方和 df 均方 F Sig.
回 归
110.506
2 55.253 55.865 .000b
1
残 差
26.704
27 .989
总 计
137.210
29
a. 因变量: y(g)
b. 预测变量: (常量), ca, fe。
由表7看出,F值由原来的37.743上升为55.865,F值越大越好,表明整 体回归效果更好。
2、回归分析
表2 变量说明表
输入/移去的变量a
模 输入的 移去的 方法
型 变量 变量
cu, 1 fe, cab
. 输入
a. 因变量: y
b. 已输入所有请求的变量。
表2说明了应变量和自变量及自变量进入方程的情况
表3 模型总体参数表(1)
模型汇总b
模
R R 方 调整 R 标准 估
型
方 计的误差
1 .902a .813 .792
284.00 1.400
313.00 1.034
293.00 1.044
293.10 1.322
260.00 1.1ห้องสมุดไป่ตู้7
331.21 0.900
388.60 1.023
326.40 0.823
343.00 0.926
384.48 0.869
410.00 1.190
446.00 1.192
440.01 1.210
模型
(常 量)
表5 回归系数及显著性检验表(1)
系数a
非标准化系数 标准系 t 数
Sig.
相关性
B 标准 试用版 误差
零阶 偏 部分
1.368 1.479
.925 .364
1 ca fe
-.050 .029
cu
.930
a. 因变量: y
.021 -.223 -2.370 .003 .888 9.846 .888 .103 1.047
420.06 1.361
383.31 0.915
449.01 1.380
20 11.75 55.10 406.02 1.300 21 12.00 61.42 395.68 1.142 22 12.25 87.35 454.26 1.771 23 12.50 55.08 450.06 1.012 24 12.75 45.02 410.63 0.899 25 13.00 73.52 470.12 1.652 26 13.25 63.43 446.58 1.230 27 13.50 55.21 451.02 1.018 28 13.75 54.16 453.00 1.220 29 14.00 65.00 471.12 1.218 30 14.25 65.00 458.00 1.000
.879 .897 -.006 -.378
部分
表7 多重共线性检验的特征值及条件指数
共线性诊断a
模维 型数
1
特征 条件索 值引
2.969 1.000
方差比例
(常 fe ca 量)
.00 .00 .00
12
.021 12.016 .01 .72 .47
3
.010 17.185 .99 .28 .53
ca 76.90 73.99 66.50 55.99 65.49 50.40 53.76 60.99 50.00 52.34 52.30 49.15 63.43 70.16 55.33 72.46 69.76 60.34 61.45
fe
cu
295.30 0.840
313.00 1.154
350.40 0.700
将铜含量从解释变量中剔除再次做回归分析,的到如下分析结果:
表6 模型总体参数表(2)
模型汇总b
模 R R 方 调整 R 标准 估
型
方 计的误差
1 .897a .805 .791
.995
a. 预测变量: (常量), fe, ca。
b. 因变量: y(g)
自变量减少了一个“铜”含量后,R方由0.813变为0.805,由此可见, 去掉铜元素含量后,线性回归方程中的自变量对因变量的影响变化不 大;
.993
a. 预测变量: (常量), cu, fe, ca。
b. 因变量: y
由表3可知,相关系数R为0.902,说明自变量与因变量有比较好的相关 性。R方为0.813,接近于1,说明总体回归效果较好。++++
表4 回归方差分析表(1)
Anovaa
模型 平方和 df 均方 F Sig.
回 归
111.587