第九章通径分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二、通径系数与相关系数的关系
ˆ 对于y
=b0 +b1 x1
P0 .1
1 SPx1 y SS x1 b1 . / 0 SS x1 n 1
r x1 y r1 0 SS R SS y
SS y n 1
SPx1 y SS x1 SS y
d 0 .1
P021 .
r12 0
第九章 通径分析
在科学研究中常常要研究相关变量间的线性关系。 研究二个相关变量间的线性关系时可采用直线回归分 析与相关分析。 在研究多个相关变量间的线性关系时:如研究 y(单株 产量)与 x1(每株穗数)、x2(每穗粒数)、x3(粒重)的关系,可 采用多元线性回归分析与偏相关分析。还可以采用本章新 介绍的通径分析。通径分析具有精确、直观的优点,在遗 传育种学中,在分析相关变量关系中,有着十分重要的应 用。
2. 通径系数是标准化变量的偏回归系数,是没有单位的偏回归
3. 在一定条件下,通径系数是自变量与依变量之间的相关系 数;
4. 就通径系数所表示的因果关系来说,具有回归系数的性质;
就通径系数是不带有单位的相对数来说,又具有相关系数的性质。 所以可以说通径系数是兼有回归系数与相关系数性质的一个统 计量。
2b1
( x1 x1 )e ( x2 x2 )e 2b2 n 1 n 1
∵x1、x2 与 e 独立无关; Cov(x1, e)=0, Cov(x2, e)=0 得 σ
2 0
=b12σ
2 1
+b22σ
2 2
+σ e2+2b1b2 Cov(x1,x2)
(9-6)
12 22 e2 Cov( x1 , x2 ) 2 2 2 2 (9 6) 0 : 1 b1 b2 2 2b1 1 b2 2 2 0 1 2 0 0 0 0
证明(二) y y b1( x1 x1) b2 ( x2 x2 ) e (9-5)式平方、求和再除以(n-1):
(9-5)
2 2 ( y y ) 2 e2 ( x1 x1 )( x2 x2 ) 2 ( x1 x1 ) 2 ( x2 x2 ) b1 b2 2b1b2 n 1 n 1 n 1 n 1 n 1
1 2 x1 b2 x2 0 0
b1
1 0
b2
2 0
是变量标准化的偏回归系数,
分别表示x1、x2对y影响的相对重要程度和性质;
e 表示误差e对y影响的相对重要程度和性质, 0
分别称为 x1、x2、e到y的通径系数。
定义的推广: 若 =b0+b1x1+b2x2+b3x3 或 y=b0+b1x1+b2x2+b3x3+e rij≠0,通径图如(图 2-2)所示
r21 P0.1 P0.2 r2m P0.m r20 rm1 P0.1 rm2 P0.2 P0.m rm0
1 r12 r21 1 r r m1 m 2 r1m P0.1 r10 r2 m P0.2 r20 1 P0.m rm 0
表明,在直线回归分析中,x1 到 y 的通径系数 P0.1 在数量上等于 是因果关系,而相关系数表达的是平行关系。 在一定条件下,这个结论对于多元线性回归分析也成立。
x1 与 y 的相关系数 r10。但二者是有实质区别的,因为通径系数表达的
小结: 1. 通径系数是表示相关变量间因果关系的一个统计量; 系数;
(图 9-3)
证明(一): y y P x1 x1 P x 2 x 2 P e 0.1 0.2 0.e
(9 4)
x1 x1 ,求和,再除以(n-1): 1
0
1
2
e
(9-4)
( x1 x1 )( y y ) ( xwenku.baidu.com x1 ) 2 ( x1 x1 )( x 2 x 2 ) ( x1 x1 )e P0.1 P0.2 P0.e 2 (n 1) 0 1 (n 1) 1 2 (n 1) 1 e (n 1) 1
P0.e d0.e
又
d 0.1 d 0.2 d 0.12 (d 0.1
1 1 d 0.12 ) (d 0.2 d 0.12 ) 2 2
( P021 P0.1 r12 P0.2 ) ( P022 P0.1 r12 P0.2 ) . . P0.1 ( P0.1 r12 P0.2 ) P0.2 ( P0.2 r12 P0.1 ) P0.1 r10 P0.2 r20 SS R(标准化变量的回归平方和) R2
一、通径系数的定义
(一) 通径、相关线与通径图 设有三个相关变量:y, x1, x2, 其中 y—后果(依变量);x1、x2—原因(自变量)。若 x1、x2 相互独立(r12=0),可图示为 x1 y x2 若 x1、x2 彼此相关 (r12≠0),可图示为 x1 y x2 用 x1 x1 y x2 通径——箭形图中的单箭头“ 相关线——箭形图中的双箭头“ ” ,表示变量间呈因果关系,方向由原因到结果。 ” ,表示变量间呈平行关系。 一条相关线相当于两条尾端相联的通径。 x2 代替 x1 x2 x3,改画为 x3 例如 黄牛体重 胸围 体长 饲料 例如 子代 母本 父本 父、母无亲缘关系
3 e 1 2 则 P0.1 b1 , P0.2 b2 , P0.3 b3 , P0.e 0 0 0 0 x1 1 2 2 2 d 0.1 (b1 ) , d 0.2 (b2 ) x2 0 0 y x3 2 3 2 e d 0.3 (b3 ) , d 0.e 2 e 0 0 (图 9-2)
或
y=b0+b1x1+b2x2+e (2-1)
e (图 9-1) 其中 e y y, 且 e 0, e 0 。 表示这三个相关变量间关系的通径 ˆ 图见图(9-1)
由于b1、b2带有单位,不便于由b1、b2比较x1、x2对y 影响的重要程度。现将y, x1, x2, e用标准差标准化
“相关线”的相对重要程度和性质,也就是将“通径”、“相关
线”、“通径图”数量化。 表示“通径”相对重要程度和性质的数量叫通径系数。
表示“相关线”相对重要程度和性质的数量叫相关系数。
生物统计学已给出了计算相关系数的方法,即:若二相关变量 x1、x2 有 n 组观测值,则 x1 与 x2 的相关系数 r12 的计算公式为:
通径链指间接通径(包括直接通径)。 并定义通径链系数为组成该通径链的全部通径与相关 线系数的乘积。 表明:x1 与y 的相关系数r10 等于 x 1 与y 间的直接通径系数 P0.1 与间接通径系数 r12P0.2 之和,即 x1 与 y 的相关系数 r10 被剖分 为x1 对 y 的直接作用与 x1 通过 x2 对 y 的间接作用的代数和。 对 r20 =P0.2 +r21P0.1 可作同样分析。
通径图——表示相关变量间呈因果关系或平行关系的箭形图。
(二) 通径系数与决定系数 通过作通径图,形象直观地表达了相关变量间的关系,但这是定 性地表达。仅定性表达还不够,还须进一步用数量表示因果关系 中原因对结果影响的相对重要程度与性质,平行关系中变量间相 关的相对重要程度与性质。换句话说还须用数量表示“通径”与
yy x1 x1 , x x 2 x 2 , e e , x1 记 y 2 0 1 2 e
yˊ、x1ˊ、x2ˊ、eˊ为 y、x1、x2、x3、e 的标准化 y b1 1 x1 b2 2 x 2 e e 得 0 0 0 或 y b1 ˆ
,变为不带单位的相对数,再研究标准化变量的线性
关系。
由(9-1)得 y b0 b1 x1 b2 x2 (2-1)式- (2-2)式 (9-3)÷σ
(9-2) (9-3)
y y b1 ( x1 x1 ) b2 ( x 2 x 2 ) e
0
y ① : y b1 1 x1 x1 b2 2 x2 x2 e 0 0 1 0 2 0
cov( x1 , y )
0 1
P0.1 P0.2
cov( x1 , x2 )
1 2
P0.e
cov( x1 , e)
1 2
∵ x1 与 e 无关,Cov(x1, e)=0 ∴ r10=P0.1+r12P0.2 证毕。
同样可证
r20=P0.2+r21P0.1
通径分析:对于 r10 =P0.1 +r12P0.2 直接通径: x1 间接通径: x1 y x2 y P0.1 ——直接作用 r12 P0.2 ——间接作用
所以把 P 0.1r10, P0.2r20 分别称为 x1、x2 对回归可靠程度 R2 的总贡献。
d 0.e 1 (d 0.1 d 0.2 d 0.12 ) 1 SS R SS r
(SSr——标准化变量的离回归平方和,以后证明:SSy=1)
推广:若 y=b0+b1x1+b2x2+„+bmxm 或 y=b0+b1x1+b2x2+„+bmxm+e 且 rij≠0,通径图如(图 2-4)所示。 则(一) P 0.1 r12 P0.2 r1m P0.m r10 x1 x2 y ┆ xm e (图 9-4)
rx1 x2 SPx1 x2 / SSx1 SS x2 ( x1 x1)( x2 x2 ) / ( x1 x1)2 ( x2 x2 )2
下面给出通径系数的确切定义与数学表达式。 设 y 与 x1、x2 间存在线性关系
ˆ 回归方程: y =b0+b1x1+b2x2
x1 y x2
三、通径系数的性质
定理 1
若 yˆ =b0+b1x1+b2x2 或 y=b0+b1x1+b2x2+e y e
x1 x2
且 r12≠0,通径图如图(9-3)所示。 则 (一) r10=P0.1+r12P0.2 r20=P0.2+r21P0.1 (二) d 0.1 + d 0.2+d0.e+2 P0.1r12P0.2=1
即 d0.1+d0.2+d0.e+2P0.1r12P0.2=1 证毕。
2P0.1r12P0.2可当成是相关原因x1、x2共同对结果y的
相对决定程度,叫做相关原因x1、x2共同对结果y的决
定系数,记为d0.12,于是得
d0.1+d0.2+d0.12+d0.e=1 d0.e=1-(d0.1+d0.2+d0.12)
此为通径系数 P0.1、P0.2、„、P0.m 的正规方程组,其矩阵形式为:
若记正规方程组的系数矩阵为 R、未知元列向量为 P、常数项列向量为 B,则
P R 1 B
(二) d0.1 +d0.2 +„+d0.m+d0.12+„+d0.(m-1)m+d0.e=1 即
i 1
d 0 .i d 0 .ij d 0 . e 1
i j
m
而 所以
i 1
d 0 .i d 0 .ij R 2
i j
m
d 0.e 1 ( d 0.i d 0.ij ) 1 R 2
i 1 i j
m
从而有 P0.e d 0.e 。
将(一)改写为:
P0.1 r12 P0.2 r10 r21 P0.1 P0.2 r20
此为通径系数 P0.1 、P0.2 正规方程组,其矩阵形式为:
r12 P 0.1 r10 1 1 P 0.2 r 21 r 20