第二讲 通径分析解析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(2—2)
(2—2)式中b0为常数项,b1 ,b2 分别为y对x1 ,x2 的偏回归系数,e为与各变 量相互独立的误差项(或剩余项)。x1 ,x2 间存在相关,则(2—2)式的关系可 用图1示之。
图1 通径图
图1中,单箭头表示自变量间存在因果关系,方向由原因到结果,称为通径。双 箭头表示变量间存在平行关系,称为相关线,
S x2 Sy
2
2b1
S x1 Sy
b2
S x2 Sy
COV12 S x 1 S x2
1
(2—7)
(2—7)式中b1 Sx1/Sy,b2 Sx2/Sy为标准偏回归系数,也叫通径系数, 分别记作Py.1 ,Py.2 ,用来表示x1,x2对y影响的相对重要性。由于是 不带单位的相关系数,故可直接用于比较对结果影响的大小。
Py.e d y.e
对于(2—1)式,为求b1,b2可得下列两个方程:
SS1b1+SP12b2=SP1y
(2—11)
SP21b1+SS2b2=SP2y
(2—12)
先对以上两式的各项除以n-1后,(2-11)式再除以Sx1Sy,(2-12)
式除以Sx2Sy可得:
b1
S x1 Sy
S x1 S x1
COV21 S S x1 x2
b1
COV12 S S x1 x2
b2
S x1 Sy
b2
S x2 Sy
S x2 Sy S x2 S x2
COVy1 S x1 S y
COVy2 S x2 S y
即: Py.1 +r12Py.2=r1y
r21Py.1+ Py.2=r2y
(2—13) (2—14)
(2-13)式中,Py.1为x1对y的直接作用;r12Py.2为x1通过x2对y的间接 作用,即x1与y的相关系数r1y可剖分为x1对y的直接作用和x1通过x2对y的 间接作用。类似的(2—14)式也是将x2与 y的相关系数r2y剖分为x2对y 的直接作用Py.2和 x2通过x1对y间接作用r21Py.1 。
通径系数的平方称为决定系数,表示各原因对结果相对的决定程度
即:
d y1
Py21
b1
Sx1 Sy
2
d y2
Py22
b2
Sx2 Sy
2
因为 r12 SP12
SSx1 SSx2
SP12 n 1
SSx1 SSx2 COV12 (n 1)(n 1) Sx1 Sx2
所以(2—7)式可改写成
若不考虑误差项e,(2—2)式可改写成为: y= b0+b1x1+b2x2
(2—3)
其中: b0 y b1 x1 b2 x2 y b0 b1 x1 b2 x2
(2—4)
将(2—3)式减(2—4)式可得:
y y b1 (x1 x1 ) b2 (x2 x2 )
(2—5)
将(2—5)式两边平方后求和,并遍除以n-1,可得:
(2—10)
m
m
d y.i d y.ij 1
i 1
i j
其中
d y.i
P2 y.i
, dy.ij=2Py.i Py.j rij
来自百度文库
(i,j=1,2,…,m,i<j )
若考虑误差项e,则 ∑dy.i+∑dy.ij≠1,而把 1-∑dy.i-∑dy.ij叫作误差对结 果y的决定系数,记为dy.e。如果dy.e 的绝对值较大,说明可能还有一些 对结果影响较大的原因未被考虑进去。显然,误差项到y的通径系数:
(2—1)
( y y)2 n 1
b12
(x1 x1 )2 n 1
b22
(x2 x2 )2 n 1
2b1b2
( x1
x1 )( x2 n 1
x2 )
即
S
2 y
b12
S
2 x1
b22
S
2 x2
2b1b2COV12
(2—6)式两边同除以
S
2 y
得:
(2—6)
b1
S x1 Sy
2
b2
dy.1+dy.2+2 Py.1 Py.2 r12=1
(2—8)
其中2 Py.1 Py.2 r12可以看成相关原因x1 ,x2 共同对结果y的相对决定程度,称
为相关原因x1 ,x2 共同对结果y的决定系数,记为dy.12 ,所以(2—8)式又可
写成:
dy.1+dy.2+dy.12=1
(2—9)
由(2—9)式可推广到一般,即,如果相关变量x1 ,x2…,xm,y间存在线
第一节 通径分析的基本原理
一、通径分析的基本原理与性质
为叙述方便,先讨论两个原因(自变量)x1 ,x2 及结果(依变量)y三个相 关变量,后再推广至一般。假设x1 ,x2 与y间存在线性关系,则x1 ,x2与y的回 归方程为:
yˆ b0 b1 x1 b2 x2
(2—1)
或 y=b0+b1x1+b2x2+e
性关系,复回归方程为:
y= b0+b1x1+b2x2+…+bmxm 且x1 ,x2,…,xm两两相关,即r12≠0,r13≠0,…,rm-1, m≠0,不考虑e时,则 x1 ,x2…,xm对结果y 的决定系数之和加上两两相关原因共同对结果y的决定系 数等于1,即 :
dy.1+dy.2+…+dy.m+dy.12+dy.13+…+dy.m-1 m=1 简写为:
第二讲 通径分析
PATH ANALYSIS
❖ 第一节 通径分析的基本原理
❖ 一、通径分析的基本原理与性质 ❖ 二、通径分析的基本步骤
❖ 第二节 实例分析
❖ 一、通径系数的计算 ❖ 二、通径分析的显著性检验 ❖ 三、逐步通径分析
第二讲 通径分析
PATH ANALYSIS
在生物界中,数量性状间的关系往往是彼此相关的。从统计学上讲,研究多 个相关变量间的关系,可根据相关变量间是因果关系或平行关系,采用不同的统 计分析方法。若变量间互为因果而呈平行关系时,多采用相关分析。若变量间因 果分明,多采用多元线性回归分析。如第一讲中因果分明,产蛋率为果,各环境 参数为因。然而,相关变量内的这两种分析方法都存在一定的局限性。如简单相 关系数固然可以用来度量两变量间的相关密切程度。但其中也包含有其他相关变 量对它们的影响。因此,多少包含有虚伪的成分了。尤其在分析原因对结果作用 方面。相关系数无法表明。就此而言,多元回归分析中的偏回归系数,在一定程 度上可指出各原因对结果的直接作用,但因带有不同单位,故不能直接比较各原 因对结果的作用大小,即使单位相同,若各原因(自变量)的变异度(标准差) 不同,也是无法比较的。何况偏回归系数也不能解释与其他相关原因共同对结果 的作用。为此,1921年S·Wright发表了一篇“相关与相关原因”的论文,文中对 相关系数进行剖分,找出了用来表明各原因对结果所起直接作用大小的统计量, 即通径系数。之后,该方法不断得到应用和完善,成为具有直观、精确等特点的 一种重要分析方法。