通径分析及其简单实现

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

通径分析及其简单实现

搜集变量资料是农业科学研究经常采用的方法,如:搜集作物的产量与其构成因素穗数、粒数、粒重等资料,研究这些变量的目的想知道这些变量之间的关系,许多人往往采用简单回归和相关或多元回归分析。但是,多元回归分析虽然在一定程度上能反映各个变量的真实关系,然而多元回归在分析偏回归系数时带有单位,使自变量对依变量的效应不能直接进行比较,从而不能比较各自变量的相对重要性。要解决这个问题,进行通径分析(即为通径系数的分析)是一个比较好的选择。然而令人感到棘手的是,面对繁杂的计算公式往往感到无从下手,下面从通径系数的概念入手,引出通径系数的求算方法,并利用SAS完成通径分析全过程。

1. 通径和通径系数的概念

1.1 通径

设依变量y和两个自变量x1、x2之间有如下关系:

x1

y

x2

图1 通径图

在图1 中“→”中表示变量间存在因果关系,箭头方向是原因到结果,称为通径。“”表示变量间存在相关关系,称为相关线,x1→y,x2→y为直接通径,由于x1,x2存在相关关系,又产生了两条间接通径,一条是x1是通过x2而作用于Y的通径,记作x1→x2→Y,一条是x2是通过x1而作用于y的通径,记作x2→x1→y。这种情况可以推广到i个自变量,并记直接通径为i→y(i=1,2,3····m),间接通径为i→j→y(i=1,2,3····m,i≠j ) ,但也可统一记作i→j→y,当i=j时为直接通径,i≠j时为间接通径。

1.2 通径系数

表示各条通径对于改变依变量的相对重要性的统计数就叫通径系数, 记作P i→j→Y 或简写为P ijY。通径系数的定义可以由偏回归系数导出。

例如水稻单株产量y(kg)与x1(穗数)、x2(单穗粒数)、x3(粒重)间存在着线性回归关系。其回归关系为:y=b0+b1x1+b2x2+b3x3,此式中b0为常数,b1、b2、b3分别表示y对x1,y对x2, y对x3的偏回归系数,偏回归系数是带有单位的,如b1、b2的单位分别为:kg/穗,kg/粒。所以不便于偏回归系数进行直接比较。所以常常将其标准化之后以便于消去单位,进行直接比较。下面进行回归方程的标准化:y=b0+b1x1+b1x2+b1x3 (1)

由(1)对y求平均数得:

y’=b0+b1x’1+b1x’2+b1x’3 (2)

用(1)式减(2)得:

y- y’= b1(x1- x’1)+ b2(x2- x2’)+ b3(x3- x3’) (3)

由(3)式除σy得:

(y- y’)/ σy = b1(x1- x1’)/σy + b2(x2- x2’) /σy+ b3(x3- x3’)/σy (4)

将(4)式做相应得恒等变换:

(y-y’)/σy= b1(σx1/σy)[(x1- x1’)/σx1]+ b2(σx2/σy)[(x2- x2’)/σx2]+ b3(σx3/σy)[(x3- x3’)/σx3] (5)

其中σy,σx1,σx2,σx3分别为y,x1,x2,x3的标准差,并令:∆y=(y-y’)/σy,∆x1= (x1- x1’)/σx1,∆x2 = (x2- x2’)/σx2,∆x3 = (x3- x3’)/σx3,∆y、∆x1、∆x2、∆x3即为变量y、x1、x2、x3的标准化,将(5)式

改写成下式:

∆y =b 1(σx1/σy )∙ ∆x 1+ b 2(σx2/σy ) ∙ ∆x 2 + b3(σx3/σy ) ∙ ∆x 3

则b 1∙(σx1/σy ),b 2∙(σx2/σy ),b 3∙(σx3/σy )为变量标准化后的偏回归系数,它是不带单位的相对数,这样就可以用以估计∆x 1,∆x 2,∆x 3对∆y 直接影响效应的大小,并比较其重要性。

因此通径系数的定义:

若相关变量y 与x 1、x 2 ······x k 间存在着直线回归关系,其回归方程为: y=b 0+b 1x 1+b 1x 2+ ······+b k x k ,则变量标准化后的各偏回归系数b 1∙(σx1/σy ),b 2∙(σx2/σy ),···,b k ∙(σxk /σy )分别为自变量x 1 x 2 ··· x k 对依变量的直接通径系数,即:P 1y = b 1∙(σx1/σy ),P 2y = b 2∙(σx2/σy ), ···, P ky = b k ∙(σxk /σy ),简言之,通径系数是变量标准化的各偏回归系数,用以表示相关变量因果关系的一个统计量。 2. 通径系数的类型

通径系数包括直接通径系数和间接通径系数两种类型。 2.1 直接通径系数

对于回归方程y= b 0+b 1x 1+b 2x 2+b 3x 3+…+b k x k ,则有x 1对y 的直接通径系数为P 1y =b1*δx 1/δy, x 2对y 的直接通径系数为P 2y =b1*δx 2/δy,x k 对y 的接通径系数为P ky =b1*δx k /δy,其中δx1、δx2、δy 分别为x 1 、x 2、 x k 的方差。 2.2 间接通径系数

由许多自变量影响着依变量,但是它们的重要性是不同的,其中一个自变量可能通过其它自变量对依变量起作用,这时可用间接通径系数来表示它。如x i 通过x j 对y 起作用,间接通径系数为:r ij P jy ,r ij 表示x i 和x j 之间的相关系数,P jy 表示x j 对y 的直接通径系数。 2.3 直接、间接通径系数和相关系数的关系

依据回归系数和通径系数的定义以及最小二乘法原理可得到:r ij = P iy + ∑r ij P jy (i ≠j ,i 、j=1,2,3….K ) 即:一个自变量对因变量的直接通径系数和间接通径系数的总和等于这个自变量与因变量之间的相关系数。例如:对

多元回归方程

y=bo+b 1x 1+b 2x 2+b 3x 3, 有r 1y =P 1y +r 12P 2y +r 13P 3y, r 2y =P 2y +r 21P 1y +r 23P 3y , r 3y =P 3y +r 3P 1y +r 32P 2y 。并可以得到表1:

表1 直接通径系数和间接通径系数表

注:斜体部分为直接通径系数,其它为间接通径系数。

3. 通径系数的性质

通径系数有以下几个性质:1)一个具有k 个自变量的反应系统,共有m 个直接通径系数和m(m-1)个间接通径系数。2)进行通径分析的基础是Y 和X i 都具有线性关系,而且Y 可以被线性分解。3)通径系数是具有向量的。如:X i 和Y 不可以互换,即:Piy ≠Pyi 。它的取值在实数范围内可以大于1或小于-1。4)通径系数是变量标准化的偏回归系数,它能够表示变量间的因果关系,故具有回归系数性质。5)通径系数不带具体单位,因而又具有相关系数的性质,表示原因与结果的相关关系。所以通径系数是介于回归系数和相关系数之间的一种统计量。6)通径系数可以表示某个自变量的相对重要性。

X1 X2 X3 Y X1 X2 X3

r11P1y r21P1y r31P1y

r12P2y r22P2y r32P2y

r13P3y r23P3y r33P3y

r1y r2y r3y

相关文档
最新文档