通径分析(PathAnalysis)--简介
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
zˆ 3 p z 31 1 p32 p z 21 1 p31 p p 32 21 z1 (2')
年龄
P21
-0.295
P31
0.053
收入
上学
P32
0.196
根据标准化回归系数分解,收入 与年龄的实际关系为: 0.003=0.053+(-0.295*×0.196)
=0.053-0.057
• 为此,人们用协方差除以各自的标准差Sx和 Sy,得到没有实际单位的相对量值r,称为相 关系数
r
xy
(x x)(y
nsx sy
y)
1 n
(x x)
sx
(
y y)
sy
1 n
zx
zy
• 也即:相关系数就是两个变量z分数之积的 平均数
模型1
e1
z1 p31
p21
z3
z2 p32
注意: 1、直接效应为正, 间接效应为负。相 互抵消 , 总效应值很小——虚假无关
2、标准化回归系数不考虑符号 3、存在计算误差
2、以不同通径传递的间接影响
zˆ 2 p z 21 1 zˆ 3 p z 31 1 p32z2
zˆ 4 p41z1 p42z2 p43z3
(1) (2)
x1
p21
p31
x3 x2 p32
(1)代入(2):
xˆ 3 a3 p x 31 1 p32 a2 p x 21 1
a3 p x 31 1 p a 32 2 p32p x 21 1
a3 p32a2 p31 Байду номын сангаас p p 32 21 x1
8.613 0.045income
Coefficientsa
(C o nstant)
B 8.614
INC O ME
.045
a. Dependent Var iable: CDR
两种方式的优缺点
标准化系数
优点: 1、通径方程简单; 2、有可比性。
但是,标准化系数有特定样本(sample specific)的性质,不能用于不同 情况或不同总体之间的比较。因为,标准化系数所反映的不仅是自变量对 因变量的影响强度,而且还反映了模型中各变量的方差以及它们之间的协 方差,以及寓于误差项之内的未包括在模型中的那些变量的方差。
通径模型的结构方程组
zzˆˆ 32
p21z1 p31z1
p32 z 2
第二节 通径模型的设置
通径模型既可以用结构方程组的形式来表示,也可 以用通径图来表示
为了表达和分析上的简明,一般在通径分析中采用 标准化的变量,并按照因果序列给出相应的下标
{ z2=p21z1 z3=p31z1+p32z2
第一节 因果模型与通径分析
因果关系模型明确设置自变量和因变量,通过模 型分析,检查自变量对因变量的作用方向、作用 强度和解释能力。
简单回归系数是一个自变量对因变量作用的“毛” 测量(gross measure) 多元分析的偏回归系数则是自变量作用的一种 “净”测量(net measure) 通径分析的主要功能之一是将毛作用分解为直接 作用(相当于上述的净作用)和各种形式的间接 作用,使我们对整个模型系统中变量的因果关系 有更为具体的深入理解
通径分析的特点
• 通径分析的目的:分解回归系数(或相关系数)
• 通径分析可视为多环节的一组回归分析。 • 通径模型代表理论假设。
通径分析的有关概念:
1、通径(path)、通径系数 (如P32) 2、相关关系(略) 3、外生变量(exogenous variable) 4、内生变量(endogenous variable) 5、误差(error) (略) 6、最终结果变量(ultimate response variable)
zˆ 4 p41z1 p42z2 p43z3
(1) (2) (3)
(2)代入(3) :
z1
p41
p31 p21
p43
z3
z4
p32
p42
z2
zˆ 4 p41z1 p42z2 p43(p31z1 p32z2 ) (p41 p43p31 )z1 (p42 p43p32 )z2 (3')
非标准化的系数
优点: 1、实际意义明确的测量单位; 2、系数值在不同情况保持相对稳定,可用于不同总体中比较。
但是,各变量的非标准化系数之间不能相互比较。另外,采用非标准 化系数时,通径分析分解工作量将变得比较大。
5、用列表法报告各种影响作用分解
z1
p*41=0.7
z2
p*42= -0.1
(1) 简化模型
即由模型中没有注明
它的变化是由什么因
素造成的
z1
2、另一类是内生变
量,即由模型中另外
一些变量所影响的那
些变量 z2 z3 此外,我们可以将通
径模型内不影响其他
变量的内生变量称为
最终结果变量 z3
第三节 通径模型的分类
递归模型:因果关系结构中全部为单向 链条关系、无反馈作用的模型
通径模型— 递归 与 非递归
a. 两个变量直接反馈 b. 某些变自反馈
c. 某些变量间接循环
非递归结构类型示意
z1
z2
z1
p22
z3
z2
z1
z3
z2
通径模型— 递归 与 非递归
递归通径分析假定条件和基本性质
递归通径模型分析的假定条件
通径模型中各变量之间的关系为线性、可加的因果关系
重要 内生变量的误差项不得与其前置变量(或其他内生变量
p43=0.5
z4
模型 (2)
符号
系数值
p41 p43p31 p*41
p42
p43p32 p*42 p43
0.3 0.4 0.7 0.2 -0.3 -0.1 0.5
例
人均GDP
-0.718
人均国内生产总值
TFR 总和生育率
通径图
p31
z1
人均GDP
p21
e3
节育率
z3
p43
p41
p32
z2
p42
z1
p21
p3
1
z3
z2
p32
式(2’)为式(2)的简化形模型。 括号内各项代数和=z3和z1的简单 回归系数
最终反应变量完全以某 一个外生变量的函数的 形式来加以描述
包括直接影响和间接 影响
总效应 = 直接效应 + 间接效应
(简单回归系数) (直接计算的偏回归系数)(通径系数的乘积)
例题
• 当我们考察个人年收入与年龄的关系
与回归分析的异同
x1
by1.2
y
x2
by2.1
图1 多元回归模型因果关系示意图
各个自变量被假设处于 相同的地位,多元回归 分析得到的回归系数 (或标准化的回归系数) 表示在控制其他自变量 的条件下每个自变量对 于因变量单独的净作用
z1
p21
p31
z2
z3
p32
图2 通径模型的因果结构示意图
但是,往往变量之间 的因果作用是更复杂 的传递过程,一个变 量对于某些变量可能 是原因变量,而对于 另外一些变量则可能 是结果变量
(2')
old 2.391 0.907income
(1)
CDR 7.874 0.235income 0.309old
(2)
CDˆ R 7.874 0.309 2.391 0.235 0.309 0.907income 7.874 0.739 0.235 0.280income
e3 e2
模型2
e1
z1 p31 z3
z2 p32 e3
e2
模型3
e1
z1 p31 z3
z2 p32 e3
e2
模型1
e1
z1 p31
p21
z3
z1
p31=0.8
z3
p32=-0.6
z2
p41=0.3 p42=0.2
z4
p43=0.5
z4
(2) 原模型
两个外生变量的简化形和原模型
作用分解表
变量 x1
x2
x3
作用类型
直接作用 间接作用
总作用 直接作用 间接作用
总作用 直接作用
p31=0.8
z1
p32=-0.6
z3
p41=0.3
z2
p42=0.2
一、相关系数r的计算原理
• 定距变量之间的相关是从两个变量共变的角 度来界定的
•
•
(x x)( y y)
•
n
是两个变量以平均数为
基准的平均共变程度指标,称为协方差,也
称一致性度量
• 但是,因为x、y都是具有一定测量单位的绝 对量值,所以,协方差也是一个绝对量值, 无法直接表示x、y之间的相关
(1) (2) (3)
(1)代入(2): zˆ 3 p31z1 p32 p z 21 1 p31 p p 32 21 z1
z1
p41
p31 p21
p43
z3
z4
p32
p42
z2
(2')
(1)(2’)代入(3):zˆ 4 p41z1 p42 p21z1 p43 p31 p p 32 21 z1 p41 p p 42 21 p p 43 31 p p p 43 32 21 z1
误差项)相关
模型中因果关系必须为单向,不得包括各种形式的反
馈作用
模型中各变量均为间距测度等级 各变量的测量不存在误差
第四节 分解简单回归系数
主要功能
1、计算一个自变量对最终反映变量的直接影响、间接影响、 总影响。
2、在间接影响中还可以分解出以不同通径传递的间接影响。 3、在控制某些变量的条件下,完成上面两项工作。 4、统计检验:包括对各通径的检验,以及对过度识别模型
第三章 通径分析(Path Analysis)
第一节 因果模型与通径分析 第二节 通径模型的设置 第三节 通径模型的分类 第四节 分解简单回归系数 第五节 分解简单相关系数 第六节 通径模型的整体检验 第七节 研究实例
参见郭志刚主编,《社会统计分析方法—SPSS软件应用》
第五章
中国人民大学出版社1999
初中及以 上比例
e2
总和生
z4 育率
e4
0.248
z1
0.772
0.975
z3
-0.376
-0.301
-0.035
z4
z2
0.636
e2
-0.431
0.529
e4
各因素的影响
Ö±½Ó Ó°Ïì Z1 -0.301
Z2 -0.431 Z3 -0.376
¼ä ½Ó Ó°Ïì
× Ü Ó°Ïì
-0.416
• 1、可以直接计算相关系数r=0.003
• 2、我们认为年龄不仅直接影响收入,还跟 教育有关,而教育也影响收入,于是我们 考虑有变量关系:
结构方程: 上学=p21年龄 收入=p31年龄+p32上学
年龄 p21
p31 上学
收入 p32
对结构方程求解(spss) 上学=-0.295年龄 收入=0.053年龄+0.196上学
(over-identified model)的整体检验。
1、计算一个变量对最终反应变量的各种影响
如,结构方程组 (1)代入(2)后:
zˆ 2 p21z1 zˆ 3 p31z1 p32z2
(1) (2)
zˆ 3 p31z1 p32 p z 21 1 p31 p p 32 21 z1 (2')
(3')
直接效应
间接效应
从一个简单回归模型到一个有较多中间变量的通径分析模型,外生变量 对最终结果变量的总影响不变
• 其实质做法与前面并无差别,只不过模型 更复杂而已!
3、在控制某些变量的条件下的总影响的分解工作
通径分析中的控制,指控制变量处被阻断以后,原因变量还能发挥哪些作用
zˆ 2 p z 21 1 zˆ 3 p z 31 1 p32z2
-0.717
=0.772*(-0.431)+
0.248*(-0.376)+
0.772*(-0.035)*(-0.376)
0.013=(-0.035)*(-0.376) -0.418
-0.376
第五节 分解简单相关系数的通径分析
在分解相关系数时,不仅要考虑内生变量的误 差项,而且还要考虑外生变量的误差项 两个标准化的变量之间的相关系数等于其未标 准化之前的原变量之间的相关系数,同时也等于 标准化的回归系数
z1
p31
p21
p32
z3
z2
在通径图中以通径 (即图中那些带有箭 头的直线)表达因果 关系。 对于因果关系的强度, 是用通径系数来表达 的,如p21 为了区别不同通径系 数,一般用该通径箭 头所指的结果变量的 下标作为通径系数的 第一下标,而用该通 径的原因变量下标作 为通径系数的第二下 标。
1、一类是外生变量,
不经过z2的效应
经过z2的效应
分解的目的:将z2的作 用集中表达,这就是控 制,看看抽离了z2影响 后,z1的影响构成情况
式(3’)在通径分析中称为偏简化式(partial reduced form)。
4、标准化与非标准化的通径系数
非标化回归
xˆ 2 a2 p21x1 xˆ 3 a3 p31x1 p32x2
年龄
P21
-0.295
P31
0.053
收入
上学
P32
0.196
根据标准化回归系数分解,收入 与年龄的实际关系为: 0.003=0.053+(-0.295*×0.196)
=0.053-0.057
• 为此,人们用协方差除以各自的标准差Sx和 Sy,得到没有实际单位的相对量值r,称为相 关系数
r
xy
(x x)(y
nsx sy
y)
1 n
(x x)
sx
(
y y)
sy
1 n
zx
zy
• 也即:相关系数就是两个变量z分数之积的 平均数
模型1
e1
z1 p31
p21
z3
z2 p32
注意: 1、直接效应为正, 间接效应为负。相 互抵消 , 总效应值很小——虚假无关
2、标准化回归系数不考虑符号 3、存在计算误差
2、以不同通径传递的间接影响
zˆ 2 p z 21 1 zˆ 3 p z 31 1 p32z2
zˆ 4 p41z1 p42z2 p43z3
(1) (2)
x1
p21
p31
x3 x2 p32
(1)代入(2):
xˆ 3 a3 p x 31 1 p32 a2 p x 21 1
a3 p x 31 1 p a 32 2 p32p x 21 1
a3 p32a2 p31 Байду номын сангаас p p 32 21 x1
8.613 0.045income
Coefficientsa
(C o nstant)
B 8.614
INC O ME
.045
a. Dependent Var iable: CDR
两种方式的优缺点
标准化系数
优点: 1、通径方程简单; 2、有可比性。
但是,标准化系数有特定样本(sample specific)的性质,不能用于不同 情况或不同总体之间的比较。因为,标准化系数所反映的不仅是自变量对 因变量的影响强度,而且还反映了模型中各变量的方差以及它们之间的协 方差,以及寓于误差项之内的未包括在模型中的那些变量的方差。
通径模型的结构方程组
zzˆˆ 32
p21z1 p31z1
p32 z 2
第二节 通径模型的设置
通径模型既可以用结构方程组的形式来表示,也可 以用通径图来表示
为了表达和分析上的简明,一般在通径分析中采用 标准化的变量,并按照因果序列给出相应的下标
{ z2=p21z1 z3=p31z1+p32z2
第一节 因果模型与通径分析
因果关系模型明确设置自变量和因变量,通过模 型分析,检查自变量对因变量的作用方向、作用 强度和解释能力。
简单回归系数是一个自变量对因变量作用的“毛” 测量(gross measure) 多元分析的偏回归系数则是自变量作用的一种 “净”测量(net measure) 通径分析的主要功能之一是将毛作用分解为直接 作用(相当于上述的净作用)和各种形式的间接 作用,使我们对整个模型系统中变量的因果关系 有更为具体的深入理解
通径分析的特点
• 通径分析的目的:分解回归系数(或相关系数)
• 通径分析可视为多环节的一组回归分析。 • 通径模型代表理论假设。
通径分析的有关概念:
1、通径(path)、通径系数 (如P32) 2、相关关系(略) 3、外生变量(exogenous variable) 4、内生变量(endogenous variable) 5、误差(error) (略) 6、最终结果变量(ultimate response variable)
zˆ 4 p41z1 p42z2 p43z3
(1) (2) (3)
(2)代入(3) :
z1
p41
p31 p21
p43
z3
z4
p32
p42
z2
zˆ 4 p41z1 p42z2 p43(p31z1 p32z2 ) (p41 p43p31 )z1 (p42 p43p32 )z2 (3')
非标准化的系数
优点: 1、实际意义明确的测量单位; 2、系数值在不同情况保持相对稳定,可用于不同总体中比较。
但是,各变量的非标准化系数之间不能相互比较。另外,采用非标准 化系数时,通径分析分解工作量将变得比较大。
5、用列表法报告各种影响作用分解
z1
p*41=0.7
z2
p*42= -0.1
(1) 简化模型
即由模型中没有注明
它的变化是由什么因
素造成的
z1
2、另一类是内生变
量,即由模型中另外
一些变量所影响的那
些变量 z2 z3 此外,我们可以将通
径模型内不影响其他
变量的内生变量称为
最终结果变量 z3
第三节 通径模型的分类
递归模型:因果关系结构中全部为单向 链条关系、无反馈作用的模型
通径模型— 递归 与 非递归
a. 两个变量直接反馈 b. 某些变自反馈
c. 某些变量间接循环
非递归结构类型示意
z1
z2
z1
p22
z3
z2
z1
z3
z2
通径模型— 递归 与 非递归
递归通径分析假定条件和基本性质
递归通径模型分析的假定条件
通径模型中各变量之间的关系为线性、可加的因果关系
重要 内生变量的误差项不得与其前置变量(或其他内生变量
p43=0.5
z4
模型 (2)
符号
系数值
p41 p43p31 p*41
p42
p43p32 p*42 p43
0.3 0.4 0.7 0.2 -0.3 -0.1 0.5
例
人均GDP
-0.718
人均国内生产总值
TFR 总和生育率
通径图
p31
z1
人均GDP
p21
e3
节育率
z3
p43
p41
p32
z2
p42
z1
p21
p3
1
z3
z2
p32
式(2’)为式(2)的简化形模型。 括号内各项代数和=z3和z1的简单 回归系数
最终反应变量完全以某 一个外生变量的函数的 形式来加以描述
包括直接影响和间接 影响
总效应 = 直接效应 + 间接效应
(简单回归系数) (直接计算的偏回归系数)(通径系数的乘积)
例题
• 当我们考察个人年收入与年龄的关系
与回归分析的异同
x1
by1.2
y
x2
by2.1
图1 多元回归模型因果关系示意图
各个自变量被假设处于 相同的地位,多元回归 分析得到的回归系数 (或标准化的回归系数) 表示在控制其他自变量 的条件下每个自变量对 于因变量单独的净作用
z1
p21
p31
z2
z3
p32
图2 通径模型的因果结构示意图
但是,往往变量之间 的因果作用是更复杂 的传递过程,一个变 量对于某些变量可能 是原因变量,而对于 另外一些变量则可能 是结果变量
(2')
old 2.391 0.907income
(1)
CDR 7.874 0.235income 0.309old
(2)
CDˆ R 7.874 0.309 2.391 0.235 0.309 0.907income 7.874 0.739 0.235 0.280income
e3 e2
模型2
e1
z1 p31 z3
z2 p32 e3
e2
模型3
e1
z1 p31 z3
z2 p32 e3
e2
模型1
e1
z1 p31
p21
z3
z1
p31=0.8
z3
p32=-0.6
z2
p41=0.3 p42=0.2
z4
p43=0.5
z4
(2) 原模型
两个外生变量的简化形和原模型
作用分解表
变量 x1
x2
x3
作用类型
直接作用 间接作用
总作用 直接作用 间接作用
总作用 直接作用
p31=0.8
z1
p32=-0.6
z3
p41=0.3
z2
p42=0.2
一、相关系数r的计算原理
• 定距变量之间的相关是从两个变量共变的角 度来界定的
•
•
(x x)( y y)
•
n
是两个变量以平均数为
基准的平均共变程度指标,称为协方差,也
称一致性度量
• 但是,因为x、y都是具有一定测量单位的绝 对量值,所以,协方差也是一个绝对量值, 无法直接表示x、y之间的相关
(1) (2) (3)
(1)代入(2): zˆ 3 p31z1 p32 p z 21 1 p31 p p 32 21 z1
z1
p41
p31 p21
p43
z3
z4
p32
p42
z2
(2')
(1)(2’)代入(3):zˆ 4 p41z1 p42 p21z1 p43 p31 p p 32 21 z1 p41 p p 42 21 p p 43 31 p p p 43 32 21 z1
误差项)相关
模型中因果关系必须为单向,不得包括各种形式的反
馈作用
模型中各变量均为间距测度等级 各变量的测量不存在误差
第四节 分解简单回归系数
主要功能
1、计算一个自变量对最终反映变量的直接影响、间接影响、 总影响。
2、在间接影响中还可以分解出以不同通径传递的间接影响。 3、在控制某些变量的条件下,完成上面两项工作。 4、统计检验:包括对各通径的检验,以及对过度识别模型
第三章 通径分析(Path Analysis)
第一节 因果模型与通径分析 第二节 通径模型的设置 第三节 通径模型的分类 第四节 分解简单回归系数 第五节 分解简单相关系数 第六节 通径模型的整体检验 第七节 研究实例
参见郭志刚主编,《社会统计分析方法—SPSS软件应用》
第五章
中国人民大学出版社1999
初中及以 上比例
e2
总和生
z4 育率
e4
0.248
z1
0.772
0.975
z3
-0.376
-0.301
-0.035
z4
z2
0.636
e2
-0.431
0.529
e4
各因素的影响
Ö±½Ó Ó°Ïì Z1 -0.301
Z2 -0.431 Z3 -0.376
¼ä ½Ó Ó°Ïì
× Ü Ó°Ïì
-0.416
• 1、可以直接计算相关系数r=0.003
• 2、我们认为年龄不仅直接影响收入,还跟 教育有关,而教育也影响收入,于是我们 考虑有变量关系:
结构方程: 上学=p21年龄 收入=p31年龄+p32上学
年龄 p21
p31 上学
收入 p32
对结构方程求解(spss) 上学=-0.295年龄 收入=0.053年龄+0.196上学
(over-identified model)的整体检验。
1、计算一个变量对最终反应变量的各种影响
如,结构方程组 (1)代入(2)后:
zˆ 2 p21z1 zˆ 3 p31z1 p32z2
(1) (2)
zˆ 3 p31z1 p32 p z 21 1 p31 p p 32 21 z1 (2')
(3')
直接效应
间接效应
从一个简单回归模型到一个有较多中间变量的通径分析模型,外生变量 对最终结果变量的总影响不变
• 其实质做法与前面并无差别,只不过模型 更复杂而已!
3、在控制某些变量的条件下的总影响的分解工作
通径分析中的控制,指控制变量处被阻断以后,原因变量还能发挥哪些作用
zˆ 2 p z 21 1 zˆ 3 p z 31 1 p32z2
-0.717
=0.772*(-0.431)+
0.248*(-0.376)+
0.772*(-0.035)*(-0.376)
0.013=(-0.035)*(-0.376) -0.418
-0.376
第五节 分解简单相关系数的通径分析
在分解相关系数时,不仅要考虑内生变量的误 差项,而且还要考虑外生变量的误差项 两个标准化的变量之间的相关系数等于其未标 准化之前的原变量之间的相关系数,同时也等于 标准化的回归系数
z1
p31
p21
p32
z3
z2
在通径图中以通径 (即图中那些带有箭 头的直线)表达因果 关系。 对于因果关系的强度, 是用通径系数来表达 的,如p21 为了区别不同通径系 数,一般用该通径箭 头所指的结果变量的 下标作为通径系数的 第一下标,而用该通 径的原因变量下标作 为通径系数的第二下 标。
1、一类是外生变量,
不经过z2的效应
经过z2的效应
分解的目的:将z2的作 用集中表达,这就是控 制,看看抽离了z2影响 后,z1的影响构成情况
式(3’)在通径分析中称为偏简化式(partial reduced form)。
4、标准化与非标准化的通径系数
非标化回归
xˆ 2 a2 p21x1 xˆ 3 a3 p31x1 p32x2