7通径分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
41
对如下结果的一些讨论
42
其中,对r13的讨论中值得注意的地方:也分解为直 接作用、间接作用;下标排列表达的阶段性、传递 性。凡下标序号可以连接起来的都是间接作用。 r23:分解回归系数时不曾涉及的新内容。也分解为 两个部分(为什么?)p31p21是我们不曾涉及的新 内容。下标无法连接起来,且在对应的通径模型中 也找不到其他间接作用的通径链条。我们称之为伪 相关(spurious correlation)。如何产生的?共同 的原因变量z1所引起的。z1变化引起z2、z3同时变 化,而产生伪相关。
14
通径系数(path coefficient )
通径图直观、形象地表达了相关变量间的关 系,仅定性地表达还不够,还须进一步用数 量表示因果关系中原因对结果影响的相对重 要程度与性质、平行关系中变量间相关的相 对重要程度与性质,也就是必须用数量表示 “通径”与“相关线”的相对重要程度与性 质。
15
6
通径图与模型
多变量统计分析是研究变量之间有相互联 系、影响或有相关性的学科。最方便而又 直观地表示变量间相互关系的方法是用通 径图。
7
8
通径分析与回归分析
相比回归分析,通径分析的统计分析能力更为强大, 它可进一步确定多元回归系数与简单回归系数之间 的数量关系。 简单回归系数是一个自变量对因变量作用的“毛” 测量(gross measure);多元分析的偏回归系数 是自变量作用的一种“净”测量(net measure)。——但影响作用有正负之分,故自变 量的毛作用不一定大于其净作用,二者的数量关系 可千变万化。回归分析对此无法分析、评价 。
10
通径模型
{
z2=p21z1 z3=p31z1+p32z2
一般采用标准化变量,并按因果序列给 出相应的下标。
11
z1与z2之间的箭头:表示z1对z2有作用(即 构成一种因果关系);p21则表示这种作用
强度的大小,称为通径系数。当然这只是 在一条作用线上谈因果关系,在整个模型 中却不能这样说。所以在通径分析中通常 不用y来作为变量名,而是据因果链条以序 号将变量定名。
对第一种情形的讨论
可能是没有控制共同的原因变量。若找 到一个同时影响z1、z2的z3,重新设置的 模型就成为递归模型。
23
小结
非递归模型的参数检验过程非常复杂、 甚至无解,难以检验。这里分析针对的 主要是递归模型。
24
递归模型的基本性质
所有递归模型均可识别,唯如此才可能 确定有意义的通径模型联立方程组中的 通径系数解。 递归模型的假设条件允许采用最小二乘 法回归,来获得联立方程组中各系数的 无偏估计,所得的(偏)回归系数即相 应的通径系数。
43
偏相关与通径分析中的伪相关分 析有何区别?
作为判断因果关系的必要条件之一,偏相关 分析只能通过控制伪相关的方法来得到净相 关;而通径分析对应相关系数的分解却能进 一步直接将相关系数分解为因果关系和伪相 关两部分,并对这两部分的大小进行比较。
44
45
相关系数的分解
可能产生的四种类型的组成部分: (1)直接作用 (2)间接作用 (3)由于原因变量相关而产生的未析部分 (unanalyzed part) (4)由于共同原因的存在而产生的伪相关部 分
25
递归通径模型分析的假设条件
(1)各变量间的关系为线性、可加的因果关 系。 (2)每一内生变量的误差项与其前置变量不 得相关,同时也不得与其他内生变量的误差 项相关。 (3)模型中因果关系必须为单向,不得包括 各种形式的反馈作用。 (4)模型中各变量均为间距测定等级。 (5)各变量的测量不存在误差。
46
通径模型的调试、检验
模型的调试只限于递归模型。 真正能检验的是非饱和模型;饱和模型无法 进行整体检验。 注意回归系数的实际意义以及多重共线性问 题。 纯粹数理统计检验与真正意义上的理论检验 之间的区别。 对单个方程进行的回归分析检验不等于对整 个模型的检验。
47
模型的识别
模型中的通径系数能否完全以相关系数 来表达,这是模型的基本性质 对这一性质的判断在通径分析中即称为 模型的识别(identification) 所谓“识别”,即判断模型参数是否可 以被估计出来
9
通径分析与回归分析
而通径分析的主要功能之一即将毛作用分解 为直接作用(类似于净作用)和各种形式的 间接作用,使我们对变量关系获得更为具体、 深入的理解。 通径分析不仅能分解简单回归系数,而且可 分解简单相关系数。二者常交织在一起,不 过,后者更具一般方法论意义。变量间是否 存在相关和偏相关,常被作为检验因果关系 的必要条件之一。
35
用列表法报告各种影响作用的分 解
36
37
分解简单相关系数的通径分析
与分解简单回归系数的不同:分解相关 系数时,不仅要考虑内生变量的误差项, 而且还要考虑外生变量的误差项。
38
以第一个模型为例
39
此时对应的联立方程组应为
40
由这一模型出发,通过一系列的计算可以证明在 通径分析中可以将标准化系数用作为通径系数, 因为对于两个标准化的变量而言,其回归系数、 标准化回归系数、相关系数完全相等。通径分析 描述的是两两变量之间的关系,没有中间省略过 程,因此可以完整表达整个模型系统的内在联系。
4
更加复杂的因果模型
一个变量对于某些变量是原因变量(cause/ predictor variable),而对于另外一些变量可 能是结果变量(response variable)。此时的 因果结构模型不能用简单的自变量或因变量 的概念来划分因果类型。
5
在研究多个相关变量间的线性关系 时,除了可以采用多元线性回归分 析和偏相关分析,还可以采用通径 分析(path analysis)。
28
计算一个变量对最终反应变量的 各种影响
对于z2=p21z1 ,z3=p31z1+p32z2 直接代入,即可得:
z3=p31z1+p32 (p21z1)=(p31+p32p21) z1
可以看出,括号中是z1对z3的总影响系数, 可分解为两项,第一项是是z1对z3的直接 影响,第二项是间接影响。
29
48
(1) 恰好通径图:通径图中独立未知参数(包括隐变 量的方差、残差的方差) 的个数恰好与样本中所 能得出的方程组的个数相等。 (2) 识别不足通径图:通径图中独立未知参数的个 数多于样本中所能得出的方程组的个数。因为 这时参数的解有无限多组,即解很不确定,这是不 能允许的。 (3) 过度识别通径图:通径图中独立未知参数的个 数少于样本中所能得出的方程组的个数。统计 学家偏爱这种模型,因为人们可以在待估的参数 上附加不同的条件以使所求得的参数满足统计 49 学要求。
13
通径模型中对变量的分类
按可否直接测量到该变量,变量可分为“表 型变量”(Manifest Variable ,也称显变量,它 总是用一个方框去识别它) 、及隐型变量 (Latent Variable ,它总是用一个圆形框去识 别它) 。 这里的隐型变量(即隐变量) 是无法直接测 量到的,它应当是客观存在的。
第二种情况
18
非递归通径模型的四种情况
第三种情况
19
非递归通径模型的四种情况
第四种情况:ቤተ መጻሕፍቲ ባይዱ每一内生变量的误差项 是否与其他项目有关。这又分如下两种 情形:(1)一结果变量的误差项与其原 因变量相关;(2)不同变量间的误差项 之间存在相关。
20
第四种情况的情形(1)
21
第四种情况的情形(2)
22
33
此表达式在通径分析中称为偏简化式 (partial reduced form)。此时也可理解为 是z5对z1和z2的回归方程,即,在控制条件 下,z1和z2各自对z5的净影响。两个括号中 的内容又可理解为标准化的偏回归系数。
34
标准化和非标准化的通径系数
前面所述均采用标准化的变量(截距为0), 但通径分析也可采用非标准化的变量。 标准化与非标准化系数各自的优劣比较。
12
通径模型中对变量的分类
外生变量(exogenous variable):模型中没有注明 其变化是什么因素造成的,也不准备讨论这一点。 可以一个,也可多个。外生变量之间可以有相关关 系,用双箭头直线或曲线表示:←--→ r12 内生变量(endogenous variable):模型中由另外 一些因素影响的变量。其变化由模型中外生变量或 其他内生变量所决定,但有可能部分由模型外的因 素所决定,通常由同下标的e来表示,作为该变量的 误差。
26
分解简单回归系数的通径分析
主要功能
分解过程详析
27
主要功能
一、计算一个变量对最终反应变量的直接影响和 间接影响,以及作为两者之和的总影响。 二、间接影响中,还可分解出不同通径传递的间 接影响。 三、在控制某些变量的条件下,完成上述两项工 作。 四、对通径模型进行检验,包括多通径的检验、 对过度识别模型(overidentified model)的检 验。
以不同通径传递的间接影响
30
对应的结构方程组为:
31
代入计算,可以得到z5以z1表示的简化型:
直接影响与总间接影响(共七项)合起来就 是总影响。这个总影响实质上是z5对z1简单回 归的标准化系数。
32
控制某些变量的条件下的总影响 的分解工作
通径分析中的控制,实际上是在分析如 果控制变量处被阻断以后,原因变量还 能发挥哪些作用。如上例,以z2为控制变 量,那么凡是经z2发出或传递的影响都要 表达为z2的函数,其他的影响则表达为z1 的函数。简单代入计算即可得此表达式:
通径模型的两个基本类型
递归通径模型(recursive model):因果关 系结构中全部为单向链条关系,无反馈作用 的模型。注意:误差独立。 非递归通径模型(nonrecursive model): 如果包括如下四种情况,则为非递归模型。
16
非递归通径模型的四种情况
第一种情况
17
非递归通径模型的四种情况
51
2 2 2 2 R c = 1 − (1 − R (1) )(1 − R (2) )…(1 − R (p) )
通径分析
1
主要内容
通径图与模型 模型系数的分解 递归通径模型与非递归通径模型
通径模型的识别(或称确认 与检验 通径模型的识别 或称确认)与检验 或称确认
2
回顾多元回归方程
3
多元回归方程:
反映自变量、因变量之间的直接关系, 无法反映因素之间的间接关系;而现实 中变量之间往往是错综复杂的关系。换 言之,多元回归模型仍是一种比较简单 的因果关系模型,其所假设的因果关系 不存在多环节的因果结构,虽有多个自 变量,但各个自变量对因变量的作用被 假设为是并列的。
50
对过度识别模型的整体检验
用饱和模型作为基准2 2 2 2 R t = 1 − (1 − R (1) )(1 − R (2) )…(1 − R (p) ) 模型时的检验 H0: pa=pc=pf=0 2 1− Rc Q= n为样本规模;d为检 1− R2 t 验模型与饱和模型的 通径数目之差,即形 2 1− Rc 成检验模型时从饱和 = −(n − d) ln Q = −(n − d) ln W 1− R2 t 模型中删除的通径数 目。