多变量统计分析

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

教育与声望,在性别、种族、地区等条 件下的表现。
• 阐释分析的不足
– 通过控制第三类变量(控制变量或中介变量), 将样本分组,在每组中计算X和Y的关系,结果 会产生几个分组的相关系数值。虽然这样的分 析可以比较各种条件下X与Y的关系,但分析过 程较复杂,分组的结果可能与原结果存在很大 差异,甚至相反,得出的结果难以进行比较。 – 如果有一个统计值能综合和简化所有的分组相 关,将之与原结果做比较,问题就清楚和简单 多了。 – 偏相关解决的就是这一问题。
一、阐释模式(祥析分析)
• 什么是阐释模式
– 关心两变量因果关系,通过引进并控制第三变 量,来进一步了解和探讨原来两变量之间关系 性质的统计分析方法。包括因果分析、阐明分 析和条件分析。
• 因果分析
– 看自变量X和因变量Y之间是否存在因果关系, 做法是引入其他变量(如W,又称为第三变 量),看是否由于其他变量的出现,X和Y的关 系发生了变化。 – 引入和控制第三变量后,X和Y之间的关系,原 则上有三种可能
• 完全阐明,即X是完全通过T影响Y的 • 部分阐明,即X是部分通过T影响Y的 • 不能阐明,即X是不通过T影响Y的
• 例子 调查500名35岁以下育龄妇女的生育意愿,发 现文化程度X越高的妇女,愿意生育的子女数Y越 少,相关系数为G=-0.82。 如果引入“自我发展意愿T”这个变量,我们可 能会给出一种解释:文化程度越高的的妇女,自 我发展意愿越强,因为生育和养育孩子会花费很 多时间,所以愿意生育的子女数目就少。 为了证明这种说法,控制T,结果发现,自我 生育意愿高的妇女的文化程度与生育意愿的关系 是-0.65,自我发展意愿低的妇女的文化程度与生 意意愿的关系是-0.45.二者都低于-0.82. 结论:文化程度高的妇女,生育意愿较低,在 一定程度上受自我发展意愿的影响。
二、偏相关
• 偏相关分析
– 又叫净相关分析,就是以一个相关系数值表示控制了 第三个变量后X和Y的相关程度的分析方法。
• 逻辑
– 如果以r表示原相关程度,rp表示控制第三个变量后的 偏相关系数,则在因果分析中,如果rp=0则表示X与Y 是虚假相关;如果rp=r则表示X与Y的关系可能是真实相 关;如果rp≠0,且rp<r则表示二者是部分真实相关。 – 同理,在阐明分析中,如果rp=0则表示X通过T对Y完全 阐明; rp=r 则表示X不是通过T对Y有影响,即不能阐 明; rp≠0,且rp<r表示X通过T部分对Y进行阐明。 – 条件分析的目的是比较不同情况下X与Y的关系,不宜 采用偏相关分析
例子
文化程度与妇女生育意愿的关系是否存在城乡 差异? 如果发现城市妇女的文化程度与生育意愿的关 系是G=-0.78,农村的是G=-0.76,二者相差不大。 再分析不同年龄段妇女的文化程度与生育意愿 的关系,发现55岁以上妇女中,文化程度与生育 意愿的关系是G=-0.18,45-55岁者的是G=-0.68,35 岁以下者的为G=-0.89. 可见:年龄在妇女文化程度和生育意愿中起的 作用远大于城乡的影响,也就是说文化程度与生 育意愿在不同的条件是表现出不同的情况。
除此之外,生育意愿还可能受“社会意识”的 影响(如优生优育、计划生育政策)。如果我们 引入社会意识这一变量后,社会意识高低不同的 两类妇女,其文化程度与生育意愿的关系分别是0.15和-0.25. 可以看出,在控制社会意识后,X和Y虽然有 关系,但相关程度明显降低,可见,“社会意识” 的解释力更强。 因此,阐明分析不仅可以检验某种假设是否正 确,还可以比较不同理论中哪一种更为有效。
操作
• 教育年限与声望,引入职业类型
• 条件分析
– 在不同情况下(引入条件变量)X与Y的关系是 否会有所不同? – 方法:根据条件变量取值,将样本分组,然后 在每种条件下分析X与Y的关系。 – 两种结果:
• 在各种条件下,X和Y的关系大致相同,就表示X和 Y的关系是普遍的,稳定的; • 在各种条件下,X和Y有不同的关系,则表示X和Y 的关系是有条件的。
偏相关的SPSS操作
1.依次单击分析-相关-偏相关 2.选择要Байду номын сангаас行相关分析的变量 3.确定显著性检验的类型
• 4.是否显示显著性水平 • 5.选择选项后,继续 • 选择零阶相关, 会在输出结果中显示 参与统计的变量的 两两相关矩阵。 6.确定,输出结果
操作
• 职业类型、声望、教育
没控制职业类别 前,相关系数是 0.52, 控制后是.342, 说明声望除受教 育影响外,还收 职业的影响。
• 不管W变量如何取值,X和Y之间的关系消失,说明 二者是虚假相关,二者关系可能是W引起的。 • 不管W变量如何取值,X和Y之间的关系的关系维持 现状,则表明二者之间的关系可能是真实的。 • X和Y之间的关系有关系,但相关程度减弱,说明X 和Y之间的因果关系可能是真实的,但也受到W的影 响。
例子
已有研究:性别与工作/家庭冲突的关系是 λ=0.22. 假设性别与工作/家庭冲突的关系,可能受文 化程度(第三变量)的影响。 进一步分析文化程度高低不同的男女青年的性 别与工作/家庭冲突: 文化程度较高的青年中,性别与工作/家庭冲 突的关系是λ=0.20;文化程度较低的青年中, λ=0.23. 结论:由于这两个值与原相关关系λ=0.22非常 接近,可以认为性别与工作/家庭冲突的关系可能 是真实的。
但是,如果文化程度较高的青年中,性 别与工作/家庭冲突的关系是λ=0.12;文化 程度较低的青年中,λ=0.26,说明二者的 关系部分是由于文化程度的影响导致的。
操作
• 如教育年限和声望,引入性别,r值变化不 大。 • 引入职业类型,r值变小。
• 阐明分析
– 探讨因果关系的作用方式或作用 途径。即当X 与Y相关时,通过引进并控制第三变量(如T, 主要指中介变量),以判明X是否通过第三变量 对Y产生影响。 – 逻辑:X的变动影响了T,T的变动会引起Y的变 动。如果控制T,使之不变,但X变Y不变,则T 是X和Y的关键因素,即X通过T影响了Y;如控 制T,X变Y也变,则T是无关紧要的因素,即X 不是通过T影响Y的。 – 第三变量T的作用
相关文档
最新文档