【IBM-SPSS课件】路径分析
(完整版)第二讲_spss路径分析
第二讲路径分析11路径分析与回归分析之间的异同回归分析中变量的因果关系是不存在多环节的因果结构,自变量对于因变量的作用是并列存在的路径分析可以考察复杂的因果结构,某个变量对于其中一些变量来说是原因变量,对于另外一些变量来说就是结果变量路径分析可以将变量之间的作用分解成直接作用和间接作用,使人们对于变量之间的因果关系有更深入的了解2路径分析概述2.1路径分析的源起遗传学家Sewall Wright于1918- 1921年间在考察遗传和环境在双色猪(Guinea-Pig)的毛色遗传中所起的作用时首次提出。
2.2路径分析的几个概念外生变量,内生变量外生变量:在模型中只是作因的变量,有箭头指向别的变量但没有箭头指向它内生变量:作果的变量,有别的箭头指向它递归模型,非递归模型全部是单向链条,无反馈作用存在直接反馈作用,自反馈作用,间接循环作用或误差与变量相关模型的恰好识别,超识别和无法识别变量之间的路径系数能否完全用相关系数来表达(已知相关系数的个数与待求路径系数的个数的关系)路径系数某个自变量对其因变量的直接效果,也就是其标准回归系数(Beta),标于相应路径上路径系数的估计及检验与标准回归系数的估计及检验相同路径图Z仁elPPT的内容整理而成1本讲义是根据文剑冰老师《高级心理统计》课程系列整理人:胡杨E-mail: huyang200606@126 comZ2=P21Z1+e2Z3=P31Z1+P32Z2+e3Z4=P41Z1+P42Z2+P43Z3+e4路径系数的分解Z2=p21Z1Z3=(p31+p32p21)Z1Z4=(p41+p42p21+p43p31+p43p32p21)Z1相关系数的分解r12=p21r13=p31 + p32r12r23=p32 + p31r12r14=p41 + p42r12 + p43 r13r24 = p41 r12+ p42 + p43 r23r34 = p41 r13+ p42r23 + p432.3路径分析模型的检验嵌套模型2 2 2 2R C 1 (1 R i)(1 R2)…(1 R p)R 1 (1 R i2)(1 R;)…(1 R2')Q吧(1 R T)W (n d)l nQn为样本容量,d为两模型路径数目之差,W近似服从自由度为d的卡方分布,卡方显著时说明两模型差异显著,检验模型效果不好。
第29章 路径分析——【SPSS精品教程 资源池】
模块解读
• 1.变量转换 • 因为性别为属性变量,我们无法对字串变量进行回归分析,所以
需要用转换功能将性别m(男)和f(女)转换分别成虚拟数字变 量1和0。 • 单击“转换”|“重新编码为不同变量”命令,弹出变量转换对 话框,如图29-4所示。“输出变量”框中“名称”栏输入一个新 的变量“gender1”,“标签”是“性别”,然后单击“更改”。
• 6.“统计量”按钮
• 单击“统计量”按钮,弹出图29-13所示的“统计量”对话框, 选择“描述性”,单击“继续”完成选择,回到线性回归对话框 单击“确定”按钮即可计算回归系数。
实例详解
• 例29.1:我们采用SPSS软件系统自带的数据文件Employee data.sav(可 在SPSS软件的子目录下找到该数据)来进行路径分析。该数据收录了 474个员工的人事工资资料,序号为434的缺失出生日期,所以有效为 473个,在接下来的分析中,剔除该样品;该数据包含有:id(编码)、 gender(性别)、bdate(Date of Birth,出生日期)、educ (Educational Level,受教育水平)、jobcat(Employment Category,职 位类别)、salary(Current Salary,目前工资)、salbegin(Beginning Salary,初始工资)、jobtime(Months since Hire,已工作时间)
• 3.年龄转换
• 由于年龄比出生日期更简洁直观,我们把出生日期转换成年龄进 行分析,因为统计资料的时间不清楚,用现在时间计算并不影响 结果,所以算当下时间的年龄。
• 单击“转换”|“日期和时间向导”命令,弹出图29-7所示的对 话框,选择“使用日期和时间进行计算”选项,单击“下一步” 按钮,弹出图29-8所示的对话框,日期和时间向导第一步对话框。
毕业论文SPSS路径分析怎么做?案例解析详解
路径分析1、作用路径分析,一种基于线性回归方法、用于分析错综复杂变量之间路径关系的一种模型。
2、输入输出描述输入:变量对应的路径关系,一般要求输入数据为定量数据。
输出:各变量作用的路径关系或是否成立。
3、案例示例案例:研究“幸福感”的影响因素,有四个变量可能对幸福感有影响,他们分别是:经济水平、受教育程度、身体健康、情感支持。
通过路径分析可以得到这四个变量如图所示路径关系作用于幸福感。
4、案例数据模型要求为变量对应的路径关系,一般要求输入数据为定量数据(案例数据中为幸福度、经济水平、情感支持水平、身体健康水平、受教育程度),路径关系可以参考案例里的路径,这是由调查或者询问专家获得的。
5、案例操作Step1:新建分析;Step2:上传数据;Step3:选择对应数据打开后进行预览,确认无误后点击开始分析;Step4:选择【路径分析】;Step5:查看对应的数据数据格式,【路径分析】要求按照初步假设出模型中各变量的相互关系,绘制成一张清晰的路径分析图;Step6:点击【开始分析】,完成全部操作。
6、输出结果分析输出结果 1:模型路径图图表说明:上表展示了带权路径图,主要包括模型的标准化系数,用于分析路径影响关系情况。
输出结果 2:模型回归系数表图表说明:基于配对项经济水平->情感支持水平,显著性 P 值为 0.000***,水平上呈现显著性,则拒绝原假设,因此此路径有效,其影响系数为 0.489。
基于配对项受教育程度->情感支持水平,显著性 P 值为 0.016**,水平上呈现显著性,则拒绝原假设,因此此路径有效,其影响系数为-0.132。
基于配对项情感支持水平->幸福度,显著性 P 值为 0.025**,水平上呈现显著性,则拒绝原假设,因此此路径有效,其影响系数为 0.233。
基于配对项身体健康水平->幸福度,显著性 P 值为 0.000***,水平上呈现显著性,则拒绝原假设,因此此路径有效,其影响系数为-0.354。
路径分析
▪ 6.“统计量”按钮
▪ 单击“统计量”按钮,弹出图29-13所示的“统 计量”对话框,选择“描述性”,单击“继续 ”完成选择,回到线性回归对话框单击“确定 ”按钮即可计算回归系数。
实例详解
▪ 例29.1:我们采用SPSS软件系统自带的数据文件 Employee data.sav(可在SPSS软件的子目录下找 到该数据)来进行路径分析。该数据收录了474个员 工的人事工资资料,序号为434的缺失出生日期,所 以有效为473个,在接下来的分析中,剔除该样品; 该数据包含有:id(编码)、gender(性别)、 bdate(Date of Birth,出生日期)、educ( Educational Level,受教育水平)、jobcat( Employment Category,职位类别)、salary( Current Salary,目前工资)、salbegin(Beginning Salary,初始工资)、jobtime(Months since Hire ,已工作时间)
▪ 如果多个路径系数同时不显著,则首先删除最不显著的路径 继续进行回归分析,根据下一步的结果再决定是否需要删除 其它原因变量。
▪ 进行调试的一般原则,实际进行调试时,还必须考虑模型的 理论基础。
▪ 作为研究焦点的因果联系必须要有足够的理论根据,即使其 统计不显著,仍然应当加以仔细考虑,并寻找其统计不显著 的原因:是否是多重共线性的影响,还是其它路径假设的不 合理而影响了该路径的显著性。
▪ 、prevexp(Previous Experience,以前的工作经验 )、minority(是否是少数民族)等10个变量。 gender为属性变量,用“f ”表示female女性,“m ”表示male男性;educ使用受教育的年数衡量; jobcat分为三类:“1”表示clerical(文员), “2”代表custodial(保管人员),以“3”表示 manager(管理人员)。当前工资和初始工资以实
SPSS基础入门ppt课件
地区、时间、营业额...
身高、体重、智力...
指定每个变量的各种属性
3
2
变量名、变量标签值、变量的储存类型、缺失值、变量的测量尺度
录入数据
变量名不能与SPSS保留字相同。 SPSS的保留字有ALL、END、BY、EQ、GE、GT、LE、 LT、NE、NOT、OR、TO、WITH。
ppt课件.
12
数据录入 数据录入的格式
实际观察数
理论数 行百分数 列百分数 合计百分数
残差
ppt课件.
41
Crosstabs:结果解释
曾经 吸过烟 * 性别
Case Processing Summary
Valid
N
P erc en t
999
99.9%
C ases
Missing
N
P erc en t
1
.1%
Total
N
P erc en t
ppt课件.
22
Frequencies:定义统计图
统计图类型
无图形 条图 饼图
直方图加上正态曲线
直方图
以频数绘制条图或饼图
ppt课件.
以构成比绘制条图或饼图
23
Frequencies:定义表格
按数值升序
频数表排列次序
按数值降序
按频数升序 按频数降序
ppt课件.
24
Frequencies:结果解释
999
a. 0 cells (.0%) hav e expected count less than 5. The minimum expected count is 34.53.
ppt课件.
最初软件全称为“ 社会科学统计软件包” (SolutionsStatistical Package for the Social Sciences)
第10章路径分析
两个非饱和模型中将路径较多的称为模型1,路径较少的 称为模型2,模型2嵌套在模型1中。将模型1作为基准模型 ,模型2作为检验模型。
设模型 1中包含p个方程,它们的决定系 数分别为:
2 Rc21 , Rc22 ,...,Rcp , 那么,该模型能够解释 的方差为: 2 Rc2 1 1 Rc21 1 Rc22 1 Rcp ,
量划分为自变量和因变量,而是分为 外生变量(exogenous variable)和内生 变量(endogenous variable)。路径分 析的主要功能是将自变量对因变量的 毛作用(简单相关系数或简单回归系 数)分解为直接作用和各种形式的间 接作用,使整个模型中变量的因果关 系更为具体,因果关系的机制更清楚。
探索性:事先没有明确的理论假设,而是完全依赖统计 得到较高拟合度的模型。
验证性:事先已有理论依据及假设设置的模型,检验经 过修正的模型与原假设模型是否不同。
路径模型的识别
模型的识别
模型中所有变量间的相关系数都可以用路径系数函数的 形式来表示,那么所有变量间的路径系数是否能够完全 以相关系数来表示,就是模型的识别问题。
相关原因模型
z1 e1
e1 z1 p31 p21 z2 e2 p32 z3 e3 r 1 12
z 2 p21 z1 e2 z3 p31 z1 p32 z 2 e3 1 z1 p21 z1 e2 n n z1 z1 p z1e2 p 0 p 21 21 21 n n 1 1 r13 z1 z3 z1 p31 z1 p32 z 2 e3 n n z1 z1 z1 z 2 z1e3 p31 p32 n n n 1 p31 r12 p32 0 p31 p21 p32
第29章 路径分析——【SPSS精品教程】
• 3.年龄转换
• 由于年龄比出生日期更简洁直观,我们把出生日期转换成年龄进 行分析,因为统计资料的时间不清楚,用现在时间计算并不影响 结果,所以算当下时间的年龄。
• 单击“转换”|“日期和时间向导”命令,弹出图29-7所示的对 话框,选择“使用日期和时间进行计算”选项,单击“下一步” 按钮,弹出图29-8所示的对话框,日期和时间向导第一步对话框。
Байду номын сангаас块解读
• 1.变量转换 • 因为性别为属性变量,我们无法对字串变量进行回归分析,所以
需要用转换功能将性别m(男)和f(女)转换分别成虚拟数字变 量1和0。 • 单击“转换”|“重新编码为不同变量”命令,弹出变量转换对 话框,如图29-4所示。“输出变量”框中“名称”栏输入一个新 的变量“gender1”,“标签”是“性别”,然后单击“更改”。
• 路径模型的假设条件和限制
• (1)首先要求模型中各变量的函数关系为线性、可加;否则不 能采用回归方法估计路径系数。如果处理变量之间的交互作用, 把交互项看作一个单独的变量,此时它与其它变量的函数关系同 样满足线性、可加。
• (2)模型中各变量均为等间距测度。
• (3)各变量均为可观测变量,并且各变量的测量不能存在误差
• 、prevexp(Previous Experience,以前的工作经验)、minority(是否 是少数民族)等10个变量。gender为属性变量,用“f ”表示female女 性,“m ”表示male男性;educ使用受教育的年数衡量;jobcat分为三 类:“1”表示clerical(文员),“2”代表custodial(保管人员),以 “3”表示manager(管理人员)。当前工资和初始工资以实际额为准。
第三章-路径分析PPT课件
路径图中没有环,误差项之间没有双向(弧线)箭头
•8
❖ 非递归模型。至少符合以下条件之一
模型中任意两个变量之间存在直接或间接的反馈作用 某变量存在自身反馈作用(自相关) 误差项相关
内生变量的误差项与其外生变量相关 不同内生变量的误差项相关 路径图中有环,误差项之间有双向(弧线)箭头
建立待估计参数个数与方程个数的关系,以判断 模型参数是否能够识别或者估计。
•14
极大似然估计(MLE)
❖ 基本思想:在已经得到实验结果的情况下,我们应该寻找 使这个结果出现的可能性最大的参数作为真实参数的估计
❖ 似然函数:
n
离散型随机L变 ()量 : p(ix;),
i1
n
连续性随机L变 ()量 : f(xi;), i1
•3322
本讲内容
3.1模型设定-路径图 3.2参数估计 3.3模型检验与评价 3.4效应分解
•1
路径分析的步骤
❖ 模型设定 ❖ 参数估计
递归模型:OLS 非递归效应:ML/LS/GLS
❖ 模型检验与评价 ❖ 效应分解
因果效应:变量之间由于存在因果关系而产生的影响作用 直接效应/间接效应
虚假效应:两个内生变量的相关系数中,由于共同的起因产生影 响作用的部分
❖ 似然函数反映了参数的各个不同取值导出实验结果的可能 性的大小,我们选择使似然函数达到最大值的那个参数值 作为参数的估计。
•15
模型的协方差矩阵
Y BY X 其中,E ( X ) E ( ) 0, Cov( X , ) 0 Y BY X (I B)Y X Y (I B)1(X )
非递归路径模型单个方程的识别
❖ 阶条件(必要条件):若第i个方程未包括的内生变 量和外生变量数之和大于或等于p-1 ,则该方程有可 能被识别
【IBM-SPSS课件】统计描述分析
IBM-SPSS
統計描述分析
▪ 描述性統計分析是進行其他統計分析的基礎 和前提。在描述性分析中,通過各種統計圖表及數 字特徵量可以對樣本來自的總體特徵有比較準確的 把握,從而選擇正確的統計推斷方法。
主要內容
▪ 1:頻數分佈分析(Frequencies) ▪ 2:描述性統計分析(Descriptives) ▪ 3:探索性分析(Explore)
模組解讀
▪ 探索性分析主對話框
▪ 統計量對話框
▪ “描述性(Descriptives)”:選擇此項,將生成 描述性統計表格。表中顯示樣本數據的描述統計量 ,包括平均值、中位數、5%調整平均數、標準誤 、方差、標準差、最大值、最小值、組距、四分位 數、峰度、偏度及峰度和偏度的標準誤。
▪ “均值的置信區間”(Confidence Interval for Mean):用戶還可輸入數值指定均值的置信區間 的置信度,系統默認的置信度為95%。
▪ “M-估計量(M-estimators)”:選擇此項,將計 算並生成穩健估計量。M估計在計算時對所有觀測 量賦予權重,隨觀測量距分佈中心的遠近而變化, 通過給遠離中心值的數據賦予較小的權重來減小異 常值的影響。
▪ “界外值(Outliers)”:選擇此項,將輸出分析 數據中的5個最大值和5個最小值作為異常嫌疑值。
▪ “不分組(Dependents together)”:選擇此項,將為每 個分組變數的水準創建一個箱鎖圖,在每個箱鎖圖內用不 同的顏色區分不同因變數所對應的箱形單元,方便用戶進 行比較。
《spss20详细教程》课件
散点图
总结词
用于展示两个变量之间的关系
详细描述
散点图可以用来展示两个变量之间的关系,通过观察散 点图中点的分布和趋势,可以初步判断两个变量之间是 否存在线性关系或其他关系。在SPSS20中,可以通过“ 图形”菜单下的“散点图”选项进行绘制。
箱线图
总结词
用于展示一组数据的分布特征
详细描述
箱线图也称为箱状图或箱状分布图,它可以用来展示 一组数据的分布特征,包括数据的最大值、最小值、 中位数、上下四分位数等。通过箱线图,可以直观地 了解数据的离散程度、异常值等。在SPSS20中,可以 通过“图形”菜单下的“箱线图”选项进行绘制。
详细描述
雷达图也称为蜘蛛网图或星状图,它可以用来展示多个变量的综合表现。通过雷达图,可以将多个变量的数据以 可视化的方式呈现出来,方便研究者进行多变量之间的比较和分析。在SPSS20中,可以通过“图形”菜单下的 “雷达图”选项进行绘制。
05
SPSS20高级功能
决策树分析
决策树分析
通过建立决策树模型,对数据进行分 类和预测,帮助用户理解和解决复杂 的分类问题。
详细描述
通过因子分析,将多个变量归结为少数几个 公共因子,这些公共因子能够反映数据的基 本结构。这种方法常用于市场调研、心理学 等领域,帮助研究者深入了解数据的内在结
构和关系。
04
SPSS20图形绘制功能
直方图
要点一
总结词
用于展示连续变量的分布情况
要点二
详细描述
通过直方图,可以直观地展示一个或多个连续变量的分布 情况,帮助研究者了解数据的集中趋势、离散程度和分布 形态。在SPSS20中,可以通过“图形”菜单下的“直方图 ”选项进行绘制。
第八讲路径分析
由于不知X1与X2的因果方向,不能求出X1对X3或X2对X3的间接效果, 因而不能算出每者对X的总因果效应(即E)。但是,可对每对变量的 相关关系进行分解: 直接效果
r21 r21 r31 P31 r32 P32
P32 r21 P31r21
与其他因素相关引致之部分
同理可以分析四个以上变量的模式。如在收入分配例子中 要添加经济增长的变动(X4),则可成立部分含蓄单向模 型如下: X1
三、完整单向模型
1、基本概念与图示 完整单向模型,是指在 变量的因果关系中所有因果 路径都存在。 完整单向路径模型图式: 如个人的职业成就(X3) 受教育水平(X2)和父亲的 职业成就(X1)所影响。 图3就是一个完整单向 模型。
X1
P31
X3 P32
P21 X2
ห้องสมุดไป่ตู้
P2b
eb
P2a
ea
图3
2、路径系数的估计
1、因果模型的解释力 相对于X2的剩余效应是0.87,其平方值是0.76,表 示尚有76%的剩余误差是未被解释的(即只有24%的误 差是由X1所解释的)。同理,X3尚有72%的剩余误差是 未被解释的(即只有28%的误差是受X1与X2所共同解 释)。 由此可见,所建立的因果模型的的解释能力颇弱, 需要在将来的研究中引进其他变量。 2、总因果效应分析 指每一个变量Xi对另一个变量Xj的全部影响,包括直 接效应(即P)与间接效应(即路径上各个P值的乘积)。 全部因果效应的简写是E,表示X变化时所引起的X 的全 部变化。由图3的数值可算出:
是未知数 ,但有三个方程式,可以用代数方法推算出这三个未知数。正 规方程式的数目与未知数的数目相同的情况,在路径分析中成为确认模 型(可识别模型)(just-identified model)。
路径分析 PPT
大家应该也有点累了,稍作休息
大家有疑问的,可以询问和交流
▪ 2.“旧值和新值”按钮
▪ 单击“旧值和新值”按钮,弹出图29-5所示的 “旧值和新值”对话框,此对话框可用于对目 标变量进行具体变量的转换。在“旧值”的“ 值”栏里输入需要转换的目标变量“m”,“新 值”的“值”中输入新的值“1”,单击“添加 ”按钮,再以同样方法添加“f”和“0”,单击 “确定”按钮,即生成一个新的变量 “gender1”,如图29-6所示。
▪ 如果多个路径系数同时不显著,则首先删除最不显著的路径 继续进行回归分析,根据下一步的结果再决定是否需要删除 其它原因变量。
▪ 进行调试的一般原则,实际进行调试时,还必须考虑模型的 理论基础。
▪ 作为研究焦点的因果联系必须要有足够的理论根据,即使其 统计不显著,仍然应当加以仔细考虑,并寻找其统计不显著 的原因:是否是多重共线性的影响,还是其它路径假设的不 合理而影响了该路径的显著性。
▪ 6.“统计量”按钮
▪ 单击“统计量”按钮,弹出图29-13所示的“统 计量”对话框,选择“描述性”,单击“继续 ”完成选择,回到线性回归对话框单击“确定 ”按钮即可计算回归系数。
实例详解
▪ 例29.1:我们采用SPSS软件系统自带的数据文件 Employee data.sav(可在SPSS软件的子目录下找 到该数据)来进行路径分析。该数据收录了474个员 工的人事工资资料,序号为434的缺失出生日期,所 以有效为473个,在接下来的分析中,剔除该样品; 该数据包含有:id(编码)、gender(性别)、 bdate(Date of Birth,出生日期)、educ( Educational Level,受教育水平)、jobcat( Employment Category,职位类别)、salary( Current Salary,目前工资)、salbegin(Beginning Salary,初始工资)、jobtime(Months since Hire ,已工作时间)
第十三章-数据分析:SPSS的使用ppt课件
(一)条形图的类型
(二)设置图表中的数据 ⒈ 个案组摘要 ⒉ 各个变量的摘要 ⒊ 个案值
(三)定义条形图的特性
三、线形图
LOGO
(一)线形图的类型
(二)设置图表中的数据 ⒈ 个案组摘要 ⒉ 各个变量的摘要 ⒊ 个案值
(三)定义条形图的特性
五、散点图
LOGO
❖ 散点图是有两个变量所确定的点在坐标系中的分布来反映变 量之间关系的统计图。使用散点图可以对变量分布特征作初 步的判断,如变量的分布是否具有等方差性等等。
进行描述分析的一般步骤如下: 选择菜单:【分析】→【描述统计】→【描述】
⒈ 【将标准化得分另存为变量】: 将计算的标准化值保存为新变量。
⒉ 【选项】: 选择可选统计量和显示顺序
LOGO
LOGO
(三)探索分析
探索过程(Explore)可以进一步检测数据,进而直观 地观测各组数据的分布,并可对数据进行正态性与同方差 的检验。
LOGO
⒉ 选择排序变量
从左侧的源变量窗口中选择一个或多个变量,通过单 击中间的箭头按钮,使之进入到排序依据窗口中。如果选 择的是多个变量,系统先按选择的第一个变量排序,第一 个变量值相等时,按第二个变量排序,以此类推。
⒊ 选择排序规则
排序规则中包括两个选项: ① 升序:按升序顺序排序。 ② 降序:按降序顺序排序。
LOGO
(六)个案选择
⒈ 打开选择个案对话框
【数据】→【选择个案】
⒉ 确定选择个案的方法
LOGO
⒊ 确定未被选中的个案的处理方法
该栏中包括两个选项: ① 【过滤】:生成过滤变量的选项。 ② 【删除】:删除未选个案的选项。
⒋ 输出选择结果
LOGO
(七)其他功能
第二讲_spss路径分析
第二讲路径分析11 路径分析与回归分析之间的异同●回归分析中变量的因果关系是不存在多环节的因果结构,自变量对于因变量的作用是并列存在的●路径分析可以考察复杂的因果结构,某个变量对于其中一些变量来说是原因变量,对于另外一些变量来说就是结果变量●路径分析可以将变量之间的作用分解成直接作用和间接作用,使人们对于变量之间的因果关系有更深入的了解2路径分析概述2.1 路径分析的源起●遗传学家Sewall Wright于1918-1921年间在考察遗传和环境在双色猪(Guinea-Pig)的毛色遗传中所起的作用时首次提出。
2.2 路径分析的几个概念●外生变量,内生变量◆外生变量:在模型中只是作因的变量,有箭头指向别的变量但没有箭头指向它◆内生变量:作果的变量,有别的箭头指向它●递归模型,非递归模型◆全部是单向链条,无反馈作用◆存在直接反馈作用,自反馈作用,间接循环作用或误差与变量相关●模型的恰好识别,超识别和无法识别◆变量之间的路径系数能否完全用相关系数来表达(已知相关系数的个数与待求路径系数的个数的关系)●路径系数◆某个自变量对其因变量的直接效果,也就是其标准回归系数(Beta),标于相应路径上◆路径系数的估计及检验与标准回归系数的估计及检验相同●路径图1本讲义是根据文剑冰老师《高级心理统计》课程系列PPT的内容整理而成整理人:胡杨E-mail:********************◆ Z1=e1◆ Z2=P21Z1+e2◆ Z3=P31Z1+P32Z2+e3◆ Z4=P41Z1+P42Z2+P43Z3+e4● 路径系数的分解◆ Z2=p21Z1◆ Z3=(p31+p32p21)Z1◆ Z4=(p41+p42p21+p43p31+p43p32p21)Z1● 相关系数的分解◆ r12=p21◆ r13=p31 + p32r12◆ r23=p32 + p31r12◆ r14=p41 + p42r12 + p43 r13◆ r24 = p41 r12+ p42 + p43 r23◆ r34 = p41 r13+ p42r23 + p432.3 路径分析模型的检验● 嵌套模型◆ n 为样本容量,d 为两模型路径数目之差,W 近似服从自由度为d 的卡方分布,卡方显著时说明两模型差异显著,检验模型效果不好。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
▪ 3.年龄转换
▪ 由于年龄比出生日期更简洁直观,我们把出生 日期转换成年龄进行分析,因为统计资料的时 间不清楚,用现在时间计算并不影响结果,所 以算当下时间的年龄。
▪ 单击“转换”|“日期和时间向导”命令,弹出 图29-7所示的对话框,选择“使用日期和时间 进行计算”选项,单击“下一步”按钮,弹出 图29-8所示的对话框,日期和时间向导第一步 对话框。
▪ 、prevexp(Previous Experience,以前的工作经验 )、minority(是否是少数民族)等10个变量。 gender为属性变量,用“f ”表示female女性,“m ”表示male男性;educ使用受教育的年数衡量; jobcat分为三类:“1”表示clerical(文员), “2”代表custodial(保管人员),以“3”表示 manager(管理人员)。当前工资和初始工资以实
结构关系,在多元回归的基础上计算变量间的相关 系数,计算结果给出的线性回归方程的标准系数( Standardized Coefficients)也就是我们需要的路径 系数。路径系数分为直接路径系数(某一自变量对 因变量的直接作用)和间接路径系数(该自变量通 过其他自变量对因变量的间接作用)两种。在一个 构造合适的路径图中,任何两个变量间的相关系数就 是连结这两点之间的所有复合链上的路径系数的乘 积之和
IBM-SPSS
路径分析
▪ 前面的多元回归分析常用于对影响因素的分 析,但由于只考察变量之间的直接作用,而实际上 变量之间的相关关系往往是一个复杂的传递过程, 因此需要一种可以全面地考察变量间的相互作用, 包括直接作用和间接作用的方法,即本章所介绍的 路径分析(通径分析)。
▪ 路径分析通过构建路径图直观地显示变量间的
模块解读
▪ 1.变量转换
▪ 因为性别为属性变量,我们无法对字串变量进 行回归分析,所以需要用转换功能将性别m(男 )和f(女)转换分别成虚拟数字变量1和0。
▪ 单击“转换”|“重新编码为不同变量”命令, 弹出变量转换对话框,如图29-4所示。“输出 变量”框中“名称”栏输入一个新的变量 “gender1”,“标签”是“性别”,然后单击 “更改”。
▪ 路径模型的假设条件和限制
▪ (1)首先要求模型中各变量的函数关系为线性、可加;否则不 能采用回归方法估计路径系数。如果处理变量之间的交互作用 ,把交互项看作一个单独的变量,此时它与其它变量的函数关 系同样满足线性、可加。
▪ (2)模型中各变量均为等间距测度。
▪ (3)各变量均为可观测变量,并且各变量的测量不能存在误差
▪ 如果多个路径系数同时不显著,则首先删除最不显著的路径 继续进行回归分析,根据下一步的结果再决定是否需要删除 其它原因变量。
▪ 进行调试的一般原则,实际进行调试时,还必须考虑模型的 理论基础。
▪ 作为研究焦点的因果联系必须要有足够的理论根据,即使其 统计不显著,仍然应当加以仔细考虑,并寻找其统计不显著 的原因:是否是多重共线性的影响,还是其它路径假设的不 合理而影响了单击“分析”|“回归”|“线性”命令,弹出线 性回归对话框,如图29-12所示。“因变量”框 中放入本次需要比较的变量“salary”,把要比 较的八个因素“educ”、“salbegin”、 “minority”“jobcat”“gender1”“prevexp ”和“jobtime”放入“自变量”框中,方法选 择“进入”。
▪ 4.计算当前年龄
▪ 在日期和时间向导第一步对话框中选择“计算 两个日期之间的时间数”,单击“下一步”弹 出图29-9第二步对话框,把变量列表中的 “STIME”和“bdate”放入相应栏中,点开“ 单位”下拉列表,选择“年份”,在“结果” 复选框中选择“取整”。
▪ 单击“下一步”按钮,弹出图29-10第三步对话 框,在“结果变量”栏里输入计算生成的新的 变量名称“age”,“变量标签”栏中输入“年 龄”给新的变量加上标签,单击“完成”即可 生成一个新的变量,如图29-11所示。
▪ (4)变量间的多重共线性程度不能太高,否则路径系数估计值 的误差将会很大。
▪ (5)需要有足够的样本量。Kline(1998)建议样本量的个数 应该是需要估计的参数个数的10倍(20倍更加理想)。
路径模型的调试,过程类似于多元回归过程 的调试
▪ 如果某一变量的路径系数(回归系数)统计性不显著,则考 虑是否将其对应的路径从模型中删去;
▪ 2.“旧值和新值”按钮
▪ 单击“旧值和新值”按钮,弹出图29-5所示的 “旧值和新值”对话框,此对话框可用于对目 标变量进行具体变量的转换。在“旧值”的“ 值”栏里输入需要转换的目标变量“m”,“新 值”的“值”中输入新的值“1”,单击“添加 ”按钮,再以同样方法添加“f”和“0”,单击 “确定”按钮,即生成一个新的变量 “gender1”,如图29-6所示。
▪ 6.“统计量”按钮
▪ 单击“统计量”按钮,弹出图29-13所示的“统 计量”对话框,选择“描述性”,单击“继续 ”完成选择,回到线性回归对话框单击“确定 ”按钮即可计算回归系数。
实例详解
▪ 例29.1:我们采用SPSS软件系统自带的数据文件 Employee data.sav(可在SPSS软件的子目录下找 到该数据)来进行路径分析。该数据收录了474个员 工的人事工资资料,序号为434的缺失出生日期,所 以有效为473个,在接下来的分析中,剔除该样品; 该数据包含有:id(编码)、gender(性别)、 bdate(Date of Birth,出生日期)、educ( Educational Level,受教育水平)、jobcat( Employment Category,职位类别)、salary( Current Salary,目前工资)、salbegin(Beginning Salary,初始工资)、jobtime(Months since Hire ,已工作时间)