11. 涉及数据与模型拟合的问题
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
– 临界解 – 非临界解 – 难下定论的解 – 对于方差为负数的解,可以设定它大于 0.01,然后再运行一次 LISREL – 即使存在不恰当的解,其他参数的估计值仍 然有参考价值
8
单指标潜变量
– 不能同时估计相应的因子负荷和指标的误差方 差 – 简单设定:令对应的因子负荷为 1,指标的误 差方差为 0,即指标精确测量潜变量 – 基于指标信度的较为精细的方法:
12
结构方程是否验证变量间的因果关系?
– 严格来说,非经设计用以探讨变量间因果效应 的研究,都不能证明变量间是否真正存在因果 关系。单从等同模型,已经可以举出拟合指数 相同,但变量间效应相反的例子
13
合宜和错误的高阶因子
– 不一定可以强将数个因子合并,并简化为高阶 因子的关系 – 例 :学生的性格如何影响学生成绩表现
高级统计方法
周影辉 博士
zyhmaths@163.com
中山大学管理学院市场学系
1
专题讨论 — 涉及数据的问题
样本容量(N)
– 每个因子上多设计几题,预试协助删去一些 不好的题目 – 最后每个因子应有3个或更多的题目 – N 最少应大于 100 (Boomsma,1982) – N/p 等于 10 (Nunnally,1967) – N/t 大于 5 (Bentler,1989) – 保守准则:N 大于或等于 100,10p,5t三 者中最大的
非正态数据 异常数据
3
缺失数据: 三种缺失机制:完全随机缺失,随机缺失,非
随机缺失
处理缺失数据的方法:
– 列删法 – 对删法 – 均值替代法 – 回归或主成分法 – 最大似然法 – 相似反应模式设算法 – EM 算法和 MCMC 算法
4
可否应用相关矩阵作分析?
– SEM建立在方差和协方差分析上 – 用相关矩阵,大多数情况下正确 – 在某些情况下并不正确(见Cudeck, 1989 ): • 限制因子方差为 1,同时固定某指标的因子 负荷不等于零 • 同一个因子,固定其两个或以上指标的因子 负荷不等于零 • 同一个因子的两个或以上指标,限制其因子 负荷相同 • 不同因子的两个或以上指标,限制其因子负 荷相同 • 限制两个或以上内生潜变量的误差相等
• 对协方差矩阵:将相应负荷固定为 1,并将相应误 差的方差固定为(1-信度)*指标的方差 • 对相关矩阵:将相应负荷固定为信度的方根,而误 差方差则固定为(1-信度)
– 在拟合整个模型时,可以做敏感度测试,查看 不同信度值对各参数估计的影响
9
Biblioteka Baidu
误差相关
– 除非在特殊设计 (重复测量),刻意容许误差相 关 – 在一般研究,通常不容许误差可以相关
14
如何报告结构方程分析结果
– 模型设定 • 模型中为何存在或不存在某个路径,应该提 出理论上的考虑 – 模型识别性(参数估计的唯一性) – 样本数据与估计方法 – 参数估计值和拟合指数 • 如果对预设模型做了修正,说明修正过程
15
10
为甚么要考虑等同模型?
– 以同样个数的参数(t),用不同组合产生许多 不同模型,而其中再生协方差矩阵,完全相同 – 换句话说,同样个数的参数(t)产生多个与样 本数据有相同拟合程度、但结构不同的模型
11
模型与数据拟合是否表示模型正确?
– 在结构方程模型的应用研究中,检查理论模 型与数据的拟合指数,若拟合度高,则说数 据证明理论模型正确。这种说法,不够严谨 – 从统计假设检验的角度:只能说明数据不能 拒绝理论模型,而不能说数据可以确认模型, 更不能说证明某一理论 – 从哲学的角度:证伪容易,证真难
5
专题讨论 — 涉及模型拟合的问 题
忽略测量误差所引致的错误
– 方差(变异量) • x变异量= ξ 变异量+ δ 误差变异量 • 除非 δ 等于零,否则考虑了误差的变量的 变异量小于没有考虑误差的变量的变异量 γ * = γ ( var(ξ ) var( x)) – 相关和回归参数
rξη = rxy (rxx ryy )
12
rξη = 0.5 (0.7 2 )1 2 = 0.71
6
非正定协方差矩阵
– 输入的样本协方差矩阵非正定
• 用对删法处理缺失数据 • 变量间线性相关
– 模型再生的协方差矩阵非正定
• 所设的模型不合理 • 运算时的初始值欠佳等
不收敛:多由模型或数据本身导致
7
不恰当的解(如方差为负数,相关系数的 绝对值大于1等)
2
数据类型
– 绝大部分分析基于皮尔逊(Pearson)相关 – 来自等级(顺序)量表(ordinal scale), 改用多项(polyserial)相关系数,并与渐 近方差矩阵(Asymptotical Covariance Matrix,ACM)合用,以WLS法拟合模型,除 非N很大,额外需要的ACM矩阵多不稳定
8
单指标潜变量
– 不能同时估计相应的因子负荷和指标的误差方 差 – 简单设定:令对应的因子负荷为 1,指标的误 差方差为 0,即指标精确测量潜变量 – 基于指标信度的较为精细的方法:
12
结构方程是否验证变量间的因果关系?
– 严格来说,非经设计用以探讨变量间因果效应 的研究,都不能证明变量间是否真正存在因果 关系。单从等同模型,已经可以举出拟合指数 相同,但变量间效应相反的例子
13
合宜和错误的高阶因子
– 不一定可以强将数个因子合并,并简化为高阶 因子的关系 – 例 :学生的性格如何影响学生成绩表现
高级统计方法
周影辉 博士
zyhmaths@163.com
中山大学管理学院市场学系
1
专题讨论 — 涉及数据的问题
样本容量(N)
– 每个因子上多设计几题,预试协助删去一些 不好的题目 – 最后每个因子应有3个或更多的题目 – N 最少应大于 100 (Boomsma,1982) – N/p 等于 10 (Nunnally,1967) – N/t 大于 5 (Bentler,1989) – 保守准则:N 大于或等于 100,10p,5t三 者中最大的
非正态数据 异常数据
3
缺失数据: 三种缺失机制:完全随机缺失,随机缺失,非
随机缺失
处理缺失数据的方法:
– 列删法 – 对删法 – 均值替代法 – 回归或主成分法 – 最大似然法 – 相似反应模式设算法 – EM 算法和 MCMC 算法
4
可否应用相关矩阵作分析?
– SEM建立在方差和协方差分析上 – 用相关矩阵,大多数情况下正确 – 在某些情况下并不正确(见Cudeck, 1989 ): • 限制因子方差为 1,同时固定某指标的因子 负荷不等于零 • 同一个因子,固定其两个或以上指标的因子 负荷不等于零 • 同一个因子的两个或以上指标,限制其因子 负荷相同 • 不同因子的两个或以上指标,限制其因子负 荷相同 • 限制两个或以上内生潜变量的误差相等
• 对协方差矩阵:将相应负荷固定为 1,并将相应误 差的方差固定为(1-信度)*指标的方差 • 对相关矩阵:将相应负荷固定为信度的方根,而误 差方差则固定为(1-信度)
– 在拟合整个模型时,可以做敏感度测试,查看 不同信度值对各参数估计的影响
9
Biblioteka Baidu
误差相关
– 除非在特殊设计 (重复测量),刻意容许误差相 关 – 在一般研究,通常不容许误差可以相关
14
如何报告结构方程分析结果
– 模型设定 • 模型中为何存在或不存在某个路径,应该提 出理论上的考虑 – 模型识别性(参数估计的唯一性) – 样本数据与估计方法 – 参数估计值和拟合指数 • 如果对预设模型做了修正,说明修正过程
15
10
为甚么要考虑等同模型?
– 以同样个数的参数(t),用不同组合产生许多 不同模型,而其中再生协方差矩阵,完全相同 – 换句话说,同样个数的参数(t)产生多个与样 本数据有相同拟合程度、但结构不同的模型
11
模型与数据拟合是否表示模型正确?
– 在结构方程模型的应用研究中,检查理论模 型与数据的拟合指数,若拟合度高,则说数 据证明理论模型正确。这种说法,不够严谨 – 从统计假设检验的角度:只能说明数据不能 拒绝理论模型,而不能说数据可以确认模型, 更不能说证明某一理论 – 从哲学的角度:证伪容易,证真难
5
专题讨论 — 涉及模型拟合的问 题
忽略测量误差所引致的错误
– 方差(变异量) • x变异量= ξ 变异量+ δ 误差变异量 • 除非 δ 等于零,否则考虑了误差的变量的 变异量小于没有考虑误差的变量的变异量 γ * = γ ( var(ξ ) var( x)) – 相关和回归参数
rξη = rxy (rxx ryy )
12
rξη = 0.5 (0.7 2 )1 2 = 0.71
6
非正定协方差矩阵
– 输入的样本协方差矩阵非正定
• 用对删法处理缺失数据 • 变量间线性相关
– 模型再生的协方差矩阵非正定
• 所设的模型不合理 • 运算时的初始值欠佳等
不收敛:多由模型或数据本身导致
7
不恰当的解(如方差为负数,相关系数的 绝对值大于1等)
2
数据类型
– 绝大部分分析基于皮尔逊(Pearson)相关 – 来自等级(顺序)量表(ordinal scale), 改用多项(polyserial)相关系数,并与渐 近方差矩阵(Asymptotical Covariance Matrix,ACM)合用,以WLS法拟合模型,除 非N很大,额外需要的ACM矩阵多不稳定