心理学研究中潜变量空间的特性探讨_张洁婷

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Boeck,Wilson 和 Acton( 2005) 针对类别型的外 显群体变量对潜变量空间特性问题建立了全面的理 论构架,将该问题分为外显类型下潜变量的同质性 问题与外显类型之间差异特点。 2. 3. 1 外显类型下潜在异质性与同质性
由于外显类型同质不具有研究意义,因此主要 围绕外显类型异质的情况讨论潜变量的特性。若处 于同一外显类型的个体在潜在变量上主要集中于若 干个值,则称为类别内同质,即类别内无潜在的维度 结构,具有类别性。所有处于同一外显类型的个体
间特征的研究从只关注数据分布的多峰性发展到对差异的量化、质化问题和分布状态( 包括异质
性和多峰性) 进行全面分析,以综合反映潜变量差异的性质与维度类别特性。通过对潜在类别模
型、混合因素模型和因素模型的比较来确定潜变量空间类型不但为该议题开拓了方法技术,同时
也深化拓展了潜在结构模型的理论框架。此外,该方法在外显指标的数量、计分方式和样本量等
Markon 和 Krueger( 2006) 的研究重点探讨了在 模型选择的准确性。实证研究发现,对于连续型数 据分布,增加样本可减小因受模型复杂性的干扰而 误判为连续正态分布的情况。另一方面,间断分布 随着潜在结点数目的增加而使模型区分的难度增 加,换言之,当与连续分布模型比较时,潜变量为二 分变量的间断模型比潜变量为顺序变量的间断模型 更具有区分性。模拟研究发现,在间断型的样本分 布下,测量信息( 包括题量和计分等级) 比样本量在 确定潜在结构特性中发挥更大的作用,随着类型数 目的增加,模型选择的功效都有所降低。在连续型 的样本分布下,小样本和题量少时更倾向于连续型 的正态分布,随着样本量和题量的增加,则更接近原 模型的分布状态。综上,基于信息论指标的模型选 择方法受样本量、题量和计分方式的影响,各种信息 指标的适用性以及在一些拓展模型( 如多维潜在结 构下的模型比较) 还有待进一步研究。 2. 2 多维度下的多峰检验法
无论是经典测量模型还是新兴的潜在变量模型 ( 如结构方程、因素分析和 IRT 模型) ,潜变量常假 设具有维度性,即连续变量。Boeck,Wilson 和 Acton ( 2005) 认为无论外显群体变量( manifest variable,笔 者认为该文章所指的外显变量与潜在结构模型中的 外显指标有所不同,它是明显、可观察且可综合反映 个体类型的单一指标,如专家对精神病类型的诊断, 故称外显群体变量) 是类别型还是连续型,都可以 测量潜变量质化和量化的差异,关键在于潜变量的 数据特性,即潜变量的数据类型是其本身固有的特 性,不受外显群体变量的类型所影响。
第 32 卷第 5 期
张洁婷等 心理学研究中潜变量空间的特性探讨
405
而是逐渐拟合多维的潜变量结构。基于此,LCM 可 以与间断等距( discrete metrical) 和连续的潜在特质 模型相比较,从而判断模型的维度和数值结点数目。 若 LCM 拟合得更好,说明潜变量是间断分布或多维 的连 续 分 布。 间 断 等 距 ( discrete metrical ) 、多 级 ( polyvalued) 和连续型 IRT 分别是反映间断、称名和 连续的潜变量。而混合模型则通过几个连续子分布 来表示间 断 的 潜 变 量,而 这 种 间 断 性 则 更 为 高 阶。 由于同在潜在结构模型的框架下,模型之间具有可 比性,可通过比较间断分布的模型与连续分布的模 型,以探讨潜变量的性质。由于外显变量通常为间 断数据,该研究就此应用累积逻辑斯蒂( cumulative logistic latent variable model) 探讨顺序型外显变量下 的潜变量类型。在此模型中,潜变量 θk 不但受斜率 a 和截距 b 影响,还受分布状态 p( θk) 影响,其中该 分布是连续还是间断分布则决定于结点数目 k; 该 值可以自由估计,亦可根据分布的正态性进行初步 设定。根据信息论指标( information - theoretic criteria) 进行模型比较,以确定潜在空间的特性。
因素上的使用前提还有待进一步研究。
关键词: 潜在变量; 类型; 维度; 量化和质化差异; 混合因素模型
中图分类号: B841. 2
文献标识码: A
文章编号: 1003 - 5184( 2012) 05 - 0404 - 06
1 问题提出 心理测量是一种间接测量,即常通过外显的行
为指标对潜在的心理变量进行测量估计。然而,传 统的心理统计方法常将外显变量混淆成潜在变量, 例如回归分析中的变量是外显变量,却常用于推断 潜在变量之间的关系; 或常将外显指标的加总看做 潜在变量,忽略外显指标在潜在心理变量测量中的 误差。
两类人群的差异可为若干个参数解释,而复杂的质 化差异则难以用有限个参数解释。量化差异则有平 滑和陡峭之分,这由两个显群分布的重叠面积决定, 即取决于显群间的位置距离与群内的异质性。 2. 3. 3 维度性与类别性的程度与区分思路
纯类别性的潜在变量即显群内同质且群之间具 有质化差异( 如图 1 模型 4) ,纯维度性的潜变量在 显群内异质且群间具平滑差异( 如图 1 模型 2、3) 。 Boeck 等人( 2005) 还认为潜变量的维度性和类别性 存在程度的大小,因为,( 1) 潜在结构分析中四种模 型常存在覆盖,既存在维度性又存在类别性; ( 2) 四 种模型常无法很好地拟合,很可能是因为在维度性 和类别性上存在程度的大小。因此,维度性和类别 性之间还存在混合结构,即形成图 1 中其他几种模 型,而维度性与类别性的程度主要由群内同质性、群 间差异的性质与大小决定。群内越同质、群间差异 质化或群间差异越大,潜变量的类别性越强,反之, 越趋向维度性。
布的峰态,辨别潜变量 θ 是连续还是间断。对于 K - 1 维的潜变量分布,其中一个维度的分布是具有 K 个峰值,则说明潜变量服从间断分布; 若 K - 1 维 都是多峰分布,则潜变量是连续的潜在结构。多峰 检验易受随机的数据波动干扰,因此使用 Silverman ( 1981) 提出的核密度平滑法对数据进行平滑后计 算每个边缘因子分布的峰个数。模拟研究发现类别 间重叠的类型( 边缘重叠、交叉重叠) 是分布判断的 重要影响因素,而且重叠程度越大,多峰检验方法的 一类错误率( 将间断型变量误判为连续型) 越高; 类 别内样本量的增加使类别均值附近的密度也随之增 大,从而更倾向于判断为间断型的潜变量; 此外,还 可以 通 过 类 别 归 属 的 正 确 率 指 标 ARI ( Adjusted Rand Index) 来反映 MMT 的正确性。当只有一个因 子时,由于容易将低峰误判为另一类别而将潜变量 误判为间断型分布。总体上,MMT 对连续型潜变量 的判断正确率高达 94% ,而对间断型潜变量的判断 正确率只有 44% ,在判断中还需权衡两类错误。将 来的研究可以考虑与 BIC 等信息指标进行结合分 析。另一方面,该研究将连续型潜变量限于线性模 型,且协方差矩阵也限于较为理想的状态。 2. 3 模型的嵌套比较
存在关联( 即局部独立性) 。这一前提假设在实际 数据中又经常被违背,反映了这些数据在潜在类型 内又存在多维性。如何分析确定潜变量的数据类型 和空间特性? 这不仅取决于理论研究,更应通过统 计方法进行探索与验证。该问题的解决不但影响心 理学理论研究进展,并且为心理测量的设计与统计 分析模型的选取提供直接的理论指导,以保证心理 测量与统计的结构和内容效度。本文重点对该议题 的研究发展进行评述和总结。 2 潜变量类型的判断方法 2. 1 通过模型比较确定分布状态
* 基金项目: 全国教育科学“十二五”规划教育部重点课题( GFA111009) ,广州卓越教育项目,2012 年度教育部人文社会科学研究青年基 金项目( 12YJC190016) ,“国家基础科学人才培养基金‘华南师范大学心理学基地’( J1030729) ”。
通讯作者: 张敏强,E - mail: zhangmq1117@ yahoo. com. cn。
心理学探新 2012,Vol. 32,No. 5,404 - 409 PSYCHOLOGICAL EXPLORATION
*
心理学研究中潜变量空间的特性探讨
张洁婷 张敏强 耿 爽
( 华南师范大学 心理应用研究中心,广州 510631)
摘 要: 本文首先评述潜变量数据类型和空间特征的研究现状。比较和归纳发现,潜变量空
406
心理学探新
2012 年
在潜在变量上分散于无数个值,称为类别内异质,类 别内有潜在维度结构。 2.源自文库3. 2 外显类型之间的潜在量化和质化差异
外显类型之间的潜在差异可分为量化和质化差 异,其含义在具有维度性和类别性的潜变量中有所 不同,如图 1 所示。当外显类型内潜在异质时( 模 型 1) ,外显群体间若存在潜在维度上的差异( 如斜 率或截距) ,即质化的差异 ( qualitative difference) 。 例如,不同的人格障碍的诊断量表( dimension) 是结 合各种症状( category) 的有无或轻重综合测量; 同样 是边缘性症状,在边缘型人格和表演型人格诊断中 的权重或截距不相同,在潜在水平上存在质的差异。 潜在维度参数相同的,只是某一类别的潜在分布比 另外一些类别的潜在分布位置稍低一些。当外显类 型内潜在同质时,质性的潜在差异就不在于外显指 标在类型间的功能差异,而是所有外显指标在水平 上的整体剖面差异( 模型 4) 。例如,边缘型人格与 表演型人格之间差异在于剖面图结构上不同( 即对 各外显指标反映的结构不同) ,而不是在边缘性症 状上的差异,这类似于潜在类别模型。当外显类别 内异质,量化差异则是指相同的指标水平所反映的 程度因外显类型而异; 两个类别位于相同的潜在维 度下( 模型 2、3) 。例如,边缘型人格在边缘性症状 上的得分高于表演型人格在此症状上的得分。而对 于外显类别内同质( 个体的潜在位置无变异) ,量化 差异是指相同的指标水平所反映的因外显类型而 异; 两个类别位于相同的潜在维度下,类别之间相差 较大( 模型 5) 。例如,边缘性症状在边缘型人格的 测量中所占比重高于在表演型人格中的比重。
Markon 和 Krueger ( 2006) 认为,间断型变量模 型是连续型变量模型的特例,犹如方差分析是回归 分析的特例一样。而称名潜变量模型实质是多维的 二分变量模型,连续分布可用无数个等距数值结点 组成的间断分布表示。因此,连续与间断的比较主 要在于间断分布中结点的多少,当结点很少时,其模 型的参数估计和拟合与连续分布模型差异很大,而 当结点足够多时,可用半参数或非参数模型拟合连 续分布( Heinen,1996; Owen,2001 ) 。然而,无法通 过比较单纯的连续分布和间断分布以确定潜变量是 连续还是间断。潜在类别模型( Latent class model, LCM) 则用于表示间断的潜变量,而且是具有多维的 二分潜变量。在多维度的潜在类别模型中,随着潜 变量数值结点的增加,模型所拟合的并非连续分布,
Steinly 和 McDonald( 2007) 基于连续潜变量与 类别潜变量协方差的对等关系,重点探讨连续型外 显变量下潜变量特性的辨别问题。其主要思路: 将 潜变量向量函数 ( θ) 正交转化后形成 Barlett 变量 向量,用 Barlett 变量拟合 ( θ) 的联合分布,通过多 峰检验法( multimodal test,MMT) 分析 Barlett 变量分
随着潜在变量模型的发展,根据外显变量和潜 在变量的数据类型可使用不同的统计模型,以更贴 近心理变量的真实空间结构。其中,外显变量的数 据类型主要决定于测验的设计,而潜在变量是内隐 的心理特 征,其 数 据 类 型 与 其 结 果 一 样 无 法 确 定。 在以往研究中,潜变量的数据类型多以理论构想来 确定,例如,霍兰德的人格理论假设个体的人格可分 为六类,项目反应理论则假设个体的能力是连续变 量。这些假设虽然得到理论的支持,但在实证研究 中亦出现数据不符合前提假设的情况。另一方面, 由于类别型数据处理方法的相对滞后,对于类别型 的潜变量还相对缺少实证研究和对理论的统计模型 验证。常见的方法是通过某些统计分析方法确定决 断值,将潜在类型仅局限于量的差异,而忽略了对心 理类型之间潜在结构差异的探讨。潜在剖面分析和 潜在类别分析是近年来发展较为成熟的类型划分方 法,但其分析的前提是潜在类别下外显变量之间不
相关文档
最新文档