以结构方程模型为例-精品文档

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

以结构方程模型为例
一、引言
在20世纪的大部分时间里，由实证主义支撑的定量方法主宰着社会科学研究领域，研究者信奉价值中立“客观的”实证方法来研究人类行为和社会现象。

在人文社会科学领域，定性研究方法也有着久远的历史脉络。

20世纪60年代定性研究出现严重危机，对于定量研究话语霸权反抗，这一时期在北美地区，格拉泽和斯特劳斯提出扎根理论，为定性研究挽救了些许余地。

定性方法的出现源于20世纪最后20所发生的所谓“定性革命”，其出现受到了相关的重视。

“混合方法”一种结合定性方法和定量方法的结合，产生于两大阵营的长期争论对垒中。

他是一种未预料的结果，尽管这种方法仍未完全成熟，但是作为定性和定量之外的第三种选择，逐渐被西方学者看成是“第三条道路”
国内学者沈崇麟（2011）指出定性和定量的结合有以下三个新趋势：①将质性数据尽可能量化，用统计分析来验证理论假设。

②多元方法论，在应用过程中，通过核心概念的测量模型，把质性研究和量化研究结合在一起。

③量化研究者对过度形式化的量化方法不满，试图通过质性方法弥补量化研究的不足。

如杜晓新等在研究中所说，结构方程模型为定性与定量分析的结合提供了有效的手段，但都未做出进一步的讨论，本研究从定量分析方法的结构方程模型原理和步骤来解析定性中代表性
的扎根理论，以此为切入点讨论定性和定量的融合。

二、结构方程模型和扎根理论
（一）结构方程模型简介
上世纪70年代，由K?Joreskog等人提出了结构方程模型（Structureal Equation Modeling SEM）至80年代相应的数据分析软件LISREL已经趋成熟，被称为近年来统计学三大发展之一。

从90年代初至今，其在社会科学研究领域中已得到了广泛的应用。

结构方程模型属于高级定量统计方法，同时考虑了多个变量的相互影响，从多个维度考察事物的性质。

允许变量含测量误差，结构方程模型包含了方差分析、回归分析、路径分析等统计分析技术，还有诸如聚类、迭代、拟合等定量的方法，弥补了传统回归和因子分析的不足。

在心理学、教育学、社会学等社科类学科中概念往往难以直接准确测量，需要借助外显易得的测量指标，用外显的测量指标间接计算不易得的概念作为潜变量（latent variable），同时分析得出概念间关系相比于传统回归方法更为准确合理。

（二）扎根理论简介
扎根理论研究方法首先由格拉泽和斯特劳斯于1967年提出，一经提出便在社会学等研究领域产生了极大的影响，被认为是走在“质化研究革命的最前沿理论”（Charmaz， 2000）。

不仅为社会科学研究提供了一种具体的研究方法，而且其基本原则也成为定性研究的一般指导性原理。

扎根理论虽形成于社会学研
究领域，却被广泛运用到不同的学科，尤其是健康、护理、教育、商业以及心理学研究等领域。

扎根理论的主要宗旨是从经验资料的基础上建立理论。

直接从实际观察入手，从原始资料中归纳，然后上升到理论。

扎根理论自下而上建立实质理论的方法，在系统收集资料的基础上寻找反映社会现象的核心概念，然后通过这些概念之间的联系，建构相关的社会理论。

也就是说从经验事实中抽象出新的概念和思想。

在哲学层面上，扎根理论方法基于后实证主义的范式，强调对目前已经建构的理论进行证伪。

扎根理论的操作程序一般包括：1）从收集的资料中产生概念，对资料进行逐级登录；2）不断对资料和概念进行比较，生成理论；3）发展理论性概念，建立概念和概念之间的联系；4）理论性抽样，系统地对资料进行编码；5）建构理论，力求获得理论概念的密度、变异度和高度的整合性。

对资料进行逐级编码是扎根理论中最重要的一环，其中包括以下三级编码。

1. 一级编码，将收集的资料打散，赋予概念，然后再以新的方式重新组合进行操作化。

基于类属的属性和维度，对研究的现象加以命名及类属化。

2. 二级编码，二级编码的主要任务是发现和建立概念类属之间的各种联系，包括因果关系、时间先后关系、语义关系、情境关系、相似关系等。

研究者对一个类属进行深入分析，围绕着这一个类属寻找相关关系，因此称之为“轴心”。

随着分析的不
断深入，各个类属之间的联系逐渐具体。

3. 三级编码，在所有已发现的概念类属中经过系统地分析以后确定一个“核心”作为类属，核心类属在与其他类属的比较中一再被证明具有统领性，能够将最大多数的研究结果囊括在一个比较宽泛的理论范围之内。

扎根理论编码产生了分析的骨头，理论整合会把这些骨头组合成一套可用的骨架，在编码的基础上产生形成分析框架。

（三）二者结合的天然属性
如何使量化研究和质性研究方法有机结合在一起，在社会研究方法论、具体的方法和技术等方面还有许多问题尚需进一步讨论，不过国外量化研究和质性研究结合也已成为社会科学研究的重要方面。

混合方法可以克服定量和定性方法的缺陷实现优势互补，所以成为西方使用混合方法的一个主要理由。

扎根理论方法的认识论假设、逻辑和系统方法反映了其创始人之一的格拉泽在哥伦比亚大学跟随保罗?拉扎菲尔德（Paul Lazarsfeld）学习严格的定量研究，格拉泽把扎根理论沉浸在冷静的经验主义和严格的编码方法之中，强调生成理论的发现，模仿量化方法部分模糊的专门语言，到了20世纪90年代，扎根理论不仅由于其精确有用而闻名，而且由于其实证主义假设为人所熟知，通过以上描述扎根理论的来源和扎根理论为定量研究者接受的过程，说明二者之间并非隔着不可逾越的鸿沟，同时我们也不难理解，扎根理论在许多方面闪烁着的定量研究范式的光。

三、定量思想和方法在扎根理论中的具体应用
（一）聚类分析
聚类分析（Cluster Analysis）是定量研究数理统计中物以类聚的一种方法，在实际问题中经常要将一些东西进行分类，研究样本或变量之间的关系，一种方法是用相似系数，性质越相近的样品它们的相似系数越近于1（有时为-1），彼此无关的样品它们的相似系数越近于0。

另一种方法是将每一个样品看作二维空间的一个点，并在空间定义距离，距离较近的点归为一类，距离较远的点应属于不同的类。

（二）因子分析
因子分析（Factor Analysis）是通过研究众多变量之间的内部关系，探求数据中的基本结构，并用少数几个因子来表示基本的数据结构的方法。

扎根理论在第二步的聚焦编码中，使用出现频次较高的几类代码，减少类属，在不损失重要信息的基础上去掉非重要的材料，并确定少数因子之间的关系。

编码过程的实现在扎根理论中有契合（fit）和相关（relevance）两个标准，契合的作用和目的如格拉泽和斯特劳斯建立扎根理论的初衷――“填平理论研究与经验研究之间尴尬的鸿沟”，缩小理论与资料间的裂隙，登录被视为“对观察访谈材料打破”和“揉碎”，通过逐字逐句、逐个事件编码，产生数据。

因子分析中，为了使模型拟合更好，更符合理论，可以先通过探索或者依据理论来建立二阶或者更高阶的模型，质性分析
下的扎根理论，在理论建构时也会不断地凝合形成更具有总结性的上位概念。

例如，我们用几个指标来表示语文、数学、英语、自然、历史这一阶五个因子模型，那么就可以考虑在这五个因子基础上建立二阶的学习成绩这个因子，这样做不仅理论上可以解释，产生的二阶因子模型更简约符合理论实际。

（三）迭代
扎根理论下的建构强调对于文本资料不断提取修正，再编码，最后达到一种相对饱和程度，也就是不能再发现新的东西为止，这种不断对文本数据进行加工的思想，在量化数据分析中就是迭代，迭代算法是现代数学中的一个重要技术突破，因为存在潜在变量不能直接估计，所以需要先通过显变量，估计出潜在变量。

通过在上一步估算的基础上，根据定义的规则递推出新值，从而每一步都在向真实的解逼近。

事先不知道什么情况下原始数据和理论模型拟合的好，所以软件会从一个起始值开始，然后把这个算出来的值，依据迭代规则，从变量的前一个值推出其下一个值，每一次都在上一次的基础上进行分析，自定义迭代继续的条件，当条件不满足时退出，迭代结束。

开放式登录的过程类似一个漏斗，开始时登录的范围比较宽，随后不断缩小范围，直至出现饱和。

也就是如前文所说，缩小理论与资料间的裂隙，在结构方程模型中，我们希望依据数据产生的协方差矩阵应用迭代方法找到另一个称之为再生矩阵，二者差距越小，表明数据能够拟合假设的原理，但正如编码最后需
要达到一种相对饱和程度一样，我们无法要求数据和理论假设完全相同。

在质性编码的过程中，对于饱和“程度”不同的学者和应用的研究人员有不同的标准，扎根理论中的饱和是指新收集到的数据可以被已有范畴概括，而不再产生新的范畴，通俗来讲就是不能再得到新的东西，目前收集的数据不能对理论建构做出新的贡献，于是可以主观地认为已经达到了饱和。

实证定量研究一般对数据收集有较高的要求，但扎根理论没有明确阐释何时停止对数据资料的收集。

（四）修正与模型拟合
在模型的修改阶段，根据一系列分析的结果，对模型中各变量间关系进行修正，如果两个变量之间的效应不显著，要将该变量从模型中去除，保留合理的变量数据。

由于结构方程模型要求尽可能多的测量指标包含到模型中，变量越多，越能够接近自然状态，也就越能够发挥结构方程的作用。

通过更多的侧面现象来澄清概念，同时，为了避免被试在自陈量表中存在的如期望偏差等造成结果不准确的情况，在条件允许的情况下，使用多质多法（MTMM），如评价学生的成绩，通过学生自己的作答和老师以及同学的评价，多角度介入，尽可能地达到真实的测试学生水平，没有哪一种方法是完全正确，这正是结构方程对于实证研究的唯一性的一种扩展，也是定性研究所追求的多种视角发现事实与真理。

所谓的多元方法论，也就是利用建模使定性与定量研究二者结合。

与数据亲密接触，从研究对象的词语和行动开始，保持经验的流动性，有助于从新的视角进行下一步深入地分析。

在分析上下工夫，才会避免把日常的观点误以为分析性的观点，让代码（扎根理论中如“经验”“事件”之类的一般术语称之为代码）契合数据，而不是强制数据契合代码，如同在结构方程模型中，我们依据理论去建立模型，作为模型修改的依据，而不是一味地修改数据，以数据为驱动。

扎根理论的结构存在两个维度，使理论命题超越具体时间和地点，产生一般化，以及对行动和事件进行情景分析，这些要求正是实证主义孜孜不倦的追求。

在定量建模中，我们经常遇到拟合问题，如果模型本身样本数据不多，同时模型复杂参数过多，则可能得到过拟合的现象，求解待估计参数的信息多于样本变量数据所提供的信息，也说明模型中包括了样本数据的误差，导致模型无法估计，同时还存在欠拟合现象，就是模型的变量太少，过于简单，所以需要在二者之间平衡，既解释了研究变量的关系，又便于解释推广。

扎根理论中建构代码，当代码和被研究事件的行动与事件形成完美的契合的时候，我们就可能认为编译的代码把握了经验的现实。

在零碎的词语基础上，依据研究人员和研究对象互动，通过研究他们的陈述、观察到的行动以及对场景的回忆，一次又一次地和他们互动，并不断地完善，试图从研究对象的视角来理解他们的观点和行动。

通过挖掘数据，解释研究对象默认的意义，组建了理论的大厦。

四、结论
本文尝试从以上四个方面用结构方程模型原理和方法找出
定性研究重要的理论――扎根理论，在扎根理论的建构中模仿量化方法“模糊的专门语言”。

目前在国内很少有人尝试，也许结构方程模型和扎根理论二者的交融不止于此。

本研究用一种语言去解释另一种语言，亦类似于编码的方式去解读不同的事物，其中自然会存在噪音和“译不准”的问题，其思想层面的共性或称之为找出格拉泽定性研究之下的扎根理论哪些方面透析着定量
研究的光芒。

本文也仅仅从定量的结构方程模型角度，探讨了以扎根理论为指导的理论生成过程中，量化的分析思想和技术如何起作用。

在当下几乎没有学科可以忽视大数据的时代背景下，我们可以预计，借助这个时代浪潮，尤其是对于半结构化的数据的处理，将更加全面、多维度、深层次地发现隐藏在数据背后的理论知识，定性和定量方法二者的界限势必将进一步模糊，定性和定量的结合是现实研究的需要，也是未来不可逆的趋势。