LISREL与PLS路径建模原理分析与比较
结构方程模型构建方法比较
统计与决策2007年9月(理论版)摘要:线性结构关系(LinearStructuralRelationships)和偏最小二乘(PartialLeastSquare)路径分析是构建结构方程模型主要的两类技术。
本文在阐述线性结构关系和偏最小二乘算法的基础上,比较分析了它们的差异,给出了各自的适用条件,指出了偏最小二乘路径分析技术的特点及其在社会科学领域逐渐受到重视的原因。
关键词:因果模型;线性结构关系;偏最小二乘路径分析;差异;适用条件中图分类号:O212.4文献标识码:A文章编号:1002-6487(2007)09-0137-03结构方程模型构建方法比较张军(山东大学管理学院,济南250100)结构方程模型(StructuralEquationModeling,简称SEM)是由瑞典统计学家KarlG·Joreskog于20世纪70年代初期提出来的一种通用线性统计建模技术。
近年来,这一统计建模及分析方法获得了巨大的发展,不仅拥有专属期刊《结构方程模型》(StructureEquationModeling),研究和应用结构方程的论文更是难计其数。
它已经成为心理学、经济学、金融学、管理学、社会学等社会科学领域中一种十分重要的数据分析技巧。
在国内,结构方程模型研究方法则刚刚兴起,相当多的人文社科类实证研究论文中都已经采用了这一建模方法。
目前,主要有两大类估计技术来构建结构方程模型。
一种是基于极大似然估计(ML)的协方差结构分析方法,该方法被称为“硬模型”(HardMode1),以线性结构关系(LinearStructuralRelationships,LISREL)方法为代表;另一种则是基于偏最小二乘法(PLS)的分析方法,被称为“软模型”(SoftModeling),以PLS(PartialLeastSquare)路径分析方法为代表。
国内社会科学研究论文多数采用LISREL方法对SEM参数进行估计。
LISREL与PLS建模方法的分析与比较
LISREL与PLS建模方法的分析与比较李晓鸿【摘要】LISREL与PLS建模方法是目前结构方程建模最流行的两种方法.详细分析两种建模方法,尤其是PLS建模方法;并在此基础上对两种建模方法进行比较,给出各自的应用条件.%LISREL modeling and PLS path modeling currently are the most popular two methods of structural equation modeling. This article provides a detailed analysis of two kinds of modeling methods, especially PLS modeling method, then compares these two kinds of modeling methods and provides their application conditions.【期刊名称】《科技管理研究》【年(卷),期】2012(032)020【总页数】4页(P230-233)【关键词】结构方程建模;协方差结构的分析方法(LISREL);偏最小二乘法(PLS);应用条件【作者】李晓鸿【作者单位】西安邮电学院经济与管理学院,陕西西安710061【正文语种】中文【中图分类】TP18;TP319;R195.1结构方程建模(Structural Equation Modeling,SEM)已渐流行,并成为十分重要的数据分析工具。
SEM具有两种建模方法:一种是以协方差结构为基础的建模方法,又称LISREL(LInear Structural RELationship)建模方法;另一种是以偏最小二乘法为基础的路径建模方法,常被称为PLS(Partial Least Square)建模方法。
目前,有关LISREL建模方法的研究已经较为普遍,但是关于PLS建模方法的研究却比较缺乏。
结构方程模型
结构方程模型:定义:结构方程模型早期称为线性结构防城模型(Linear Structural Relations hips,简称LISREL)或称为工变数结构分析(Coratiance Strucyure A nalysis)。
主要目的在于检验潜在变项之关系与数个潜在变项间的因果关系。
【陈宽裕,《结构方程模型》-1996年11月】结构方程模型(Structural·Equation·Modeling,SEM)是一种非常通用的、主要的线性统计建模技术,广泛应用于经济学、心理学、社会学、管理学等领域的研究,是社会科学研究中的一个非常好的方法。
内容:结构方程模型包括测量方程(LV和MV之间关系的方程,外部关系)和结构方程(LV 之间关系的方程,内部关系),以ACSI模型为例,具体形式如下:测量方程 y=Λyη+εy , x=Λxξ+εx=(1)结构方程η=Bη+Гξ+ζ或(I-Β)η=Гξ+ζ(2)其中,η和ξ分别是内生LV和外生LV,y和x分别是和的MV,Λx和Λy是载荷矩阵,Β和Г是路径系数矩阵,ε和ζ是残差。
对这类模型进行参数估计,常使用偏最小二乘(Partial Least Square,PLS)和线性结构关系(LInear Structural RELationships,LISREL)方法。
测量方程描述潜变量与指标之间的关系;结构方程则反映潜变量之间的关系。
——【杜春雪,《结构方程模型理论的建立与应用》,大众科学·科学研究与实践,2008年第18期】SEM模式中,存在四种变量:潜在自变项、潜在依变项、X变项、Y变项。
用法:SEM 具有理论先验性能同时处理测量与分析问题以共变数的运用为核心,亦可处理平均数估计适用于大样本之分析包含了西多不同的统计技术重视多重统计指标的运用负荷量 潜在变项 观察变项 误差结构方程模型是一种非常通用的、主要的线形统计建模技术,广泛应用于心理学、经济学、社会学、行为科学等领域的研究。
结构方程建模数据的PLS分析简版
结构方程建模数据的PLS分析结构方程建模数据的PLS分析1. 引言结构方程建模(Structural Equation Modeling,简称SEM)是一种多变量分析方法,被广泛应用于社会科学、经济学、管理学等领域。
其中,PLS(Partial Least Squares)是结构方程建模中最为常用的一种方法。
本文将介绍PLS分析在结构方程建模中的应用,以及如何进行PLS分析。
2. PLS分析概述PLS分析是一种非参数的统计方法,其主要用于解决变量之间的线性关系问题。
与传统的最小二乘回归(OLS)相比,PLS分析更适用于样本量较小、自变量高度相关的情况。
在结构方程建模中,PLS分析可以用来评估变量之间的因果关系和预测模型的拟合程度。
3. 数据准备在进行PLS分析之前,首先需要准备好数据。
数据应包含自变量(预测变量)和因变量(被预测变量),并进行标准化处理,以消除变量间的量纲差异。
此外,还需要确保数据的完整性和准确性,以避免分析结果的偏差。
4. 模型构建PLS分析的核心是模型构建。
在结构方程建模中,模型可以通过路径图来表示。
路径图描述了变量之间的因果关系,并指导了PLS分析的过程。
根据路径图,我们可以指定出每个变量之间的关系,并设置相应的权重。
5. 模型估计在模型构建完成后,需要进行模型估计。
PLS分析使用了最小二乘法来估计模型的参数。
通过最小化实际值和模型预测值之间的误差平方和,可以得到模型参数的估计值。
此外,还可以计算拟合度指标(如均方根误差、可释方差等)来评估模型的拟合程度。
6. 结果解释在模型估计完成后,需要对结果进行解释。
解释分析可以通过查看参数估计值、路径系数、拟合度指标等来完成。
根据分析结果,可以判断变量之间的影响程度、统计显著性以及模型的解释力。
7. 结论本文介绍了PLS分析在结构方程建模中的应用。
通过PLS分析,可以对变量之间的关系进行建模,并评估模型的拟合程度。
在进行PLS分析时,需要准备好数据,构建模型,进行模型估计,并解释结果。
基于多线程的顾客满意度PLS路径模型算法
基于多线程的顾客满意度PLS路径模型算法潘王海;高艳艳【摘要】在计算顾客满意度模型时,普遍使用结构方程模型来求解复杂的多维度关系.而针对结构方程模型的计算,偏最小二乘(PLS)有效地解决了模型分析过程中大量潜变量无法直接采样获得的问题,建立了显变量与潜变量之间的关系,增强了模型的直观性和通用性.为了提升偏最小二乘算法的效率,在针对结构方程模型的计算中,利用多线程将模型计算并行化,以提升计算效率.探讨了基于Java多线程的顾客满意度PLS路径模型的优化算法,并在多核计算机上实验证明,多线程化的PLS路径模型能够显著提升计算速度.%While computing Customer SatisfactionModel,structural equation model is always used to solve the influence of complicated multi-dimensional.Partial Least Squares (PLS),used in computing of structural equation model,works effectively with the problem that a large amount of latent variables cannot be sampling directly.In the process of model analysis,the PLS path model builds up the relationship between latent variables and manifest variables,and enhances the intuitive and generality of model.In order to improve the efficiency of PLS,we parallelize the computational process to get more efficiency.This article mainly talks about the PLS path model based on customer satisfaction model and the distributed algorithm based on Java multi-thread.It is proved on multi-core computer that PLS path model implementing on multi-thread can obvious improve speed of computing.【期刊名称】《计算机系统应用》【年(卷),期】2013(022)004【总页数】5页(P95-99)【关键词】顾客满意度;PLS路径模型;多线程;并行计算【作者】潘王海;高艳艳【作者单位】天津大学管理与经济学部,天津 300072;天津大学管理与经济学部,天津 300072【正文语种】中文经济的发展带动了评定经济健康的标准, 顾客满意度逐渐成为了生产力指标评价的有益补充, 并且完善了现有的经济测评体系. Fornell等人通过对ACSI(美国顾客满意度指数)的研究发现, ACSI越高公司表现越好. 顾客满意指数的变化, 可以与公司的盈利状况、股票价格、CPI、生产率和失业率、GDP进行比较, 进而利用这些指数来预测宏观经济发展变化的趋势. 顾客满意指数己经成为一种新的度量现代经济运行质量的方式, 其重要性显而易见. 而最具代表性的满意度计算模型为SCSB、ACSI和ECSI[1]. 我国基于满意度指数的构建起步比较晚, 从 1999年开始,我国开始中国国家顾客满意度的研究探究.满意度的评测模型通常使用PLS和LISREL来建立, 相对而言, PLS更具有优势一些, 针对潜变量可以明确求出对应的值, 不需要假定数据分布, 样本量要求比较低, 所以通常使用PLS路径模型进行满意度模型的建模与求解. 传统的PLS算法依据模型结构进行单线程求解, 当数据量较大, 测评模型较复杂时, 计算强度较大. 因此可以采用基于多线程的并行计算优化PLS路径模型的计算流程, 以提升计算效率.1 PLS路径模型通常的满意度模型采用结构方程模型进行建模,结构方程模型包括三部分: 测量模型、结构模型和模型假设[2].1.1 PLS路径模型分析在结构方程模型中, 测量模型表示显变量(即观测值)与潜变量之间的关系; 结构模型表示潜变量之间的关系. 显变量是可以直接进行观测并得出分值的变量,而潜变量是不能直接测量的变量, 需要通过观测变量来衡量. 结构方程模型结构示意图如下:图1 结构方程模型结构图① 测量模型测量模型分为反应式与构成式: 由显变量反应潜变量, 即反应式; 由显变量构成潜变量, 即构成式. 反应式(The reflective way)通常写成如下的测量方程:其结构图为:图2 反应式结构图构成式(The Constructive way)通常写成如下的方程:其结构图为:图3 构成式结构图其中,X =(X ,X ,...,X )T为显变量的构成的向量h 1 2hξ为潜变量的估计值πh为参数的估计值为权重的向量② 测量模型结构模型表示潜变量之间的关系, 每一个潜变量都与其他潜变量之间构成联系, 整个结构模型构成一个树. 通常写成如下的测量方程:其结构图为:图4 结构模型结构图1.2 模型求解PLS路径模型求解分为测量模型计算和结构模型计算.① 测量模型计算首先根据具体分值与权重进行潜变量的估计, 计算完成之后, 需要进一步将y标准化为方差为1:同时根据标准化后的权重计算出值和值.② 结构模型计算进行结构模型计算时, 根据测量模型估计出的y进行 jz的估计.当计算结构模型的时候, 有三种不同的计算模式,分别是: Centroid Scheme, Factorial Scheme和Path weighting Scheme. 这三种不同的模式在结构模型估计潜变量值时使用 'jje 的计算方法不同.Centroid Scheme: e jj '为 y j和 y j'之间的符号Factorial Scheme: e jj '为 y j和 y j'之间的相关系数Path weighting Scheme: e jj '为yj 指向 y j ': 相关系数,yj'指向 y j: 回归系数③ 估计 w jh对于反应式对于构成式④ 估计出潜变量值后, 再用回归方法重新计算各类系数.2 基于多线程并行算法设计与实现2.1 PLS路径模型并行性分析① 数据并行性偏最小二乘路径模型的计算中, 数据的标准化、缺失值补充与初始化可以在数据拆分时同时完成. 每一个变量的数据将会反复进入测量模型计算, 故针对数据进行按测量模型拆分, 有利于并行计算. 所以数据层面并行性是可行的.② 依赖关系考虑依赖关系, 测量模型依赖于数据与上一次迭代结果. 结构模型依赖于测量模型的估计结果与上一次的迭代结果. 考虑依赖关系中的数据依赖, 因为针对数据只有读取操作, 而读取操作是并行友好的. 考虑上一次迭代结果, 针对本次计算也是读取操作, 是并行友好的. 所以根据依赖关系, 测量模型的计算是可以并行化进行.③ 迭代计算PLS路径模型需要反复迭代计算测量模型与结构模型, 每一次计算都是由各部分独立计算完毕, 继而进行合并、下一步处理, 并再一次迭代. 各部分独立进行的计算属于并行友好, 可以进行多线程计算.所以根据数据、依赖和迭代三部分的并行分析,可以得出PLS路径模型是可以并行化的.2.2 并行算法流程Java语言原生对多线程有着良好的支持, 在java.util.concurrent包中有着对并发编程的良好支持,并且在JVM的进程中对并发有着良好的控制. 我们可以使用JDK 中的ThreadPoolExecutor类来构建线程池,使用Runnable接口实现对应的并行执行部分[3].考虑PLS路径模型的计算步骤, 可以得出如下的算法流程.① 读取数据, 进行数据异常值处理, 缺失值补全,数据标准化.② 根据变量对数据进行拆分, 考虑数据以读取为主, 选择将数据存储于LinkedList 中, 以提供最快的遍历速度. 以 ConcurrentHashMap作为变量与数据列表的存储.③ 针对测量模型, 对权重进行初始化, 一般测量模型的初始化权重为(1 ,0,0,…,0)T.④ 使用多线程依据式(4)到(7)进行测量模型运算,估计潜变量的值.⑤ 使用式(8)进行z值估计, 并使用z值, 根据测量模型的类型, 进行权重估计, 如式(9)和(10)所示. 估计出权重需要与上一次估计出的权重进行对比, 若两者差距较大, 则根据估计出的权重再次运算, 重新估计潜变量的值; 若权重已经收敛, 即两次的差小于10 - 5, 则计算结束, 进入下一步.⑥ 计算各类回归系数, 并计算出各个变量的估计值. 求出满意度结果. 流程图如图5所示:图5 PLS并行算法整体结构2.3 模型算法实现2.3.1 模型核心计算实现① 权重新定算法缺失值权重的计算: ①模式 A(Mode A): 权重根据公式计算; ②模式 B(Mode B): 当没有缺失值按照公式计算; 有缺失值时, 采用成对删除法把对应的缺失样本值删除, 即不考虑在内, 然后利用公式来计算权重[4]. 在存在缺失值时, 只要该样本中有一个显变量的值没有缺失, 不应该删除该样本, 应采用“权重新定”对权重进行处理. 权重在原有权重总和为1的基础上进行重新计算.使用“权重新定”计算潜变量估计值的代码如下:② 多线程线程池多线程计算时, 需要维护线程的数目, 以节约系统资源, 避免大量的建立与销毁线程带来的损耗. 使用线程池对线程进行管理, 可以很好的复用线程, 并能够良好的处理线程的生命周期.并行计算代码如下:传入测量模型对象, 对象中包括测量模型的基本信息与数据存储. 创建线程数目为CPU内核数目的两倍. 以保证最大程度的使用CPU.public void runInParallel(List<Measure> measures){int cpuCount=Runtime.getRuntime().availableProcessors();//建立线程池, 最小线程数为内核数目, 最大为内核数目的两倍,//创建任务并提交到线程池中//MeasureCalculator实现Runnable接口, 并且在run方法中实现测量模型计算, 包括潜变量估计, 系数计算等③ 回归系数计算该计算方法中, 最核心的部分即为回归计算相关系数. 根据路径指向的不同, 测量模型分为反应式和构成式.计算测量模型回归系数的核心代码如下://如果是反应式, 计算公式为, 则采用一元回归计算//返回回归系数//如果是构成式, 即由显变量指向潜变量, 计算公式为: 采用多元线性回归.2.3.2 海量数据计算扩展当数据量超过单机可以承受的范围, 或者模型极度复杂, 计算所需资源过大时, 可以将多线程计算扩展为多机并发计算. 可以考虑采用Web Service进行远程计算, 或者使用 RPC通讯. 也可以使用主流架构如Hadoop进行并行编程. 使用HDFS进行数据存储, 使用Zookeeper进行任务协调, 使用MapReduce架构进行并行调度与计算[5].3 实验效果① 实验基础环境实验分别在1核2核与4核的机器上运行, 系统为Fedora15, 内存为2G, 运行环境Java版本为Java 1.6_06.除了CPU的区别外, 其他环境配置三台机器皆相同.② 实验数据集实验使用的数据集为通过定向问卷调查获得的数据. 调查问卷基于学生满意度设计的中国大学生成长体验调查问卷进行调查. 该满意度模型的PLS路径模型共有 12个潜变量, 89个显变量. 共收集调查问卷1439份, 其中有效问卷1365份.③ 实验结果单线程运行时, 分别针对流程不同阶段进行时间测量, 测试分别得到数据处理, 模型创建, 迭代执行和结果处理的时间, 结果如下:表1 模型单线程下各个环节时间表样本数目 50 0 900 1300数据读取与处理(ms) 23 8 321 553模型创建及初始化(ms) 12 24 65模型迭代计算(ms) 18 70 4437 9438结果生产与处理(ms) 31 71 119可以发现, 单线程运行时, 数据读取与迭代计算为最消耗时间的两个部分, 而初始化与结果处理, 消耗时间相对比较少. 数据读取涉及到数据库会话的连接与销毁和数据传输的网络IO所占用的时间, 其中数据库会话是很昂贵、很消耗资源的, 但是并行读取会创建更多的会话, 占用更多的资源, 相比而言提升空间不大. 所以模型计算的瓶颈在于迭代计算.迭代过程使用多线程并行化后, 在三台不同内核数目的机器上进行完整的 PLS路径模型求解的测试,使用数据集的数据量为1300, 得到的测试数据如下:表2 多核不同线程数计算时间对比CPU内核数单线程执行(ms) 多线程并行(ms) 时间倍数1核 10 175 11938 0.85 2核 10 114 6012 1.7 4核 10 051 3310 3.1可以看出, 多核的CPU在多线程执行时, 执行速度上有较大提升, 但是提升的幅度相比内核数目的提升仍要少一些. 因为多核CPU几个内核之间的调度仍然需要消耗资源, 所以内核数目越多, 提升倍数越少.由于模型计算更多的是CPU密集性运算, 单核的CPU在多线程运行下, 反而出现多个线程争抢 CPU时间,增多CPU调度次数的情况, 消耗了更多的系统资源.针对多核CPU机器下单线程执行, 多核CPU可以提供更多的CPU时间片, 执行效率上有一定提升.4 结语本文结合满意度中的结构方程模型和PLS路径建模, 分析了 PLS路径模型计算过程中的并行性, 将满意度模型的PLS路径模型算法中相对消耗时间并且可以并行化的回归计算使用多线程方式并行计算, 并且基于CPU核数进行测试对比, 实验使用了一核, 双核和四核的三种计算机, 通过数据对比, 可以发现多线程明显提升了模型的计算速度. 文章同时给出了基于java concurrent的代码实现.参考文献【相关文献】1 Fornell C,刘金兰.顾客满意度与 ACSI.天津:天津大学出版社,2006.2 赵富强,张磊,陈钒.基于PLS路径模型的顾客满意度测评研究.北京理工大学学报,2010,12(4):61-65.3 Oaks S, Wong H. Java Thread 3rd Ed.O'Reilly Inc. 2004,9.4 Tenenhaus M, Vinzi VE, Chatelin YM, Lauro C. PLS path modeling. Computational Statistics and Data Analysis, 2005,48(1).5 Dean J, Ghemawat S. MapReduce: Simplied Data Processing on Large Clusters. Google Inc. 2004.。
结构方程建模数据的PLS分析
PLS分析的步骤和流程
数据准备
收集和整理数据,进行必要的 预处理,包括缺失值处理、异
常值检测和数据标准化等。
构建模型
选择合适的自变量和因变量, 构建预测模型,确定模型的复 杂度和拟合度。
模型评估
使用交叉验证、外部验证等方 法评估模型的预测能力和稳定 性。
结果解释
解释模型的预测结果,并根据 结果进行相应的分析和决策。
02 PLS分析方法介绍
PLS分析的基本概念
01
PLS分析是一种基于偏最小二 乘回归的多元数据分析方法, 用于处理复杂的数据结构和变 量关系。
02
它通过构建预测模型来描述因 变量和自变量之间的关系,并 评估模型的有效性和预测能力 。
03
PLS分析特别适用于处理具有 潜在变量和交互效应的数据结 构,能够处理更多的变量和更 复杂的关系。
PLS分析的优缺点
优点
PLS分析能够处理复杂的变量关系和 潜在变量,适用于大数据集和小样本 数据,能够提供更准确的预测和更好 的解释性。
缺点
PLS分析对数据结构和共线性较为敏 感,需要选择合适的自变量和因变量, 对模型的复杂度和拟合度也需要进行 适当控制。
03
结构方程建模数据的收集与处 理
数据收集的方法与技巧
结果解读
根据分析结果,解 读模型的有效性、 预测精度等指标。
确定研究目的
明确研究的目标和 问题,为结果解读 提供指导。
建立模型
选择适当的结构方 程模型,并使用PLS 算法进行拟合。
结论与建议
根据解读结果,得 出结论并提出相应 的建议。
结果解读的注意事项
数据的可靠性
确保数据的准确性和可靠性,避免误 差和异常值的影响。
顾客满意度模型估计的PLS与LISREL
顾客满意度模型估计的PLS 与LISREL中国人民大学 金勇进 梁燕顾客满意度模型是一个多方程的因果关系系统——结构方程模型(SEM ,Structural Equation Model ),有多个因变量,是一个原因和结果关系的网,模型必须要按照这些关系进行估计。
模型中包括质量感知、顾客满意度、顾客忠诚度和企业形象等隐变量,这些隐变量只能通过多个具体测量变量来间接衡量。
模型中允许自变量和因变量含有测量误差,还必须要计算出来隐变量的表现得分(例如通过多个测量变量的加权指数)。
以ACSI 模型为例,它就是一个结构方程模型,包括结构方程(隐变量之间关系的方程)和测量方程(隐变量和测量变量之间关系的方程)1。
要对结构方程模型进行参数估计,目前最经常使用的两种方法是PLS (Partial Least Square )方法和LISREL (LInear Structural RELationships )方法。
这两种方法既有相同之处,也有许多不同之处。
本文主要讨论两种方法的算法,以及他们之间的联系与区别,并根据实证案例,提出我国在构建顾客满意度模型过程中使用的方法。
一、PLS 和LISREL 方法PLS (Wald ,1982)是将主成分分析与多元回归结合起来的迭代估计,是一种因果建模的方法。
瑞典、美国和欧盟模型都使用这种方法进行估计。
在ACSI 模型估计中2,该方法对不同隐变量的测量变量子集抽取主成分,放在回归模型系统中使用,然后调整主成分权数,以最大化模型的预测能力。
PLS 方法的具体步骤如下所示。
步骤1:用迭代方法估计权重和隐变量得分。
从④开始,重复①—④直至收敛。
① 内部权重 v ij = sign cov(ηj ,ηi ) 如果ηj 和ηi 有直接关系如果ηj 和ηi 没有直接关系 (1)② 内部近似。
∑=ijjijY v:~η (2)③ 解出外部权重j k w ~。
∑+=ij j k jnn k k jnd y w ~~η (3)④ 外部近似。
pls法建模
pls法建模PLS法的主要思想是在建模过程中,先通过对预测变量和响应变量进行主成分分析,得到新的综合变量,再利用这些综合变量来建立回归模型。
PLS法的目标是通过最小化预测变量与响应变量之间的残差平方和,找到预测变量与响应变量之间的最大相关性。
在建模过程中,PLS法既考虑了预测变量之间的相关性,又考虑了预测变量与响应变量之间的相关性,因此能够更准确地进行建模和预测。
PLS法在建模和预测问题中具有许多优点。
首先,PLS法不受预测变量之间的多重共线性问题的影响,能够有效地处理高维数据。
其次,PLS法能够在建模过程中考虑到预测变量与响应变量之间的相关性,能够更好地捕捉到数据中的信息。
此外,PLS法还可以通过引入惩罚项来控制模型的复杂度,避免过拟合问题。
PLS法的建模过程包括以下几个步骤。
首先,对预测变量和响应变量进行标准化处理,使其具有相同的尺度。
然后,通过对预测变量和响应变量进行主成分分析,得到新的综合变量。
接下来,通过逐步回归的方法,选择与响应变量相关性最强的综合变量,建立起初步的回归模型。
最后,通过交叉验证等方法,对模型进行优化和验证,选择最终的最优模型。
PLS法在多个领域中都得到了广泛的应用。
在化学领域,PLS法可以用于分析光谱数据、色谱数据等。
在生物医学领域,PLS法可以用于预测疾病风险、药物疗效等。
在工业领域,PLS法可以用于预测产品质量、优化工艺参数等。
在金融领域,PLS法可以用于预测股票价格、汇率走势等。
总之,PLS法在各个领域中都具有广泛的应用前景。
总结起来,PLS法是一种多元统计分析方法,通过寻找预测变量与响应变量之间的最大协方差方向,将多个预测变量转化为少数几个综合变量,从而降低了建模的复杂度。
PLS法能够在建模过程中同时考虑到预测变量之间的相关性和预测变量与响应变量之间的相关性,具有较好的建模和预测性能。
PLS法在多个领域中都得到了广泛的应用,对于解决实际问题具有重要的意义。
路径模型和PLS
• 两步确定权重 (wi): PLS估计步骤: • 第一步: 外部近似(类似于主成份分析for reflective, 回归 for formative indicators ) • 第二步: 内部近似 (三种方法: centroid, factor, and path weighting scheme)
两种模型
• 基于协方差(或最大似然)的方法: Covariance-based SEM (软件工具: EQS, AMOS, SEPATH, and COSAN, the LISREL) • 基于方差(成分)的方法: Variancebased SEM (Component-based SEM), and to present partial least squares (PLS)
二者的区别
• Reflective indicators should have a high correlation (as they are all dependent on the same unobservable variable), • formative indicators of the same construct can have positive, negative, or zero correlation with one another (Hulland, 1999), which means that a change in one indicator does not necessarily imply a similar directional change in others (Chin, 1998a).
顾客忠诚度
预期质量
顾客忠诚度
ACSI 美国顾客满意度指数模型 满足顾客需求程度
路径建模
model.wh <- specifyModel() Alienation67 -> Anomia67, NA, 1 Alienation67 -> Powerless67, lamb67, NA Alienation71 -> Anomia71, NA, 1 Alienation71 -> Powerless71, lamb71, NA SES -> Education, NA, 1 SES -> SEI, lamb, NA SES -> Alienation67, gam1, NA Alienation67 -> Alienation71, beta, NA SES -> Alienation71, gam2, NA Anomia67 <-> Anomia67, the1, NA Anomia71 <-> Anomia71, the1, NA Powerless67 <-> Powerless67, the2, NA Powerless71 <-> Powerless71, the2, NA Education <-> Education, the3, NA SEI <-> SEI, the4, NA Anomia67 <-> Anomia71, the5, NA Powerless67 <-> Powerless71, the5, NA Alienation67 <-> Alienation67, psi1, NA Alienation71 <-> Alienation71, psi2, NA SES <-> SES, phi, NA
路径模型和PLS
B
C
D
结果
发现市场细分受到市场需求、竞争态势、 产品特性等多方面因素的影响,这些因素 之间也存在相互影响。
分析方法
通过路径分析方法,建立市场细分路径模 型,并利用PLS进行模型验证和优化。
案例四:产品创新扩散路径模型
目的
探究产品创新扩散的机制及 各因素之间的因果关系。
数据来源
市场调查数据、行业报告、 企业年报等。
处理共线性
当自变量之间存在高度相关或共线性时,PLS能够 提供一个稳定的预测模型。
预测导向
PLS专注于建立预测模型,而不是解释变量之间的 关系。
适用于小样本数据
与传统的最小二乘回归相比,PLS对样本大小的要 求较低。
PLS的算法原理
双线性模型
PLS基于双线性模型,该模型描述了自变量和因变量之间的关系。
构建路径模型
确定因果关系
基于理论和实证研究,确定输入变量与输出变 量之间的因果关系。
构建路径图
根据因果关系,使用路径图描述变量之间的因 果路径。
设定假设
根据路径图,设定关于因果关系的假设。
使用PLS进行参数估计
模型训练
使用PLS算法对数据进行训练,估计路径模 型中的参数。
数据准备
收集数据,并进行数据清洗和预处理。
迭代过程
PLS算法通过迭代过程来估计模型的参数。在每次迭代中,算法使 用部分最小二乘法来更新模型参数,并使用残差来更新响应变量。
交叉验证
为了评估模型的性能,PLS使用交叉验证技术来估计模型的预测误差。
PLS的应用领域
市场研究
在市场研究中,PLS用于预测消费者对产品或服务的 态度和行为。
金融
在金融领域,PLS用于预测股票价格、市场趋势和风 险评估。
最新揭开LISREL的神秘面纱破解SIMPLIS的密码幻灯片课件
Path diagram: 列印出路徑關係圖 位於整個語法的最後一列
程式估計問題
輸入檔語法錯誤(syntax errors)
使用程式無法辨認的指令或指令所寫代號撰寫錯誤 必要指令被遺漏 指令列前後排序的邏輯錯誤 使用無效的指令名稱
資料檔錯誤
程式內界定Observed variables個數與資料檔不符 資料檔中有非數字型的特殊符號,如文字。 資料中含有不合理的數值,如五點量表中有負值或出現9 資料陳列順序與程式界定變項的順序不一致
F_A_T_A_L_E_R_R_O_R: Unable to star iterations because matrix SIGMA is not positive definite. Provide better staring values.
不良的起始值所造成
F_A_T_A_L_E_R_R_O_R: Admissibility test failed.
Data: 可輸入原始資料,共變異數矩陣、相關矩陣、平均數、標準差等五種資料。 輸入方式有兩種:
讀取外部資料:如從外部資料讀取原始檔案,寫成:raw data from file *.psf
將資料寫成語法:Covariance Matrix: 38.6 13.6 16.9 24.3 8.0 27.2 或 Covariance Matrix 38.6 13.6 16.9 24.3 8.0 27.4
RS: 矩陣形式的殘差值、適配 的共變數矩陣與標準化殘差Q 型圖
MI: 修正指數
VA: 變異數與共變數
DWLS
FS: 因素分析迴歸
AD: 檢查估計值的適當性
PC: 參數估計之間的相關係數
IT: 疊代次數,預設為20
结构方程建模数据的PLS分析
(六)项目研究进度安排
• 2014.09-2015.06对顾客满意指数分析模型进行改进; • 2015.07-2015.11针对欧洲顾客满意数据进行结构方程建 模的PLS分析; • 2015.12-2016.03 对分析结果进行解释,并给出误差比较。
• (四)容许更大弹性的测量模型 传统上,我们只容许每一题目(指标)从属于单一 因子,但结构方程分析容许更加复杂的模型。例如,我们 用英语书写的数学试题,去测量学生的数学能力,则测验 得分(指标)既从属于数学因子,也从属于英语因子(因 为得分也反映英语能力)。传统因子分析难以处理一个指 标从属多个因子或者考虑高阶因子等有比较复杂的从属关 系的模型。
(三)国内外动态研究现状和发展
• 结构方程式是在20世纪70年代Karl Joreskog和Dag Sorbom等学者所 提出的统计理论基础上发展而成的。是对探索因子分析、验证性因子 分析、路径分析、多元回归及方差分析等统计方法的综合应用和改进 提高。最近一二十年来,结构方程已经成为一种非常通用的、主要的 线性统计建模技术,广泛应用于经济学、管理学、行为科学等领域的 研究,尤其是顾客满意指数分析模型。某种程度上,它可以视为计量 经济学、计量社会学和计量心理学等领域统计分析方法的综合。人们 所熟悉的多元回归、因子分析和路径分析等统计方法实际上都是结构 方程模型的一种特例。结构方程模型目前仍是多元统计分析中一个前 沿研究领域,新的模型构建技术不断被提出。偏最小二乘法(PLS) 算法是一种新型的多元统计分析技术,其研究的重点是多因变量对多 因变量的回归建模,能在自变量之间存在多重共线性的条件下进行建 模,更易于辨识信息与噪声,对因变量也有较强的解释能力。
Hale Waihona Puke • (五)估计整个模型的拟合程度 在传统路径分析中,我们只估计每一路径(变量间 关系)的强弱。在结构方程分析中,除了上述参数的估计 外,我们还可以计算不同模型对同一个样本数据的整体拟 合程度,从而判断哪一个模型更接近数据所呈现的关系。
结构方程模型Lisrel和BP神经网络模型与学习算法对比分析.ppt
13
例子:员工工作满意度的测量
概念模型:
x外源指标
工作方式选择 工作自主权 工作目标调整
外源潜变量
y内生指标
任务完成时间充裕度
工作负荷轻重 工作节奏快慢 工作内容丰富程度 工作单调性 工作多样性程度
内生潜变量
工作负荷
工作满意度
目前工作满意度 工作兴趣 工作乐趣 工作厌恶程度
(2)模型拟合(model fitting)
6
二、结构方程简介
• 简单来说,结构方程模型分 为: • 测量方程(measurement equation)测量方程描述潜变 量与指标之间的关系,如工 作方式选择等指标与工作自 主权的关系;
工作方式选择
工作自主权 工作目标调整
目前工作满意度
工作满意度
工作兴趣 工作乐趣 工作厌恶程度
二、结构方程简介
9
(二)结构模型
• 对于潜变量间(如工作自主权与工作满意度)的 关系,通常写成如下结构方程:
B
• 其中:B——内生潜变量间的关系(如其它内生潜 变量与工作满意度的关系); • —外源潜变量对内生潜变量的影响(如工作 自主权对工作满意度的影响); —结构方程的残差项,反映了在方程中未能 • 被解释的部分。
29
模型 Mc拟合结果
•
• •
2 (93)= 148.61, RMSEA=.040 NNFI = 0.96, CFI = 0.97。 Q8在A负荷为 0.54,在B负荷为 -0.08 因为概念上Q8应与B成正相关,故不合理。 而且这负荷相对低,所以我们选择Mb 通常,每题只归属一个因子
• 模型参数的估计
模型计算(lisrel 软件编程)
结构方程建模数据的PLS分析
结构方程建模数据的PLS分析正文:一、引言在社会科学研究中,结构方程建模(Structural Equation Modeling,简称SEM)是一种常用的统计分析方法。
它能够通过构建研究模型来研究变量之间的关系,并对模型进行参数估计和假设检验。
其中,PLS(Partial Least Squares)是一种常用的SEM方法,特别适用于小样本和非正态分布数据。
本文将介绍如何进行PLS分析,包括模型构建、数据收集、变量筛选、模型拟合和结果解释等方面。
二、数据收集与准备1·变量选择:首先需要根据研究目的确定需要收集的变量。
变量可以分为自变量和因变量,自变量是用来解释因变量的变量,而因变量是需要被解释的变量。
在选择变量时,需要考虑到理论依据和实践中的重要性。
2·数据收集:根据变量的定义和测量方法,设计合适的问卷或实验来收集数据。
在收集数据时,需要注意数据的可靠性和有效性,确保数据所代表的现象和概念是准确的。
3·数据清洗:在进行PLS分析之前,需要对收集到的数据进行清洗和处理。
首先要检查数据的完整性,确保没有缺失值。
然后,可以进行数据的标准化处理,以消除量纲不同带来的影响。
三、模型构建与验证1·变量测量模型:在进行PLS分析之前,需要先构建变量的测量模型。
测量模型是指将观测变量与构念(latent construct)关联起来的模型。
可以使用探索性因子分析(Exploratory Factor Analysis,简称EFA)来进行模型构建和验证。
2·结构模型:在测量模型构建好之后,可以开始构建结构模型。
结构模型是指通过自变量对因变量产生影响的关系模型。
可以使用路径分析(Path Analysis)或逐步回归分析(Stepwise Regression)方法来构建结构模型。
3·模型验证:构建好结构模型后,需要对模型进行验证。
可以使用常用的模型拟合指标,如χ^2(卡方值)、GFI(Goodness-of-Fit Index)、RMSEA(Root Mean Square Error of Approximation)等来评估模型的拟合优度。
偏最小二乘路径建模(pls-pm)结构方程
偏最小二乘路径建模(PLS-PM)结构方程一、变量间关系偏最小二乘路径建模(PLS-PM)是一种探索变量间关系的统计方法。
它通过路径图来描述变量之间的因果关系,并使用偏最小二乘回归(PLS)进行模型估计。
PLS-PM适用于变量间存在复杂关系的情境,可以处理多个因变量和自变量,并考虑测量误差和潜在变量的影响。
二、因果关系在PLS-PM中,因果关系是核心概念。
通过路径图,我们可以直观地展示变量之间的因果关系,并根据专业知识或实证数据来构建路径。
在路径图中,箭头表示因果关系,箭头的方向表示因果关系的方向。
通过因果关系,我们可以分析一个变量对另一个变量的影响,以及这种影响是如何传递的。
三、路径图构建构建路径图是PLS-PM的重要步骤。
路径图需要基于理论或实证数据来构建,并遵循一定的原则,如因果关系应该基于理论或实证证据,箭头指向表示因果关系的方向等。
构建路径图时,我们需要确定因变量和自变量,并考虑潜在变量的影响。
路径图可以帮助我们更好地理解变量之间的关系,并为后续的模型估计提供基础。
四、模型估计在PLS-PM中,模型估计使用偏最小二乘回归(PLS)进行。
PLS 是一种广义的线性模型,通过迭代的方式对模型进行拟合,并考虑到测量误差和潜在变量的影响。
在模型估计过程中,我们需要确定合适的模型拟合指标,如R方、Q方等,并对模型的拟合效果进行评估。
五、模型评估模型评估是PLS-PM的重要环节。
我们需要评估模型的拟合效果、预测能力和解释能力。
通过比较模型拟合指标和竞争模型的性能,我们可以判断模型的优劣。
此外,我们还可以使用交叉验证、敏感度分析等方法来评估模型的稳定性。
如果模型拟合效果不理想,我们需要重新审视路径图和模型估计过程,并进行相应的调整。
六、模型应用与拓展模型应用是PLS-PM的目的之一。
我们可以将建立好的模型应用于实际情境中,预测新数据或对未知数据进行解释。
此外,我们还可以将PLS-PM应用于其他相关领域,以探索变量之间的关系。
libpls 用法
libpls 用法Libpls(简称PLS)是一种用于处理数据集中特征选择和回归的机器学习算法。
PLS的全称是Partial Least Squares,它是一种基于最小二乘法的统计分析方法,可以在高维度数据集中找到最相关的特征,并进行预测。
下面将介绍PLS的基本原理、使用方法以及常见应用场景。
一、PLS的基本原理PLS的基本原理是通过找到数据集中特征与目标变量之间的线性关系,进行特征选择和回归预测。
它通过主成分分析的方法来寻找特征和目标变量之间的相关性,从而找到数据集中最相关的特征。
其主要思想是将原始特征空间转换为低维度空间,然后根据重要度对特征进行排序,最后选择最重要的特征进行回归分析。
二、PLS的使用方法1. 安装PLS库:在Python中可以使用pip命令安装PLS库。
使用以下命令可以完成安装:```pip install libpls```2. 导入PLS库:在Python脚本中导入PLS库,以便使用其中的函数和类。
导入的代码如下:```import libpls```3. 加载数据集:使用PLS时需要首先加载数据集。
可以使用pandas库或者其他数据处理库来加载数据集,并将其转换成适合PLS算法的格式。
4. 创建PLS模型:在加载数据集后,需要创建PLS模型。
PLS提供了多种模型,可以根据具体需求选择合适的模型。
可以使用以下代码创建一个PLS模型:```pls_model = libpls.PLSModel()```5. 训练PLS模型:将数据集分为训练集和测试集,然后使用训练集来训练PLS模型。
训练模型的代码如下所示:```pls_model.train(X_train, y_train)```6. 预测结果:训练完模型后,可以使用测试集来进行预测。
预测结果的代码如下:```y_pred = pls_model.predict(X_test)```7. 评估模型:使用评估指标来评估模型的性能,通常使用均方误差(Mean Squared Error)或者相关系数(Coefficient of Determination)等指标。
路径模型和PLS
与理想之距 离
再购可能性
价格承受度
中国耐用消费品顾客满意度指数模型
中国耐用消费品满意度指数框图
总体感知质量x5 自定义感知质量x6 可靠性感知质量x7 服务感知质量x8 总体预期质量x1 服务预期x4 预 期 质量h1 感知价值 h3 感知质量 h2 总体满意度x11
为克服第一代基于回归的模型的弱点 SSEM仅同时分析自变量和因变量之间的链接中的 一层. SEM允许多个自变量和因变量结构中的关 系的同时建模. 因此不再区别因变量和自变量, 但 是区别外生和内生隐变量变量(the exogenous and endogenous latent variables), 前者不被设定的模型 所解释 (总是因变量), 后者为被解释变量. SEM 能够构造由指标变量(indicators, items, manifest variables, or observed measures)以及可观 测变量的度量误差来度量的不可观测变量
二者的区别
• Reflective indicators should have a high correlation (as they are all dependent on the same unobservable variable), • formative indicators of the same construct can have positive, negative, or zero correlation with one another (Hulland, 1999), which means that a change in one indicator does not necessarily imply a similar directional change in others (Chin, 1998a).
路径建模分析
路径建模分析路径建模分析钟杰、向玲兰目录路径建模的概念路径模型偏最小二乘法协方差方法路径建模的概念路径建模的思想路径建模也称结构方程建模,其基本思想是根据已有的想象、已有的假说或已有经验事先构造一个模型,先画路径图并写出关系,然后根据这个模型收集数据,再利用该模型来拟合。
路径建模的优缺点优点:同时处理多个因变量(1)容许自变量和因变量含测量误差(2)同时估计因子结构和因子关系(3)容许更大弹性的测量模型(4)估计整个模型的拟合程度缺点:由于没有涉及其他模型,因此无法通过比较来确定该模型是否比未知模型更合适,只能在构造的模型框架内部进行调整。
因此不能用路径建模来发现一个更加合适的模型(它不是一个探索性方法)。
路径模型的两种分析方法偏最小二乘法(PLS):完全根据原始数据通过迭代算法找到各个变量之间的完全线性关系,而且估计出全部隐变量的值。
协方差方法:又称最大似然法(ML)、LISEREL(软件名称)方法、AMOS方法、ML-LISREL方法。
它是在数据的多元正态性假设下,加上图模型所确定的协方差关系,得到似然函数,然后以最大似然法来得到各种估计、但最大似然法无法估计出隐变量的值,也无法得到线性关系的绝对系数(只有相对系数)。
ML-LISREL方法可以仅用均值、协方差矩阵及样本量来得到所有结果。
欧洲顾客满意度模型的结构模型结构模型中所包含的变量都是不可观测或度量的,这样的变量称为隐变量或者潜变量。
模型中的隐变量包括:企业形象(IMAG)、顾客期望(EXPE)、感知质量(QUAL )、感知价值(VAL)、顾客满意度(SAT)、顾客忠诚度(LOY)。
在右图中,箭头意味着因果关系,其中没有被箭头指向的变量是企业形象(IMAG),称为外生隐变量,它是模型中其他变量的原因变量。
其他五个变量都有箭头所指,称为内生变量,模型中有个或多个隐变量为其原因,内生变量也可能是其他隐变量的原因。
欧洲顾客满意度模型的测量模型路径模型的测量模型,也称为外部模型或外部关系,测量模型中的变量称为显变量或可观测变量,也称隐变量的指标。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
$ 意味左边的变量代表标准化的右 变 量 # 标 准 化 隐 变 量 "G4NHG4IHG4OP JGKL!M 均值 9G 可由下面公式表示 % Q GK!M " G4H # G4 9
隐变量的估计为 %
验证 $ 判断结构模型路经参数的显著性水平可采用普通的 3 检 验 或 使 用 象 G2X?I?1/]* 的 交 叉 验 证 !X-0..IY27/623/01" 方 法 & 而对于测量模型隐变量与其对应显变量的综合关系 # 则 一般使用 ^7/16]076/1, 的交叉验证法 $ ^7/16]076/1, 的 交 叉 验 证方法是将每一隐变量的显变量数据阵分为 _ 组 # 然后分别 剔除其中的一组对模型运行 _ 次 # 根据公因子方差和冗余度 的大小来测量隐变量对显变量的预测能力 $
1 对于 Z 的协方差 #"ZZK(Z)(OZM21 LIS REL 建模原理分析
狭义上讲 $ 结构方程建模 !(*5" 多 指 线 性 结 构 关 系 模 型
3 对于 \ 的协方差 #"\\K(\V?WP"Q(O\M2. 4 对于 Z 与 \ 的协方差 # "Z\K*PZ\OQK*PS(Z!M-US(\"M.UOQK(ZV?WP!G"Q(O\
&
V.&’( 输出结果中得到 %
统计与决策 !""# 年 $% 月 ! 下 "
!"
理 论 新 探
表F
’C()D’ 和 &’( 技术的比较分析 !F"
项目
2 PLS 建模原理分析
偏最小二乘法 !&’( " 是一种新型的多 元统计分析技术 # 最近数年的理论发展与 应用研究得到了众多领域的广泛关注$
’C()D’
+P"G!QK
" # "
"" &"
""& "!!
LN P,)%OM*QLN O K% $ )%OLNO
/$ /$ /$
LN/$%) )
&
!!" 测量模型 测量模型的关系为 #
XK( !M’ YK( "M.
X Y
其 中 $XOKPZ-GZ!G’GZ[Q 为 外 生 观 测 变 量 构 成 的 向 量 $YOKP\-G
标准化隐变量 ! 均值 K% # 标准差 KF" 以中心化的显变量的 线性组合表示 %
方法是进行普通的多元回归 # 也可以用 &’( 回归或其它有偏 回归的办法来估计结构方程的参数 $
!E!
!F "
JG#L!MG4NHG4IHG4OP
最终可写为 %
&’( 模型的验证 &’( 模 型 的 验 证 包 括 对 结 构 模 型 的 验 证 和 测 量 模 型 的
!EF
&’( 路经模型参数估计
设 &’( 路径模型与 ’C()D’ 的完全模型一样 $ 但为方
便起见 # 记隐变量为 !G@ 显变量为 HG4#&’( 路经估计如下 % !$" 隐变量和权重的估计
F%%% 个显变量 "
基于最大预测数目的模型部 分的功效分析 #推荐 R%IF%%
" 标准化隐变量 !!GI9G" 的外部估计 JG
^_&( 和 .‘a 对正态性没有严格要求 $ 很多软件在缺省状态
下 $ 输出的结果一般为 5&* 的估计 %
\!G’G\BQ 为 内 生 观 测 变 量 构 成 的 向 量 $’ZP[R8Q 和 ’YPBRIQ 分 别
为 相 应 的 回 归 系 数 或 载 荷 矩 阵 $- P8R-Q 和 . PBR-Q 为 对 应 的 测 量 误 差向量 % 假定 *S"UK*S!UK*S-UK**S!-OUK*S"-OUK*S!.OUK*S".OUK"
理 论 新 探
!"#$%! 与 &!# 路径建模原理分析与比较
霍映宝
! 南京财经大学 工商管理学院 $ 南京 !-%%%4 "
摘
要 # 本 文 对 目 前 十 分 流 行 的 &’()*& 与 +&( 两 种 建 模 原 理 进 行 了 分 析 $ 并 对 二 者 的 建 模 方 法
进行了比较 $ 给出了各自适合的应用条件 % 关键词 # 结构方程建模 &&’()*& &+&( 中图分类号 #,!-! 文献标识码 #. 文章编号 #-%%!/#012!!%%# "-%/%%-3/%!
’C()D’ 方法强调模型参数的估计和检验 # 它以 丰 富 和 发 展
了参数的估计理论和突破了传统的模型构建方法而值得称 道 $ &’( 则是以最大化预测能力而获得殊荣 $ ’C()D’ 拟合模 型是最小化实际观测变量的协方差与理论假设模型协方差 之间的差异 # 它使用迭代算法同时估计所有的模型参数 $ 算 法从待估参数的一组初始值开始 # 然后经过一系列的迭代调 整 # 直到协方差阵之间的差异达到最小化为止 $ 通常 (D5 模 型多表现为欠定 # 即模型需要估计的参数大于模型所给方程 的 数 目 # 这 带 来 ’C()D’ 对 模 型 的 参 数 估 计 是 不 确 定 的 # 因
’C()D’ 和 &’( 技术的比较分析 !!" &’( ’C()D’
源于模型参数估计 基于协方差 多元正态与测量变量独立 一致性 不确定的 Z模糊的 反射 要求参数估计准确 小或中等的复杂性 ! 小于 F%% 个显变量 " 基于特定模型的功效分析 # 理 想样本数最小推荐 !%%IB%%
不严格要求 大样本下的一致性 明确的估计 形成与反射 要求预测准确 大 的 复 杂 性 !F%% 隐 变 量 和
根据 :076NFABVO 的 &’( 普通算法 # 标准化隐变量 !!GI9G" 的内部估计 UG 被定义为 %
UG$
/W!/ 连 接 !G
!
*G/J/
内 生 权 重 *G/ 指 在 模 型 中 有 箭 头 连 接 的 两 个 隐 变 量 的 关 系 # 它有三种方法可以选择 % 一是路径加权方法 & 二是重心方 法 & 三是因子加权方法 $ 路径加权方法是将与 !G 连接的所有 隐变量 !/ 分为两 组 # 一 组 是 它 的 前 提 # 一 组 是 它 的 结 果 $ 对 于前提隐变量 !/#*G/ 等于 JG 对 这 些 J/ 的 多 元 回 归 的 J/ 的 回 归系数 # 而对于结果隐变量 !/#*G/ 等于它们之间的相关系数 & 重心方法 *G/ 等 于 JG 与 J/ 的 相 关 的 符 号 & 因 子 加 权 方 法 的 *G/ 等于 JG 与 J/ 的相关系数 $
!! "
!R "
QG Q GK!M "G4HG4KJGS9 ! "G4 被称为外生权重 $ M % 标准化隐变量 !!GI9G" 的内部估计 UG
!T "
3 LIS REL 和 PLS 建模方法比较分析
文 献 ‘RP 从 模 型 分 析 目 标 ’ 需 要 的 理 论 基 础 ’ 分 布 假 定 以 及 需 要 最 小 样 本 数 等 方 面 对 ’C()D’ 和 &’( 方 法 做 了 比 较 ! 见表 F "$ a4/1 216 b*M.3*6 NFAAAO 对 &’( 与 ’C()D’ 则作了 !V " 更为全面的比较 ! 见表 ! "$ 可以看出 %’C()D’ 方法侧重模型 验证 # 对数据的分布一般 有 严 格 的 假 定 &&’( 则 更 多 关 注 变 异 解 释 #不 需 要 充 分 的 理 论 基 础 #对 偏 离 正 态 的 情 况 也 能 得 到相对稳健的估计 $ 确实 #’C()D’ 与 &’( 方法在许多方面存在不同 # 这种不 同主要是来自于两种方法的估计目标与估计程序的差异$
V?WP.QK/.PBRBQ$V?WP-QK0-P[R[Q$ 则测量模型的协方差方程为 # *PZZOQ *PZ\OQ "ZZ "Z\ "PZG\QK K *P\ZOQ *PZ\OQ "\Z "\\
%
Z
&%
&
K
( )(O M0 % ( V?WP!G"Q(O
Z Z -
\
(\V?WP"G!Q(OZ (\V?WP"Q(O\M0.
/$
"P8Q $ 然后与实际样本得到的协方差阵进行拟合 % 显然一个
理想的模型应当是 "P8Q 与 ( 之间的差别尽可能地小 % 拟合方 法有 #]&( 方法 ! 普通最小二乘法 "’^&( 方法 ! 广 义 最 小 二 乘 法 "’5&* 方 法 ! 极 大 似 然 法 " 和 ^_&( ! 广 义 加 权 最 小 二 乘 法 " 以 及 .‘a 方 法 ! 渐 近 分 布 自 由 法 " 等 % 理 论 上 $]&( ’^&( 和 5&* 方 法 要 求 显 变 量 具 有 正 态 分 布 且 样 本 数 足 够 大 $
需要的理论基础 需要充分的理论基础 #支持验证性研究
&’( 估计对偏离正态的情况也是相对稳健的
在复杂模型中 # 至少是测量变量的 F% 倍
&’( 理论由两个部分组 成 %&’( 回 归 !)*+ ,-*../01 " 与 &’( 路 径 建 模 !&234 506+