第十章 多因分析资料.
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
– 能够比较自变量的相对作用 – 特点:使各个自变量相互控制
A Y
B
复相关
A Y
B
多因回归
• 一些概念
– 标准化线性回归方程式、标准回归系数(B权数)、标 准数净)回归系数、分别决定系数(B1·ry1,总和为决定系
– 多因共线性(统计性累赘),即自变量之间存在较强 的相关;从而降低了彼此的回归系数。因而在选择自 变量时:
– 适用于自变量中既有定类/定序变量,也有定距变量
• 单因方差分析one-way analysis of variance(分 析-均值比较-单因素Anova)
– 一个自变量一个因变量
• 多因方差分析multivariate analysis of variance (分析-一般线性模型-单变量)
– 两个或以上的自变量和一个定距因变量
• 协方差分析analysis of covariance或多因分类 分析法multiple classification analysis(操作 同上)
也可取决于理论的要求
• 统计重要性
– 1,计算每个自变量与因变量的积距相关系数,然后让 相关性最强的自变量进入回归方程式
– 2,逐一考虑其余的自变量,并计算复相关系数值,然 后使复相关次强的自变量进入方程式
– 3,重复步骤2,直至直至新加入的自变量不能显著增 加决定系数
• 理论要求
• Method回归分析方法
– 以多个定距变量判断两个或以上组别的异同性
• 如有犯罪记录和无犯罪记录的两组人在哪些方面的 区别最大呢?
– 基本逻辑:根据所研究的判别变量计算每组个 案的形心,即计算在组合各个判别变量以后的 均值,一次形心值代表每组的特征
– 操作步骤:分析-分类-判别Classify – 可用对数线性模型替代
第七节 多因方差分析
• 不可随便引入不甚重要的自变量 • 不雅引进彼此关系甚强的自变量 • 最好根据理论架构选出较为重要而又不相累赘的自变量
– 相加效果(交互效应):两自变量的相互作用超越了 原来的相加效果
– 复相关和多因线性回归分析都是假定各个自变量的效 果是直线性的
第三节 逐步回归
• 逐步回归分析(钓鱼技术)
– 使各个自变量依次进入回归方程式 – 进入的先后标准,既可以取决于相对的统计重要性,
第四节 交互分类与虚拟变量
• 虚拟变量(虚构变量)
– 用1、2赋值,将定类/定序变量转变为定距变量 – 该变量有多少赋值属性,就生成多少个虚拟变量 – 但在回归分析时不得引进全部的虚拟变量,而要放弃
其中的一个;否则就会引起统计累赘的问题(而且相 关系数系数为1) – 虚拟回归分析的优点:
• 不要求定距测量层次 • 也不用假定是线性关系
– Enter:强行进入法,即所选择的自变量全部进入回归 模型。为系统默认的方法
– Remove:消去法。根据设定的条件提出部分自变量 – Forward:向前选择法。在拟合过程中,对被选择的
自变量进行方差分析,每次加入一个F值最大的变量, 直至所有符合判据的变量都进入模型为止。第一个引 入模型的变量应该Baidu Nhomakorabea因变量间的相关最强 – Backward:向后剔除法。先建立包括了所有自变量的 全模型,然后每次提出方差分析中F值最小的自变量, 直至回归方程中不再含有不符合判据的自变量位置 – Stepwise:逐步进入法。是向前选择法和向后剔除法 的结合
可能不同,它们的共同方向也不能确定,所以只能确 定共同效果的大小。 – 用多因回归法算出复相关系数
第二节 多因回归
• 复相关分析的不足
– 只能测量多个自变量与一个因变量的相关程度, 不能揭示多个自变量来估测或预测一个因变量 的数值,也不能知道自变量的相对作用
• 多因回归
– 用两个或更多的自变量来预测一个因变量的数 值
差比例的意义 – 要求:
• 所有变量都是定距变量 • 而且是对称关系
– 基本逻辑:
• 利用标准化线性方程式将每组的变量组合起来,构成一个典型 变量,而后计算两组典型变量的相关
– 不可随便应用典型相关分析,除非是样本大、变量少 – 需写入命令,无界面操作
第六节 判别分析
• 判别分析discriminant analysis
第十章 多因分析
• 多因分析的目的
– 理解多个自变量对某个因变量的共同影响力 – 进而比较自变量的相对影响力
• 最常用的多因统计法
– 复相关系数 – 多因线性回归分析
– 此外还有虚拟变量分析、因径分析或结构方程 模式、协方差分析、判别分析、典型相关分析 等
第一节 复相关
• 复相关
– 以一个统计值来简化多个自变量与一个因变量的关系 – 以积距相关系数R为基础,要求所有变量都是定距变量 – R取值范围在0-1之间,数值越大表明相关越强 – R平方值称为决定系数,具有消减误差比例的意义 – 1-R2,通常被称为疏离系数 – R没有正负之分。因为各个自变量对因变量的影响方向
– 如果因变量是定类变量呢?
• 采用对数比率回归分析(logistic regression)
第五节 典型相关
• 典型相关canonical correlation
– 测量两组变量的最大相关,其系数值CR取值范围是01
– 适用于自变量和因变量均有多个变量的情况 – 典型相关的平方值,称为特征值或潜根;具有消减误
A Y
B
复相关
A Y
B
多因回归
• 一些概念
– 标准化线性回归方程式、标准回归系数(B权数)、标 准数净)回归系数、分别决定系数(B1·ry1,总和为决定系
– 多因共线性(统计性累赘),即自变量之间存在较强 的相关;从而降低了彼此的回归系数。因而在选择自 变量时:
– 适用于自变量中既有定类/定序变量,也有定距变量
• 单因方差分析one-way analysis of variance(分 析-均值比较-单因素Anova)
– 一个自变量一个因变量
• 多因方差分析multivariate analysis of variance (分析-一般线性模型-单变量)
– 两个或以上的自变量和一个定距因变量
• 协方差分析analysis of covariance或多因分类 分析法multiple classification analysis(操作 同上)
也可取决于理论的要求
• 统计重要性
– 1,计算每个自变量与因变量的积距相关系数,然后让 相关性最强的自变量进入回归方程式
– 2,逐一考虑其余的自变量,并计算复相关系数值,然 后使复相关次强的自变量进入方程式
– 3,重复步骤2,直至直至新加入的自变量不能显著增 加决定系数
• 理论要求
• Method回归分析方法
– 以多个定距变量判断两个或以上组别的异同性
• 如有犯罪记录和无犯罪记录的两组人在哪些方面的 区别最大呢?
– 基本逻辑:根据所研究的判别变量计算每组个 案的形心,即计算在组合各个判别变量以后的 均值,一次形心值代表每组的特征
– 操作步骤:分析-分类-判别Classify – 可用对数线性模型替代
第七节 多因方差分析
• 不可随便引入不甚重要的自变量 • 不雅引进彼此关系甚强的自变量 • 最好根据理论架构选出较为重要而又不相累赘的自变量
– 相加效果(交互效应):两自变量的相互作用超越了 原来的相加效果
– 复相关和多因线性回归分析都是假定各个自变量的效 果是直线性的
第三节 逐步回归
• 逐步回归分析(钓鱼技术)
– 使各个自变量依次进入回归方程式 – 进入的先后标准,既可以取决于相对的统计重要性,
第四节 交互分类与虚拟变量
• 虚拟变量(虚构变量)
– 用1、2赋值,将定类/定序变量转变为定距变量 – 该变量有多少赋值属性,就生成多少个虚拟变量 – 但在回归分析时不得引进全部的虚拟变量,而要放弃
其中的一个;否则就会引起统计累赘的问题(而且相 关系数系数为1) – 虚拟回归分析的优点:
• 不要求定距测量层次 • 也不用假定是线性关系
– Enter:强行进入法,即所选择的自变量全部进入回归 模型。为系统默认的方法
– Remove:消去法。根据设定的条件提出部分自变量 – Forward:向前选择法。在拟合过程中,对被选择的
自变量进行方差分析,每次加入一个F值最大的变量, 直至所有符合判据的变量都进入模型为止。第一个引 入模型的变量应该Baidu Nhomakorabea因变量间的相关最强 – Backward:向后剔除法。先建立包括了所有自变量的 全模型,然后每次提出方差分析中F值最小的自变量, 直至回归方程中不再含有不符合判据的自变量位置 – Stepwise:逐步进入法。是向前选择法和向后剔除法 的结合
可能不同,它们的共同方向也不能确定,所以只能确 定共同效果的大小。 – 用多因回归法算出复相关系数
第二节 多因回归
• 复相关分析的不足
– 只能测量多个自变量与一个因变量的相关程度, 不能揭示多个自变量来估测或预测一个因变量 的数值,也不能知道自变量的相对作用
• 多因回归
– 用两个或更多的自变量来预测一个因变量的数 值
差比例的意义 – 要求:
• 所有变量都是定距变量 • 而且是对称关系
– 基本逻辑:
• 利用标准化线性方程式将每组的变量组合起来,构成一个典型 变量,而后计算两组典型变量的相关
– 不可随便应用典型相关分析,除非是样本大、变量少 – 需写入命令,无界面操作
第六节 判别分析
• 判别分析discriminant analysis
第十章 多因分析
• 多因分析的目的
– 理解多个自变量对某个因变量的共同影响力 – 进而比较自变量的相对影响力
• 最常用的多因统计法
– 复相关系数 – 多因线性回归分析
– 此外还有虚拟变量分析、因径分析或结构方程 模式、协方差分析、判别分析、典型相关分析 等
第一节 复相关
• 复相关
– 以一个统计值来简化多个自变量与一个因变量的关系 – 以积距相关系数R为基础,要求所有变量都是定距变量 – R取值范围在0-1之间,数值越大表明相关越强 – R平方值称为决定系数,具有消减误差比例的意义 – 1-R2,通常被称为疏离系数 – R没有正负之分。因为各个自变量对因变量的影响方向
– 如果因变量是定类变量呢?
• 采用对数比率回归分析(logistic regression)
第五节 典型相关
• 典型相关canonical correlation
– 测量两组变量的最大相关,其系数值CR取值范围是01
– 适用于自变量和因变量均有多个变量的情况 – 典型相关的平方值,称为特征值或潜根;具有消减误