spss 关联分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

偏相关分析
剔除带有缺失值的所有个案。 仅剔除当前分析的两个变量值 是缺失值的个案。
距离分析
基本概念:
距离分析是对观测量之间或变量之间相似或不相似的成都的一种测度,是 计算一对变量之间或一对管测量之间的广义的距离。这些相似性或者距离测度 可以用于其他分析过程,例如因子分析聚类分析等。 距离分析过程中,主要利用变量间的相似性测度和不相似性测度度量两者 之间的关系。
当两个变量同时与第三个变量相关时,将 第三个变量的影响剔除,只分析另外两个 变量之间相关程度的过程。 是对变量之间相似或不相似程度的一种测 度,是计算一对变量之间的广义的距离, 以便用于其他分析过程,如聚类分析。
双变量分析
Pearson简单相关系数:连续变量、正态分布、线性关系、成对数 据、样本容量大于30 Spearman等级相关系数:原始变量的分布不作要求,属于非参数 统计方法,适用范围要广些,但统计效能要低一些。 Kendall's tau-b相关系数:适用于两个分类变量均为有序分类的情况。
距离分析
不相似性测度:
对定距型变量间距离描述的统计量,主要有欧氏距离(Euclidean distance )、平方欧式距离(Squared Euclidean distance )、契比雪夫 距离(Chebychev)、Block距离(Block)、闵可夫斯基距离 (Minkowski)等。 对定序型变量之间距离的描述,主要有卡方相似测度(Chi-Square measure)和Phi方不相似测度(Phi-Square measure)两种。 对二值(只有两种取值)变量之间的距离描述,主要有欧式距离 (Euclidean distance)、平方欧式距离(Squared Euclidean distance ) 和Lance and Williams不相似性测度(Lance and Williams)等。
距离分析
相似性测度
距离分析
不相似性测度
相向(正/负) 单侧检验:知道两个变量的相关方向
偏相关分析
基本原理:
相关分析用于计算两个变量之间的相互关系,分析两个变量间线性关系的 程度。有时因为第三个变量的作用,使得相关系数不能真实的反映两变量间的线 形性相关程度,这也就决定了二元变量的相关分析的不精确性。 偏相关分析就是研究两变量之间存在线性关系时,控制可能对其产生影响 的变量,偏相关系数是衡量任何两个变量之间的关系,而使与这两个变量有联系 的其他变量都保持不变。在计算偏相关系数是,要考虑其他自变量对因变量的影 响,只不过是把其他自变量当作常数处理。
相关分析
一、相关关系的概念
一、相关关系的概念
(一) 函数关系
它反映着现象之间存在着严格的依存关系,也
就是具有确定性的对应关系,这种关系可用一
个数学表达式反映出来,是一种确定性关系。
一、相关关系的概念
(二) 相关关系
它反映着现象之间的数量上不严格的依存关系,也就是
说两者之间不具有确定性的对应关系,这种关系有两个
动时,因变量y也随之发生变动,但这种变动在数值上不成 固定比例,在相关图上的散点可表现为抛物线、指数曲线、 双曲线等形式,因此称其为曲线相关关系。
三、相关分析的内容
三、相关分析的内容
相关分析是研究变量间密切程度的一种方法,SPSS提供专门的相关 分析模块,其中包括三个过程:双变量分析,偏相关分析和距离分析。
B
三个或三个以上因素的相关关系称复相关,或多元相关,即涉及二个 或二个以上的自变量和因变量。 在实际工作中,如存在多个自变量,可抓住其中主要的自变量,研究 其相关关系,而保持另一些因素不变,这时复相关可转化为偏相关。
C
2.按相关关系的性质来分,可分为:正相关和负相关
A
正相关是指两相关现象变化的方向是一致的。
距离分析
相似性测度:
两变量之间可以定义相似性测度统计量,用来对两变量之间的相似性进 行数量化描述。针对定距型变量,主要有Pearson相关系数和夹角余弦距离 (Cosine)等。 对于二值变量的相似性测度主要包括简单匹配系数(Simple matching)、Jaccard相似性指数(Jaccard)和Hamann相似性测度 (Hamann)等20余种。
明显特点:
1.现象之间确实存在数量上的依存关系,即某一社会 经济现象变化要引起另一社会经济现象的变化;
2.现象之间的这种依存关系是不严格的,即无法用 数学公式表示。
二、相关关系的种类
1.按相关关系涉及的因素多少来分,可分为:单相关
和复相关。
A
二因素之间的相关关系称单相关,即只涉及一个自变量和一个因变量。
B
负相关是指两相关现象变化的方向是相反的。
3. 按相关关系的形式来分,可分为:直线相关和曲线
相关
直线相关是指两个相关现象之间,当自变量X的数值发生变动
A 时,因变量y随之发生近似于固定比例的变动,在相关图上的
散点近似地表现为直线形式,因此称其为直线相关关系。
B
曲线相关是指两个相关现象之间,当自变量X的数值发生变
相关文档
最新文档