SPSS相关分析.ppt
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
距离相关分析根据统计量不同,分为以 下两种。
• 不相似性测量:通过计算样本之间或 变量之间的距离来表示。
• 相似性测量:通过计算Pearson相关 系数或Cosine相关来表示。
距离相关分析根据分析对象不同,分为 以下两种。
• 样本间分析:样本和样本之间的距离 相关分析。
• 变量间分析:变量和变量之间的距离 相关分析。
值之间的距离相关分析,Between variables表示作变 量之间的距离相关分析。
【Measure单选框组】 用于选择分析时采用的距离类型:Dissimilarities为不
相似性测距,Similarities为相似性百度文库距。 【Measure钮】 和前面的Measure单选框组配合使用,单击后弹出
距离; Chebychev:以两变量绝对差值的最大值为距离; Block:以两变量绝对差值之和为距离; Minkowski:以两变量绝对差值p次幂之和的p次根为距离; Customized:以两变量绝对差值p次幂之和的r次根为距
离。
2、计数资料 Chi-square measure:χ2值测距; Phi-square measure:ψ2值测距,即将χ2测距值
如果对变量之间的相关程度不需要掌握得那 么精确,可以通过绘制变量的相关散点图来 直接判断。仍以上例来说明。
Spearman和Kendall's tua-b等级相关系数
Spearman和Kendall's tua-b等级相关系
数用以衡量定序变量间的线性相关关系,它们利用 的是非参数检验的方法。 计算公式如下。 Spearman等级相关系数为
Distances过程:调用此过程可对同一变量内部各观察单位 间的数值或各个不同变量间进行距离相关分析,前者可用于 检测观测值的接近程度,后者则常用于考察预测值对实际值 的拟合优度。该过程在实际应用中用的非常少。
描述变量之间线性相关程度的强弱,并用适 当的统计指标表示出来的过程为相关分析。 可根据研究的目的不同,或变量的类型不同, 采用不同的相关分析方法。
某语文老师先后两次对其班级学生同一篇作文加以评 分,两次成绩分别记为变量“作文1”和“作文2”,问 两次评分的等级相关有多大,是否达到显著水平?8.2
人名 hxh yaju yu shizg hah smith watet jess wish laly john chen david caber
在不相似性测量的距离分析中,根据不 同类型的变量,采用不同的统计量进行计算。
(1)对连续变量的样本 (x,y) 进行距 离相关分析时,常用的统计量有以下几种。
变量之间的相似性测量分析
对6个标准电子元件的电阻(欧姆)进行3次平行 测试,测得结果如表所示。问测试结果是否一致。
8.4
第一次 第二次 第三次
1 0.140 0.135 0.141
2 0.138 0.140 0.142
3 0.143 0.142 0.137
4 0.141 0.136 0.140
5 0.144 0.138 0.142
6 0.137 0.140 0.143
【Compute Distances单选框组】 其中有两个选择,Between cases表示作变量内部观察
3.2.3.2 偏相关分析
二元变量的相关分析在一些情况下无法较为真实准 确地反映事物之间的相关关系。例如,在研究某农 场春季早稻产量与平均降雨量、平均温度之间的关 系时,产量和平均降雨量之间的关系中实际还包含 了平均温度对产量的影响。同时平均降雨量对平均 温度也会产生影响。在这种情况下,单纯计算简单 相关系数,显然不能准确地反映事物之间地相关关 系,而需要在剔除其他相关因素影响的条件下计算 相关系数。偏相关分析正是用来解决这个问题的。
3.2.3.1 二元定距变量的相关分析
二元变量的相关分析是指通过计算变量间两两相关 的相关系数,对两个或两个以上变量之间两两相关 的程度进行分析。根据所研究的变量类型不同,又 可以分为二元定距变量的相关分析和二元定序变量 的相关分析。
在二元变量的相关分析过程中比较常用的几个相 关系数是Pearson简单相关系数、Spearman和 Kendall's tua-b等级相关系数。
化学 90.00 99.00 70.00 78.00 88.00 88.00 75.00 98.00 98.00 99.00 89.00 98.00 88.00 60.00 87.00 87.00 88.00 79.00
在上面的结果中,变量间两两的相关系数是用方阵的形式给 出的。每一行和每一列的两个变量对应的格子中就是这两个 变量相关分析结果结果,共分为三列,分别是相关系数、P 值和样本数。由于这里只分析了两个变量,因此给出的是 2*2的方阵。由上表可见自身的相关系数均为1,而数学和 化学的相关系数为0.742,P<0.001,有非常显著的统计 学意义。
关系数 Spearman复选框 计算Spearman相关系数,
即最常用的非参数相关分析(秩相关)
【Test of Significance单选框组】 用于确定是进行相关系数的单侧(One-tailed)或双侧
(Two-tailed)检验,一般选双侧检验。 【Flag significant correlations】 用于确定是否在结果中用星号标记有统计学意义的相关系数,
Distance:Dissimilarity Measure对话框,可根据 数据特征选用测距方法
选择Dissimilarities时各种数据类型可用的测 距方法有:
1、计量资料 Euclidean distance:以两变量差值平方和的平方根为距
离; Squared Euclidean distance:以两变量差值平方和为
对Spearman等级相关系数的统计检验,一 般如果个案数n≤30,将直接利用 Spearman等级相关统计量表,SPSS将自动 根据该表给出对应的相伴概率值。
对Kendall's tua-b等级相关系数的统计检验, 一般如果个案数n≤30,将直接利用 Kendall's tua-b等级相关统计量表,SPSS 将自动根据该表给出对应的相伴概率值。
两个。
【Controlling for框】 用于选择需要在偏相关分析时进行控制的协变量,如
果不选入,则进行的就是普通的相关分析。
【Test of Significance单选框组】 用于确定是进行相关系数的单侧(One-tailed)或
双侧(Two-tailed)检验,一般选双侧检验。 【Display actual significince level复选框】 用于确定是否在结果中给出确切的P值,一般选中。 Zero-order correlations给出包括协变量在内所
一般选中。此时P<0.05的系数值旁会标记一个星号, P<0.01的则标记两个星号。 【Options钮】 Statistics复选框组 可选的描述统计量。它们是: Means and standard deviations每个变量的均数和标准 差
Cross-product deviations and covariances各对变量 的交叉积和以及协方差阵
人名 hxh yaju yu shizg hah smith watet jess wish laly john chen david caber
marry joke jake herry
数学 99.00 88.00 65.00 89.00 94.00 90.00 79.00 95.00 95.00 80.00 70.00 89.00 85.00 50.00 87.00 87.00 86.00 76.00
(2)其次,计算相应的统计量,并得到对应的 相伴概率值。如果相伴概率值小于或等于指定的显 著性水平,则拒绝H0,认为两总体存在显著的线性 相关关系;如果相伴概率值大于指定的显著性水平, 则不能拒绝H0,认为两总体不存在显著的线性相关 关系。
在实际中,因为研究目的不同,变量的类型不同,
采用的相关分析方法也不同。比较常用的相关分析 是二元定距变量的相关分析、二元定序变量的相关 分析、偏相关分析和距离分析。
除合计频数的平方根。
3、二分类变量 Euclidean distance:二分差平方和的平方根,最小
3.2.3 相关分析——Correlate菜单
Bivariate过程:用于进行两个/多个变量间的参数/非参数 相关分析,如果是多个变量,则给出两两相关的分析结果。 这是Correlate子菜单中最为常用的一个过程。
Partial过程:偏相关分析。如果需要进行相关分析的两个变 量其取值均受到其他变量的影响,就可以利用偏相关分析对 其他变量进行控制,输出控制其他变量影响后的相关系数, 这种分析思想和协方差分析非常类似。
降雨量 25.00 33.00 45.00 105.00 111.00 115.00 120.00 120.00 125.00 130.00
温度 6.00 8.00 10.00 13.00 14.00 16.00 17.00 18.00 18.00 20.00
【Variables框】 用于选入需要进行偏相关分析的变量,至少需要选入
相关系数的取值范围在−1和+1之间, 即−1≤r≤+1。其中:
• 若0<r≤1,表明变量之间存在正相 关关系,即两个变量的相随变动方向相同;
• 若−1≤r<0,表明变量之间存在负相 关关系,即两个变量的相随变动方向相反;
为了判断r对ρ的代表性大小,需要对相关系数进
行假设检验。
(1)首先假设总体相关性为零,即H0为两总体 无显著的线性相关关系。
偏相关分析是指当两个变量同时与第三个变 量相关时,将第三个变量的影响剔除,只分 析另外两个变量之间相关程度的过程。
偏相关分析的工具是计算偏相关系数 r12,3
某农场通过试验取得某农作物产量与春季降雨量 和平均温度的数据,如表所示。现求降雨量对产 量的偏相关。8.3
产量 150.00 230.00 300.00 450.00 480.00 500.00 550.00 580.00 600.00 600.00
有变量的相关方阵
3.2.3.2 距离相关分析
距离相关分析是对观测量之间或变量之间相 似或不相似的程度的一种测量。距离相关分 析可用于同一变量内部各个取值间,以考察 其相互接近程度;也可用于变量间,以考察 预测值对实际值的拟合优度。
距离相关分析的结果可以用于其他分析过程。 例如,因子分析、聚类分析等,有助于分析 复杂的数据集合。
【Variables框】 用于选入需要进行相关分析的变量,至少需要选入
两个。 【Correlation Coefficients复选框组】 用于选择需要计算的相关分析指标,有: Pearson复选框 选择进行积距相关分析,即最常
用的参数相关分析 Kendall's tau-b复选框 计算Kendall's等级相
Pearson简单相关系数
Pearson简单相关系数用来衡量定距变量间的 线性关系。如衡量国民收入和居民储蓄存款、 身高和体重、高中成绩和高考成绩等变量间的 线性相关关系。
对Pearson简单相关系数的统计检验是 计算t统计量,公式为
t统计量服从n−2个自由度的t分布。
某班级学生数学和化学的期末考试成绩如表所示,现要研 究该班学生的数学和化学成绩之间是否具有相关性。8.1
marry joke jake herry
作文1 86.00 78.00 62.00 75.00 89.00 67.00 96.00 80.00 77.00 59.00 79.00 68.00 85.00 87.00 75.00 73.00 95.00 88.00
作文2 83.00 82.00 70.00 73.00 92.00 65.00 93.00 85.00 75.00 65.00 75.00 70.00 80.00 75.00 80.00 78.00 90.00 90.00