统计分析与SPSS的应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
8.2.4 相关系数分析应用例
• 案例8-1续(P269)
– Analyze\Correlate\Bivariate
• 选择分析变量(Variables) • 选择相系数类型(Correlation Coefficients) • 选择单侧检验还是双侧检验(test of significance) • 必要时,选择输出其他统计指标(Option)
家庭收入
**. Co rrelation i s sig nificant at the 0.01 level (2-tailed).
8.2.4 相关系数分析应用例
Corre lations Ke ndall's tau _b 计划面积 Co rrelation Coefficient Si g. (2-tailed ) N Co rrelation Coefficient Si g. (2-tailed ) N Co rrelation Coefficient Si g. (2-tailed ) N Co rrelation Coefficient Si g. (2-tailed ) N 计划面积 家庭收入 1.000 .258** . .000 832 832 .258** 1.000 .000 . 832 2993 1.000 .345** . .000 832 832 .345** 1.000 .000 . 832 2993
8.2.2 散点图的绘制例
• 案例8-1:
(1)大多数家庭的 收入在25000以下, 计划住房面积在150 以下; (2)存在少数奇异 数据点; (3)存在随着收入 增加,计划住房面 积分布更加分散的 趋势; (4)家庭收入与计 划住房面积存在较 弱的正相关关系。
8.3 计算相关系数
• 相关系数的意义
女职工
年龄
30 800 900 1000 1100
男职工
基本工资
8.2.2 散点图的绘制
• 绘制命令:
– Graphs\scatter/Dot – 主要操作内容:
• • • • • • 选择散点图类型 选择Y轴变量 选择X轴变量 选择分类标识变量(Set Markers by,可省) 选择散点标签变量(Label Cases by,可省) 选择行(列)分页变量(Panel by,可省)
8.3 计算相关系数
• 相关系数分析的一般步骤:
– 计算样本相关系数
• -1≤r≤1,|r|=1:完全相关; r=0:无线性相关; |r| >0.8:强相关; |r|<0.3:弱相关
– 利用样本数据对总体相关系数进行假设检验
• H0:ρ=0,H1: ρ≠0
8.3.2 相关系数的类型
• 简单相关系数(Pearson)
• 应用相关系数需要注意的问题:
– 极端值会影响相关系数的准确性
– 较准确地衡量两个变量间的线性相关程度。 – 只能衡量线性相关,不能衡量非线性相关
• 例: (1,1)(2,2)(3,3),(4,4),(5,5),(6,1), r=0.33,x=y除了(6,1)
• 例:(x,y): (-1,-1) (-1,1) (1,-1) (1,1), r=0,x2+y2=2
8.2.3 相关系数的假设检验
• 利用样本数据对总体相关系数是否是显著的 进行假设检验。 • 检验假设: • 检验统计量
• H0:ρ=0,H1:ρ≠0
– Pearson相关系数 – Spearman等级相关系数 – Kendall τ相关系数
t
r n2 1 r2
Z r n 1
Z 3 n(n 1) 2(2n 5)
8.2.2 散点图的绘制
• 散点图类型:
– Simple(简单散点图) – Overlay(重叠散点图):在一张图中重叠绘 制若干对变量的散点图(用不同的颜色标识) – Matrix(矩阵散点图):用矩阵形式输出若干 个变量中每一对变量之间的散点图。 – 3-D(三维散点图):用三维空间中的点表示 的三个变量值的散点图。 – Simple Dot(简单点图):单个变量的点图 (单个变量的频数分布图)
8.3.2 相关系数的类型ቤተ መጻሕፍቲ ባይዱ
• Kendall τ相关系数
– 假设配对样本:x1,x2,…,xn,y1,y2, ,…,yn中一致 数对的数目为U和非一致数对的数目为V
U V 2 (U V ) U V n(n 1)
– 基本原理:
• 如果x和y正相关,则U应较大,而V较小。特别V=0 时,相关系数等于1; • 如果x和y负相关,则U应较小,而V较大。特别U=0 时,相关系数等于-1; • 如果x和y不相关,则U和V应比较接近,特别U=V时, 相关系数等于0。
8.2.4 相关系数分析应用例
Corre lations 计划面积 计划面积 家庭收入 Pe arson Correla tion 1 .323** Si g. (2-tailed ) .000 N 832 832 Pe arson Correla tion .323** 1 Si g. (2-tailed ) .000 N 832 2993
• Spearman等级相关系数
– 用来度量定序变量间或定序与定距变量间的线性相 关关系 – 思想:定序数据的数值没有意义,因此改用数据的 秩。如果x与y有相关性,则它们的秩R(x)与R(y)具 有同步性。 – 计算步骤:
• 分别计算两个变量值的秩R(xi)和R(yi); • 计算两变量秩的简单相关系数; • 化简可得:
统计分析与SPSS的应用
第8章 相关分析
8.1 相关分析
• 变量间的关系 • 相关分析工具
– 函数关系 – 统计关系
– 散点图 – 相关系数及其假设检验
• 简单相关系数 • 偏相关系数
8.2 散点图
• 以点的形式将数据绘制在直角平面上, 可以直观地观察变量间的关系和可能的 趋势.
60 50
40
性别
r 1
6 ( R( xi ) R( yi )) 2 n(n 1)
2
8.3.2 相关系数的类型
• Kendall τ相关系数
– 用来度量定序变量间或定序与定距变量间的线性 相关关系 – 一致数对与非一致数对
• 对于数对(x1,y1)和(x2,y2) 如果(y2-y1)/(x2-x1)>0,则称这两个数对是一致的; 如果(y2-y1)/(x2-x1)<0,则称这两个数对是非一致的;
• • • •
– 两个定距尺度变量间相关程度的衡量指标
相关分析中两个变量都是随机变量 相关分析中两个变量是对称的 简单相关系数无量纲 只能衡量线性相关关系
r
(X
11 n i 1
n
i
X )(Yi Y )
2
(Xi X )
(Yi Y ) 2
i 1
n
8.3.2 相关系数的类型
8.3 偏相关分析
• 偏相关系数的阶:在k个变量中,
– 零阶(偏)相关系数:简单相关系数 – 1阶偏相关系数:控制一个变量后,计算其 余变量中每两个变量的偏相关系数; – 2阶偏相关系数:控制两个变量后,计算其 余变量中每两个变量的偏相关系数; – …………
8.3 偏相关分析应用例
• 案例8-1续(P273)控制家庭常住人口的影 响下,家庭收入与计划住房面积的相关 分析。
家庭收入
Sp earman's rho
计划面积
家庭收入
**. Co rrelation is sig nificant at the 0.01 level (2-ta iled).
8.3 偏相关分析
• 偏相关分析的意义
– 在控制了其他变量的影响下对两变量的相关 分析 – 原因:虚假相关.
• 例:研究商品的需求量和价格、消费者收入之 间的关系. • 又如:粮食产量与平均气温、月降水量、平均 日照时间、温度之间的关系的研究。
– Analyze\Correlate\Partial
• • • • 选择分析变量 选择一个或多个被控制变量 单侧或双侧检验选择 是否输出零阶相关系数选择
本章练习
• P275 • 1,2,3