散点图相关系数
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
用来度量正态分布的定距变量间的线性相关关系 Pearson简单相关系数要求变量来自的总体 分布正态
Spearman秩相关系数(斯皮尔曼)
定序变量 区别同一类别个 案中等级次序的变量。定 序变量能决定次序,也即 变量的值能把研究对象排 列高低或大小,具有>与< 的数学特质。例如文化程 度可以分为大学、高中、 初中、小学、文盲
2. 相关关系的分类
就是函数关系
(1)按相关的程度分为:
完全相关:一个变量的取值完全取决于另一个变量,数据点落在一条直线(或曲线)上 相关:一个变量的取值部分取决于另一个变量,数据点围绕分布在一条直线(或曲线)上 不相关:两个变量的数据点分布很分散,无任何规律
7
一、相关的概念
2. 相关关系的分类 (2)按相关的表现形式分为:
进行比较的两个样本是独 立的,并且服从正态分布 1.F检验方差齐性 2.T检验 样本顺序可调换,样本数 量可不同 两配对样本总 1 .配对要求两组同质受 体的均值之间 试对象配成对子或同一受 是否存在显著 试对象分别接受两种不同 配对 差异 的处理。 样本T 2 .样本来自的两个总体 检验 必须服从正态分布 样本顺序不可调换,且样 本数必须相同。
相关程度 无相关 微弱相关
不同类型的变量采用不同的相关系数指标,但取值范围和含义都是相同的
15
二、相关分析的方法
3. 相关系数的分类 Pearson简单相关系数(皮尔逊)
变量的值之间可以比较大小, 两个值的差有实际意义,这样 的变量叫定距变量。在调查被 访者的“年龄”和“每月平均收入”, 都是定距变量。
r=0.8
11
一、相关的概念
SPSS提供了三种相关分析的方法
二元变量分析( Bivariate ): 偏相关分析( Partial ): 距离相关分析( Distances ):
12
相关分析的方法
13
二、相关分析的方法
1. 散点图
散点图是相关分析过程中常用的一种直观的分析方法; 将样本数据点绘制在二维平面或三维空间上,根据数据点的分布特征,直观的研 究变量之间的统计关系以及强弱程度。
10
一、相关的概念
4. 相关分析的概念
相关分析就是描述两个或两个以上变量间关系密切程度的统计方法,有效 地揭示事物之间相关关系的强弱程度。
5.
相关分析的方法
图形(散点图):常用的一种直观的分析方法,将样本数据点绘制在二维 平面或三维空间上,根据这些数据点的分布特征,能够直观地研究变量间的统 计关系以及它们的强弱程度和数据对的可能走向。 数值(相关系数):变量间关系的密切程度常以一个数量性指标描述,这 个指标称相关系数
5
一、相关的概念
1. 关系的概念
(2)相关关系:如果变量之间存在密切的关系,但又不能由一个或 几个变量的值确定另一个变量的值,当自变量x取一定值时,因变量y 的值可能有多个,这种变量之间的非一一对应的、不确定的关系,称 之为相关关系。 如:子女身高与父母身高之间的关系 证券指数与利率之间的关系
6
一、相关的概念
一个变量x增加,导致另一个变量y明显增加,说明x是影响变量y的主要因素
弱正线性相关:
一个变量x增加,导致另一个变量y增加,但不明显,说明x是影响变量y的因素, 但不是唯一的影响因素
强负线性相关:
一个变量x增加,导致另一个变量y明显减少,说明x是影响变量y的主要因素
弱负线性相关:
一个变量x增加,导致另一个变量y减少,但不明显,说明x是影响变量y的因素, 但不是唯一的影响因素
某大学随机抽取若干个大学一年级学 生,分析他们的大学入学考试成绩在 性别上是否存在显著差异。
1.针对实验前学习成绩和智商相同的 两组学生,分别进行不同教学方法的 训练,比较参与实验的两组学生的学 习成绩是否存在显著差异。 2.某班学生在接爱一种新的教学方法 培训后,学习成绩是否有显著变化。
上节回顾
采用非参数检验方法来度量定序变量间的线性相关关系 不要求总体正态分布 由于数据为非定距变量,因此不能直接采用原始数据,而是利用数据的秩
上节回顾
均值比较
T检验原假设:xxxx的均值与yyyy的均值无显著差异
检验的目的 检验样本均值 单样 与已知总体均 本 T检 值之间是否存 验 在差异 总体正态分布 下,两个独立 独立 样本均值之间 样本T 是否存在显著 检验 差异 方法 方法的前题条件 样本总体服从正态分布 举 例 某地区高考数学成绩与全国数学高考 成绩均值是否存在显著差异
线性相关:两个变量之间的关系近似地表现为一条直线 非线性相关:两个变量之间的关系近似地表现为一条曲线
8
一、相关的概念
2. 相关关系的分类 (3)按相关的方向分为:
正相关:一个变量增加(减少),导致另一个变量增加(减少) 负相关:一个变量增加(减少),导致另一个变量减少(增加)
9
一、相关的概念
3. 线性相关的四种相关关系 强正线性相关:
(a)
(b)
(c)
(d)
就两个变量而言,如果变量之间的关系近似地表现为一条直线,则称为线性相 关,如图(a)和(b); 如果变量之间的关系近似地表现为一条曲线,则称为非线性相关或曲线相关, 如图(c); 如果两个变量的观测点很分散,无任何规律,则表示变量之间没有相关关系, 如图(d) 。
14
二、相关分析的方法
2
第10讲
散点图、相关系数
3
源自文库
相关概念
4
一、相关的概念
1. 变量之间关系的概念
客观世界中,事物之间存在相互依存、相互制约、相互影响的关 系。用于描述事物数量特征的变量之间也存在一定的关系。
这些关系分为两种: (1)函数关系:变量之间的一一对应的关系,当自变量x取一定值 时,因变量y依据函数关系取唯一的值。 如:在单价确定时,销售量与销售额之间的关系:y=f(x) 销售额=价格 * 销售量 圆的面积与圆的半径之间的关系: 圆面积=3.14 * 半径^2
2. 相关系数
散点图能够直观地反映变量之间的关系,但不精确。 相关系数以数值的方式精确地反映了变量之间线性关系的强弱程度。 相关系数通过正、负表示相关的方向,相关系数r的取值在-1~+1之间: 下表中是通过相关系数来描述相关程度 相关系数 取值范围 r=0 |r|<0.3 |r|=0.3~0.5 |r|=0.5~0.8 低度相关 显著相关 |r|>0.8 高度相关 |r|=1 完全相关