两变量关联性分析

合集下载

两变量关联性分析3

两变量关联性分析3

第三节分类变量的关联性分析对定性变量之间的联系通常用的方法是根据两个定性变量交叉分类计数所得的频数资料(列联表)作关联分析,即关于两种属性独立性的卡方检验。

一、交叉分类2 x 2 表的关联分析例11-6研究吸烟方式与患慢支炎是否有关,某研究者随机调查了200例年龄相仿的吸烟者,对每个个体分别观察慢支炎与否和吸烟方式两种属性,2 ×2种分类结果如表11-3。

试分析两种属性的关联性。

该例是关于样本含量为200的一份随机样本的受试对象两种属性(变量)的关联性的研究。

和分析两定量变量间的相关性类似,表11-3是关于两个变量的一份随机样本,要检验的是慢支炎是否与吸烟方式两个变量之间的关联性。

交叉分类资料独立性检验与比较两独立样本频率的假设检验所用的卡方公式、理论频数计算公式和自由度的计算公式完全相同。

但是,必须注意,这两类问题的研究目的、设计方案、数据结构以及对结果的解释都是不同的。

(4) 确定P值υ=(2-1)×(2-1)=1,查卡方界值表,得P<0.01.(5) 下结论,接受因为P<0.01,按α=0.05的水准,拒绝H0 H1,差异有无统计学意义。

说明慢支炎有无与吸烟方式之间存在关联性。

二、2 x 2 配对资料的关联性分析例11-7有132份食品标本,把每份标本一分为二,分别用甲、乙两种检验方法作沙门菌检验,检验结果如表11-5,问两种检验方法的结果是否存在关联?前面我们用McNemar检验解决了两种培养基的阳性率是否相等的问题。

但如要了解两种培养基结果之间是否有关联,则需作两种属性的关联性分析。

三、R × C 表分类资料的关联性分析例11-8欲探讨职业类型与胃病类型是否有关联,某医生将收治的310名胃病患者按主要职业类型与胃病类型两种属性交叉分类,结果见表11-6的资料。

问职业类型与胃病类型有否关联?例11-9某省随机抽查了1043位居民的ABO血型与MN 血型,资料如表11-7。

医学统计学 -第11章 两变量关联性分析

医学统计学  -第11章  两变量关联性分析
r无度量单位 -1 ≤r≤ 1 r 值为正:正相关
为负:负相关 |r|=1:完全相关
❖ r的正负号表示线性相关的方向 ❖ r绝对值的大小表示线性相关的密切程度,越接近±1, 其线性密切程度越高;越接近0,线性密切程度越低
例11.2 计算例11.1中基础代谢Y与体重X之间样本 相关系数。
由例11-1得
三、相关系数的统计推断
(一)假设检验方法: 查表法
按自由度υ=n-2查r界值表,如果样本相关系数r大于界值,
则具有统计学意义,线性相关关系存在
t检验法
tr
r0 sr
υ=n-2
sr
1 r2 n2
例11-3 继例11-2中算得r=0.964后,试检验相 关是否具有统计学意义
H0 : 0 ,H1 : 0 , =0.05
(x x)2 1144.5771 (y y)2 4645447.0121 (x x)(y y) 70303.2329
r
(x x)(y y)
(x x)2 (y y)2
70303.2329
1144.5771 4645447.0121
0.964
即基础代谢与体重之间的相关系数为0.964,呈正相关, 说明基础代谢随体重的增加而升高
查表法
本例 n=14,r=0.964,按υ=14-2=12,查r界值表,得 r0.05,12=0.532
因此P<0.05,即相关系数有统计学意义,可以认 为基础代谢与体重之间存在线性正相关,且相关系 数为0.964
t检验法
本例 n=14,r=0.964,代入公式
t 0.964 12.559 1 0.9642 14 2
正相关(positive correlation) 散点呈直线变化趋势 Y随X的增加而有增加的趋势 当散点全部在一条直线上时, 为完全正相关

两变量关联性分析

两变量关联性分析

N
Percent
132 100.0%
列Crossta bulati on
乙法
+
-
+
80
10
-
31
11
111
21
Total 90 42
132
Phi系数为0.192, 列联系数为0.189,近似P值为0.027
三、R×C表的关联性分析
例10-9(p 204 ) 欲探讨职业类型与胃病类型是否有关
df
(2-sided)
4
.000
Likelihood Ratio
20.271
4
.000
Linear -by -Linear A sso ciation
16.727
1
.000
N of Valid Cases
310
a. 1 cells (11.1%) hav e expected count less than 5. The minimum expected count is 4.36.
Tests of Normality
Kolmogorov-Smirnova
Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
基础 代谢(kJ/d) .154
14 .200* .933
14 .390
体重 (kg)
.129
14 .200* .981
14 .956
基 础 代 谢 ( kJ/d) 体 重 ( kg)
Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N

卫生统计学两变量关联性分析

卫生统计学两变量关联性分析

二、相关系数的意义及计算
直线相关系数又称Pearson积矩相关系数,是用以定 量描述两个变量间直线关系密切程度和相关方向的统 计指标。
N
(x x)(y y)
i1
, 为总体相关系数
N
N
(x x)2(y y)2
i1
i1
.
13
在实际工作中,我们常常只能获得样本的信息或有关
r 数据,据此我们只能计算样本相关系数,记为 。
.
21
(二) 采用t 检验,实际应用中使用得比较普遍
r0 tr Sr 其中,Sr为样本相关系数r的标准误
Sr
1 r2 n2
H0成立时,tr服从自由度为 n 2的t分布
.
22
例3 在例2算得r=0.875后,试检验相关是否有统计学意 义。
①. 建立假设 H0:ρ=0 H1:ρ≠0
②. 确定检验水准 α=0.05
1 1
0.6574
ρ的上限:r
e2z e2z
1 1
e ( 21.9198 ) e ( 21.9198 )
1 1
0.9579
故体重与双肾体积总体相关系数的95%置信区间为 (0.6574,0.9579)
.
28
四、线性相关应用中应注意的问题
1. 样本的相关系数接近零并不意味着两变量间一定 无相关性。 通常应先绘出样本值的散点图,利用散点图可直观 地判断两变量之间是否具有线性联系。
Cramer V系数和Pearson列联系数来度量。
2
n
V 2 , k min(R,C)
n(k 1)
Pearson列联系数r
2 2 n
.
44
这三个系数值越接近于0,说明两个分类变量之间几乎

10两变量关联性分析

10两变量关联性分析

线性相关(linear correlation)
可见两个变量间的关系并不是函数式的确定关 系——非函数式确定性关系
总的来说,体重轻者基础代谢低,重者基础代谢 高,二者变化趋势呈正向关系——正相关
各点的态势趋近一条直线呈线性——线性相关 线性相关(linear correlation),又称简单相关,
人的肺活量往往随着胸围的增加而增加,二者 间是否有联系?
举重运动员所能举起的最大重量是否与他的体 重有关?
在水碘含量不同的地区,甲状腺肿大的患病情 况不太相同,它们间是否有关联?
相关关系与确定性关系
所谓确定性关系是指两变量间的关系是函数关系:已知一个变量的值, 另一个变量的值可以通过这种函数关系精确计算出来。
第十章:两变量 关联性分析
问题的提出
前面的章节已经讨论的统计学方法着重于比较单 个变量的组间差别(例如:均数的差别、率的差别、 构成比的差别、中位数的差别等)
但是在医学研究中,还需要对两个随机变量间的 关系进行量化研究
问题的提出
人的体重往往随着身高的增加而增加,算方法如下:
rs
l xy lxx l yy
将X、Y变量所对应的秩次作为新变量,代入上述公式
计算器求得:
56.5
rs
-0.741 82.5 70.5
秩相关系数的假设检验
因此样本资料的秩相关系数为-0.741,意味着两变量间可 能存在负关联
rs来自10个个体值组成的样本,存在着抽样误差,故计算 出rs后,需作的假设检验
n
( Xi X )(Yi Y )
r
i 1
0.964
n
(
Xi
X
)2
n
(Yi

双变量相关性分析方法

双变量相关性分析方法

双变量相关性分析方法
双变量相关性分析方法是一种通过检验两个变量之间的相关性,来研究它们之间是否存在某种关联关系的统计方法。

它可以帮助我们了解两个变量之间的关系密切程度,从而对变量进行评估和预测。

双变量相关性分析的常用方法有:
1. 相关系数:相关系数是衡量变量之间关系强弱的指标,它是一个介于-1到+1之间的数字,当相关系数等于0时表明两个变量之间没有任何相关性,当相关系数大于0时表明两个变量之间存在正相关,当相关系数小于0时表明两个变量之间存在负相关。

2. 回归分析:回归分析是一种用来预测一个变量随另一变量变化情况的方法,它可以用来研究变量之间的关系及影响程度。

3. 卡方检验:卡方检验是一种用来检验两个变量之间关系的方法,它可以用来比较不同变量之间的关联情况,从而得出两个变量之间的相关度。

4. t检验:t检验是一种用来检验某一组数据是否服从正态分布的方法,它可以用来比较两组数据之间的差异情况,从而得出它们之间的相关性。

《两变量关联性分析》课件

《两变量关联性分析》课件
基础概念
相关系数、散点图、回归分析等。
两变量关联性分析的重要性
实际应用
在经济学、社会学、生物学等领域,两变量关联性分 析被广泛应用于探索两个变量之间的关系。
理论意义
有助于理解现象之间的内在联系,为进一步的研究提 供依据。
预测价值
通过分析两个变量的关联性,可以对未来的趋势进行 预测。
两变量关联性分析的应用场景
两变量关联性分析的案例
案例一:销售与广告投入的关联性分析
总结词
广Hale Waihona Puke 投入对销售的影响详细描述通过收集某公司一段时间内的广告投入和销售数据,分析广告投入与销售量之 间的关联性。可以采用相关系数、回归分析等方法,探究广告投入对销售的贡 献程度,为企业制定营销策略提供依据。
案例二:股票价格与经济指标的关联性分析
模型参数设置
根据模型要求设置参数,如回归系数、置信区间等。
模型评估
通过交叉验证、R方值等方法评估模型的性能和准确性。
结果解释与决策
结果解读
对分析结果进行解读,理解两变量之间的关 联性。
制定决策
根据分析结果制定相应的决策,指导实践。
结果验证
对分析结果进行实际验证,确保其在实际应 用中的有效性。
04

03
将关联性分析结果与其他方法或经验进行比较,以评
估其可信度和实用性。
针对某品牌的产品,收集消费者对其不同属性的评价数据,分析产品属性与消费者行为之间的关联性。例如,研 究产品价格、质量、外观、品牌形象等因素对消费者购买决策的影响,为企业改进产品设计和营销策略提供依据 。
05
两变量关联性分析的注意事项
数据质量与完整性
确保数据来源可靠, 无缺失值和异常值。

CH11

CH11
表 11-14 编号 1 2 3 4 5 10 名正常成年男性的血浆清蛋白含量及血红蛋白含量检测结果 血浆清蛋 白含量(x) 35.5 36.5 38.5 37.5 36.5 血红蛋白含 量(y) 119.5 120.5 127.5 126.5 120.5 编号 6 7 8 9 10 血浆清蛋 白含量(x) 35.4 34.5 34.2 34.6 33.5 血红蛋白 含量(y) 118.5 110.5 109.2 108.5 105.3
思考与练习
7. 思考题 (1)Pearson积矩相关系数 经检验无统计学意义,是否 积矩相关系数r经检验无统计学意义 积矩相关系数 经检验无统计学意义, 意味着两变量间一定无关系? 意味着两变量间一定无关系? 答:对满足二元正态分布的随机样本,若直接计算 Pearson积矩相关系数且经检验无统计学意义,并不意味着 两变量间一定无关系,若两者之间是非线性关系的话,其 Pearson积矩相关系数也会无统计学意义,因此在确定两变 量间有无线性关系时应先绘出散点图进行直观考察后再作 出判断. (2)Pearson积矩相关系数 经检验有统计学意义,P值 积矩相关系数r经检验有统计学意义 积矩相关系数 经检验有统计学意义, 值 很小,是否意味着两变量间一定有很强的线性关系? 很小,是否意味着两变量间一定有很强的线性关系? 答:Pearson积矩相关系数r经检验有统计学意义,且P值 很小,并不意味着两变量间一定有很强的线性关系.参看 本章第一节线性相关应用中应注意的问题中的2,3,4,5 点.
χ2 χ2 +n
关于 Pearson 列联系数是否为零的检验等价于 Pearson χ 2 检验.
思考与练习
1.对某省 8 个地区水质的碘含量及其甲状腺肿的患病率作了调查后得到表 11-13 的数据,试问不同地区的甲状腺肿的患病率高低与本地区水质的碘含量有无关联?

第十章 两变量相关性分析

第十章 两变量相关性分析
r ——样本相关系数;ρ ——总体相关系数。
二、相关系数的计算
r X X Y Y lXY X X 2 Y Y 2 lXXlYY
XY ( X )(Y) / n
[ X 2 ( X )2 / n][Y 2 (Y )2 / n]
式中 (X X )2 为X的离均差平方和, 用 lXX 代替;
按自由度v=n-2查相关系数界值表(附表12,P425)。 2. t 检验 (n>50)
公式 t r 0 = r
,υ=n-2
Sr
1 r2
n2
Sr---- 相关系数的标准误 求得 t 值后查t 界值表得P值。
本例n=21,故采用查表法:按v= n-2 = 21-2 = 19 查附表12可知, r0.05/ 2,19 0.433
0.81
16
4.60
0.85
17
3.58
0.83
18
3.57
0.84
19
3.49
0.73
20
3.63
1.27
21
3.89
0.78
计算相关系数的一般步骤为:
1. 绘制散点图。 (见图10-2)。
散点图显示两 变量有直线趋势
图10-2 肝癌病人血清胆固醇与甘油三酯关系散点图
2. 计算基础数据,并列出相关系数计算表,
病人序号
血清胆固醇
甘油三脂
1
3.89
1.71
2
3.41
1.01
35.700.Fra bibliotek746.84
1.78
5
2.93
1.25
6
3.98
0.70
7
4.23
1.33

第十一讲卫生统计学两变量关联性分析

第十一讲卫生统计学两变量关联性分析

第一节 线性相关
一、线性相关的概念
线性相关(linear correlation)又称简单相关 (simple correlation),用于双变量正态分布 (bivariate normal distribution)资料。其性 质可由图11-2散点图直观的说明。
散点图
为了确定相关变量之间的关系,首先应该 收集一些数据,这些数据应该是成对的。例 如,每人的身高和体重。然后在直角坐标系 上描述这些点,这一组点集称为散点图。
第十一章 两变量关联性分析
本章内容
第一节 线性相关 第二节 秩相关 第三节 分类变量的关联性分析
医学上,许多现象之间也都有相互联系,例如:身高与体 重、体温与脉搏、产前检查与婴儿体重、乙肝病毒与乙肝等。 在这些有关系的现象中,它们之间联系的程度和性质也各不 相同。这里,体温和脉搏的关系就比产前检查与婴儿体重之 间的关系密切得多,而体重和身高的关系则介与二者之间。 另外,可以说乙肝病毒感染是前因,得了乙肝是后果,乙肝 病毒和乙肝之间是因果关系;但是,有的现象之间因果不清, 只是伴随关系,例如丈夫的身高和妻子的身高之间,就不能 说有因果关系。相关与回归就是用于研究和解释两个变量之 间相互关系的。
为了研究父亲与成年 儿子身高之间的关系,卡 尔·皮尔逊测量了1078对父 子的身高。把1078对数字 表示在坐标上,如图。用 水平轴X上的数代表父亲 身高,垂直轴Y上的数代 表儿子的身高,1078个点 所形成的图形是一个散点 图。它的形状象一块橄榄 状的云,中间的点密集, 边沿的点稀少,其主要部 分是一个椭圆。
相关系数的计算公式:
r
( X X )( Y Y ) l XY
( X X ) 2 (Y Y ) 2
l XX l YY

第12章双变量关联性分析

第12章双变量关联性分析

21332.38 366926.6
r
16
0.8343
8548.30
3662 16
53813.56
926.62 16
2024/8/3
28
二、相关系数的假设检验
r≠0原因:① 由于抽样误差引起,ρ=0 ② 存在相关关系, ρ≠0
查表法,按v=n-2查r界值表,做出推断结论
t检验
tr
1 r2 n2
2024/8/3
31
【检验步骤】 1. 建立检验假设,确定检验水准
H0 : 0 H1 : 0 0.05
2024/8/3
32
2.计算检验统计量 tr 值
r0
0.8343
tr
1 r2
5.6623 1 0.83432
n2
16 2
2024/8/3
33
3.确定P值,做出统计推断
• 在大量的医学问题研究中常常还要分析两个随机 变量之间的关系,如体重与肺活量、年龄与血压 之间是否存在线性联系,此联系是正向还是负向 以及联系的程度如何?
2024/8/3
4
• 如果两个连续型变量 X和 Y 都随机变动且不分主次 ,可通过线性相关(linear correlation)分析来估计 它们之间可能存在的线性联系的方向与程度。
• 前面讨论的线性相关用于描述两个随机变 量X与Y之间线性联系的程度,结论所反映 的是它们相互之间的关系,两变量并无主 次之分
2024/8/3
39
• 随着所探索问题的深入,研究者通常更感兴趣于 其中的一个变量如何定量地影响另一变量的取值 :例如医学研究中常需要从某项指标估算另一项 指标,如果这指标分别是测量变量X和Y,我们希 望由X推算Y的值。

两变量关联性分析

两变量关联性分析

170例某病患者的治疗效果资料 疗效 患者年龄(岁) 无效 好转 治愈 <18 5 32 20 18~ 30 38 10 50~ 15 10 10 合计 50 80 40
合计 57 78 35 170
两变量关联性分析
43
170例某病患者的治疗效果资料 患者年龄 <18 18~ 50~ 合计 累积频数 秩次范围 疗效 无效 5 30 15 50 50 1~50 好转 32 38 10 80 130 51~130 治愈 20 10 10 40 170 131~170 合计 累积频数秩次范围 57 78 35 170 57 135 平均秩次
两变量关联性分析
14
2013-2-2
(二)线性相关分析步骤
绘制散点图
散点图呈线性趋势时,计算样本相关系数
对样本相关系数进行假设检验
相关系数有统计学意义时,解释相关系数的统计学意义
两变量关联性分析
16
2013-2-2
(二)线性相关分析步骤
对样本相关系数进行假设检验 由样本的相关系数不为零,推断总体的相关系数是 否为零。
绘制散点图(scatter plot)
将其中一个变量作为X轴变量,另一个变量作为Y 轴变量,以一一对应的(X,Y)绘制散点。
例如:教材195页例11-1(散点图图11-1)
注意观察散点的变化方向和密集程度
医学现象中,常见的散点图见教材196页
正相关、负相关、曲线相关、零相关
两变量关联性分析
8
2013-2-2
二、秩相关
秩相关系数假设检验
查表法(查rs界值表)
t检验
t
rs 0 1 rs n2
2
n2
两变量关联性分析

10两变量关联性分析

10两变量关联性分析

三、线性相关系数的统计推断
r是样本相关系数,它是总体相关系数ρ的估计值。要
判断X、Y间是否有相关关系,就要检验r是否来自总体相关 系数ρ为零的总体。 1
r1
== ?
2
r2
== ?
对相关系数的假设检验方法有两种:
1、查表法
2、采用t检验
P480
附表13
检验统计量为:
r 0 r t , n 2 2 Sr 1 r n2
ρ的置信区间:
1.对r进行z变换 1 1 r e2 z 1 z ln( ) r 2z 2 1 r e 1 1 1 1 2. z ~ N( ln( ), ) 2 1 n 3 1 1 3.计算z的总体均数 ln( )的1 置信区间 2 1 z z (z , z ) n3 n3 4.将z的置信区间转换成的置信区间 e2 z 1 将第三步置信区间上下限分别代入到 r 2 z e 1
p
n
2
82.5
lqq
q2
q
n
2
70.5
l pq rs
p q pq 56.5
n 56.5 0.741 82.5 70.5
l pq l pplqq
第二节 秩相关
一、秩相关的概念及其描述 二、秩相关系数的统计推断
第十章
两变量关联性分析
主讲人:武建辉
前面章节中讲述了单一数值变量的统计分 析方法,但在医学科学研究中,常要分析变量间 的关系,如年龄与血压、身高与体重,回归与相 关就是研究这种关系的统计方法,属于双变量 分析范畴。
第一节 线性相关
一、线性相关的概念及其统计描述 例10-1 在某地一项膳食调查中,随机抽取了14名40-60岁的健 康妇女,测得每人的基础代谢(kj/d)与体重(kg)数据,见表10-1. 据此数据如何判断这两项指标间有无关联 表10-1 14名中年健康妇女的基础代谢与体重的测定值
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

线性相关分析的步骤
1. 绘制散点图
凝血酶时间(秒)
18 17 16 15 14 13 12
0.5
0.7
0.9
1.1 1.3
凝血酶浓度(毫升)
图1 例11-1中数据的散点图
2. 计算相关系数
r
( X X )(Y Y ) lXY
( X X )2 (Y Y )2
lXX lYY
二 秩相关
适用条件:
①资料不服从双变量正态分布而不宜作积差 相关分析;
②总体分布型未知,一端或两端是不确定数 值(如<10岁,≥65岁)的资料;
③原始数据用等级表示的资料。
一、Spearman秩相关
1. 意义:等级相关系数rs用来说明两个变量间直线 相关关系的密切程度与相关方向。
2. 计算公式
研究目的:分析两个变量之间有无相关关系 相关系数: (linear correlation coefficient)
描述两变量间线性相关的密切程度 和相关方向的统计量
简单线性相关
当一个变量X由小到大,另一个变量Y亦 相应地由小到大(或由大到小),两变量的 散点图呈直线趋势,那么这两个变量之间有 线性关系。分析这种线性关系的理论和方法, 统称为直线相关或线性相关。
受H1 ,认为凝血酶浓度与凝血酶时间之间存在负相关。 此结果与查表的结果是一致的。
(二)查表法
• 查 r 界值表(附表15)
n2
线性相关中应注意的问题
• 1.样本的相关系数接近零并不意味着两变量 间一定无相关性.
• 2.一个变量的数值人为选定时莫作相关. • 3.出现异常值时甚用相关. • 4.相关未必真有内在联系. • 5.分层资料盲目合并易出假象.
rs
l pq l pp lqq
3. 确定 P 值---查表
表1 15例健康成人凝血时间与凝血酶浓度测量值记录
受试者 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 凝血酶 1.1 1.2 1.0 0.9 1.2 1.1 0.9 0.6 1.0 0.9 1.1 0.9 1.1 1.0 0.7 浓度
凝血时 14 13 15 15 13 14 16 17 14 16 15 16 14 15 17 间
( X X )2 (Y Y )2 lXX lYY
相关系数的特点
1.相关系数r是一个无量纲的数值, 且-1<r<1;
2.r>0为正相关,r<0为负相关; 3.r 越接近于1,说明相关性越好
r 越接近于0,说明相关性越差.
例1:随机抽取15名健康成人,测定血液的凝 血酶浓度(单位/毫升)及凝固时间,数据如表 1所示。据此数据如何判断这两项指标是否相 关?
• 2. 杨树勤主编. 卫生统计学(第二版). 北 京:人民卫生出版社,1991
• 3. 方积乾主编. 医学统计学与电脑实验(第 二版). 上海:上海科学技术出版社,2001
• 4. 孙振球主编. 医学统计学(供研究生用). 北京:人民卫生出版社,2004
本章内容
一 线性相关 二 秩相关 三 分类变量的关联性分析
1.姚明为什么那么高?
2.父母身高很高子女 一定很高吗?
3.父母身高与子女身 高的关系
相关:
如:身高~体重 胰岛素~血糖水平 药物剂量~动物死亡率 父亲身高~儿子身高 姐妹身高~兄弟身高
两变量关联性分析
Bivariate Correlation
参考书
• 1. 徐勇勇主编. 医学统计学(第二版). 北 京:高等教育出版社,2004
0.926
14.81 (14.7)2 /15 3368 (224)2 /15
3.相关系数的假设检验
不存在相关关系 r0
r 0的原因:
存在相关关系,总体相关系数r 0 由抽样误差引起,总体相关系数r 0
相关系数的统计推断
(一)相关系数的假设检验


非线性相关
r=0
线性相关系数计算
又称:积差相关系数(coefficient of product-moment
correlation) / Pearson相关系数 / 相关系数
样本相关系数:r
总体相关系数:r
-1≤ r≤1 |r|越大,线性 相关越密切
r
( X X )(Y Y ) lXY
两变量直线相关的性质和密切程度,用 直线相关系数r来描述。
二、相关系数的计算及意义:
相关系数:又称为积差相关系数或积 矩相关系数,它表示两个变量之间直线关 系的密切程度和相关方向的统计指标。
总体相关系数用符号ρ表示,随机样 本相关系数用符号r表示。
r取值范围:-1≤r≤1,没有单位。





正线性相关
0<r<1






负线性相关
-1<r<0

完全正线性相关
r=1

完全负线性相关
r=-1

零相关 r=0









零相关
r=0





零相关
r=0



• 例2 计算例1中凝血酶浓度X与凝血酶时间 Y之间样本相关系数。
由例1得
15
xi 14.7
i 1
15
yi 224
i 1
, 15 xi2 14.81 i1
, 15 xi yi 216.7 i 1
n 15
15
yi2 3368
i 1
由公式得

216.7 (14.7)(224) /15
r0 tr sr
sr
1 r2 n2
检验步骤
H0 : r 0 ,H1 : r 0 , =0.05
本例 n=15,r=-0.926,由公式得
tr
0.926 8.874 1 (0.926)2
15 2
本例 13,查 t界值表得 p 0.001 ,故拒绝 H0接
教学目标
• 了解线性相关的概念 • 掌握线性相关系数的求解及其假设检
验 • 熟悉秩相关和分类变量的关联性分析
一 线性相关 线性相关的概念
线性相关(linear correlation)又称简单相 关(simple correlation) 。
线性相关(linear correlation)
前提假设:(X, Y)服从正态分布, 即适用于双变量正态分布资料
相关文档
最新文档