(医学)北京大学医学部医学统计学进阶1第1讲 多重线性回归与相关
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
总体抽出的31例,其r可能不等于零。 这就要对r进行假设检验,判断r不等于零是由于抽样误差
所致,还是两个变量之间确实存在相关关系。
对相关系数的假设检验,常用t检验,选用 统计量t的计算公式如下:
t r0 r r n2
sr
1 r2
1 r2
n2
=n-2
H0 : =0 H1 : ≠0
相关就是用于研究和解释两个变量之 间相互关系的。
复习: 直线相关
Linear Correlation
一、相关的类型 二、相关系数 三、相关系数的假设检验
为了研究父亲与成年儿子 身高之间的关系,卡尔.皮 尔逊测量了1078对父子的 身高。把1078对数字表示 在坐标上,如图。
它的形状象一块橄榄状的 云,中间的点密集,边沿 的点稀少,其主要部分是 一个椭圆。
41.20
r
0.61
677.42 6.74
从计算结果可以知道,31例待产妇尿中雌三醇含 量与产儿体重之间呈正相关,相关系数是0.61。
根据资料类型选择不同的方法计算r
Pearson: 连续变量,双变量正态分布资料 Kendall: 资料不服从双变量正态分布或
总体分布未知,等级资料。 Spearman:等级资料
多重线性回归与相关
王海俊 北京大学公共卫生学院
主要内容
第一节 偏相关 第二节 多元线性回归
医学上,许多现象之间都有相互联系,例 如:身高与体重、父亲身高与儿子身高、 体温与脉搏、产前检查与婴儿体重、乙肝 病毒与乙肝等。
在这些有关系的现象中,它们之间联系的 程度和性质也各不相同。
关系:可以说乙肝病毒感染是前因,得了乙肝 是后果,乙肝病毒和乙肝之间是因果关系;但 是,有的现象之间因果不清,只是伴随关系, 例如丈夫的身高和妻子的身高之间,就不能说 有因果关系。
=0.05 r=0.61, n=31, 代入公式 t= r
t=4.14
n2 1 r2
=n-2=31-2=29
查t值表,t0.05 (29) =2.045,
查t值表, t0.05(29) =2.045, 上述计算t=4.14>2.045,由t所 推断的P值小于0.05 按=0.05水准拒绝??,接受?? 认为待产妇24小时内尿中雌三醇浓度与产儿体重之间有 正相关关系。
2.5 2.5 2.5 2.7 2.7 2.7 2.4 3.0 3.0 3.1 3.0 3.1 3.0 2.8 3.2 3.2
编号 (1)
17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
尿雌三醇 mg/24h(2)
17 25 27 15 15 15 16 19 18 17 18 20 22 25 24
一个产科医师发现孕妇尿中雌三醇含量与产儿的 体重有关。
于是设想,通过测量待产妇尿中雌三醇含量,可 以预测产儿体重,以便对低出生体重进行预防。 因此收集了31例待产妇24小时的尿,测量其中的 雌三醇含量,同时记录产儿的体重。
问尿中雌三醇含量与产儿体重之间相关系数是多 少?是正相关还是负相关?
另外的例子:
识字数,鞋大小 游泳票与冰激凌销售量
产儿体重 kg(3)
3.2 3.2 3.4 3.4 3.4 3.5 3.5 3.4 3.5 3.6 3.7 3.8 4.0 3.9 4.3
SPSS计算程序
1.做散点图: GRAPHS-SCATTERT-SIMPLE-DEFINE
2. 相关分析: ANALYZE--CORRELATION – BIVARIATE -VARIABLES
一、相关的类型
★正相关 ★负相关 ★完全正相关 ★完全负相关 ★零相关
二、相关系数
◆样本的相关系数用r (correlation coefficient) ◆相关系数r的值在-1和1之间。正相关时,r值在0
和1之间,这时一个变量增加,另一个变量也增 加;负相关时,r值在-1和0之间,此时一个变量 增加,另一个变量将减少。 ◆r的绝对值越接近1,两变量的关联程度越强,r 的绝对值越接近0,两变量的关联程度越弱。
分析问题:总体-样本、 目的、变量、关系
编号 (1)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
待产妇尿雌三醇含量与产儿体重关系
尿雌三醇 mg/24h(2
7 9 9 12 14 16 16 14 16 16 17 19 21 24 15 16
产儿体重 kg(3)
孕妇尿中雌三醇含量与产儿体重之间的关系
4ຫໍສະໝຸດ Baidu5
4.0
3.5
3.0
产儿体重
2.5
2.0
0
10
20
30
尿雌三醇
Correlations
尿雌三醇 产儿体重
尿 雌 三 醇 Pear son C or relation
1
.610* *
Sig. (2-tailed)
.
.000
N
31
31
产 儿 体 重 Pear son C or relation
问题: 我们能否得出结论:待产妇尿中雌 三醇含量与产儿体重之间成正相关, 相关系数是0.61?为什么?
三、相关系数的假设检验
上例中的相关系数r等于0.61,说明了31例样本中雌三醇 含量与出生体重之间存在相关关系。但是,这31例只是 总体中的一个样本,由此得到的相关系数会存在抽样误 差。
因为,总体相关系数()为零时,由于抽样误差,从
.610* *
1
Sig. (2-tailed)
.000
.
N
31
31
**. C orrelation is significant at the 0.01 lev el (2-tailed).
r
(x x) (y y) lxy
(x x)2 (y y)2 lxx lyy
Correlations
尿雌三醇 产儿体重
尿 雌 三 醇 Pear son C or relation
1
.610* *
Sig. (2-tailed)
.
.000
N
31
31
产 儿 体 重 Pear son C or relation
.610* *
1
Sig. (2-tailed)
.000
.
N
31
31
**. C orrelation is significant at the 0.01 lev el (2-tailed).
所致,还是两个变量之间确实存在相关关系。
对相关系数的假设检验,常用t检验,选用 统计量t的计算公式如下:
t r0 r r n2
sr
1 r2
1 r2
n2
=n-2
H0 : =0 H1 : ≠0
相关就是用于研究和解释两个变量之 间相互关系的。
复习: 直线相关
Linear Correlation
一、相关的类型 二、相关系数 三、相关系数的假设检验
为了研究父亲与成年儿子 身高之间的关系,卡尔.皮 尔逊测量了1078对父子的 身高。把1078对数字表示 在坐标上,如图。
它的形状象一块橄榄状的 云,中间的点密集,边沿 的点稀少,其主要部分是 一个椭圆。
41.20
r
0.61
677.42 6.74
从计算结果可以知道,31例待产妇尿中雌三醇含 量与产儿体重之间呈正相关,相关系数是0.61。
根据资料类型选择不同的方法计算r
Pearson: 连续变量,双变量正态分布资料 Kendall: 资料不服从双变量正态分布或
总体分布未知,等级资料。 Spearman:等级资料
多重线性回归与相关
王海俊 北京大学公共卫生学院
主要内容
第一节 偏相关 第二节 多元线性回归
医学上,许多现象之间都有相互联系,例 如:身高与体重、父亲身高与儿子身高、 体温与脉搏、产前检查与婴儿体重、乙肝 病毒与乙肝等。
在这些有关系的现象中,它们之间联系的 程度和性质也各不相同。
关系:可以说乙肝病毒感染是前因,得了乙肝 是后果,乙肝病毒和乙肝之间是因果关系;但 是,有的现象之间因果不清,只是伴随关系, 例如丈夫的身高和妻子的身高之间,就不能说 有因果关系。
=0.05 r=0.61, n=31, 代入公式 t= r
t=4.14
n2 1 r2
=n-2=31-2=29
查t值表,t0.05 (29) =2.045,
查t值表, t0.05(29) =2.045, 上述计算t=4.14>2.045,由t所 推断的P值小于0.05 按=0.05水准拒绝??,接受?? 认为待产妇24小时内尿中雌三醇浓度与产儿体重之间有 正相关关系。
2.5 2.5 2.5 2.7 2.7 2.7 2.4 3.0 3.0 3.1 3.0 3.1 3.0 2.8 3.2 3.2
编号 (1)
17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
尿雌三醇 mg/24h(2)
17 25 27 15 15 15 16 19 18 17 18 20 22 25 24
一个产科医师发现孕妇尿中雌三醇含量与产儿的 体重有关。
于是设想,通过测量待产妇尿中雌三醇含量,可 以预测产儿体重,以便对低出生体重进行预防。 因此收集了31例待产妇24小时的尿,测量其中的 雌三醇含量,同时记录产儿的体重。
问尿中雌三醇含量与产儿体重之间相关系数是多 少?是正相关还是负相关?
另外的例子:
识字数,鞋大小 游泳票与冰激凌销售量
产儿体重 kg(3)
3.2 3.2 3.4 3.4 3.4 3.5 3.5 3.4 3.5 3.6 3.7 3.8 4.0 3.9 4.3
SPSS计算程序
1.做散点图: GRAPHS-SCATTERT-SIMPLE-DEFINE
2. 相关分析: ANALYZE--CORRELATION – BIVARIATE -VARIABLES
一、相关的类型
★正相关 ★负相关 ★完全正相关 ★完全负相关 ★零相关
二、相关系数
◆样本的相关系数用r (correlation coefficient) ◆相关系数r的值在-1和1之间。正相关时,r值在0
和1之间,这时一个变量增加,另一个变量也增 加;负相关时,r值在-1和0之间,此时一个变量 增加,另一个变量将减少。 ◆r的绝对值越接近1,两变量的关联程度越强,r 的绝对值越接近0,两变量的关联程度越弱。
分析问题:总体-样本、 目的、变量、关系
编号 (1)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
待产妇尿雌三醇含量与产儿体重关系
尿雌三醇 mg/24h(2
7 9 9 12 14 16 16 14 16 16 17 19 21 24 15 16
产儿体重 kg(3)
孕妇尿中雌三醇含量与产儿体重之间的关系
4ຫໍສະໝຸດ Baidu5
4.0
3.5
3.0
产儿体重
2.5
2.0
0
10
20
30
尿雌三醇
Correlations
尿雌三醇 产儿体重
尿 雌 三 醇 Pear son C or relation
1
.610* *
Sig. (2-tailed)
.
.000
N
31
31
产 儿 体 重 Pear son C or relation
问题: 我们能否得出结论:待产妇尿中雌 三醇含量与产儿体重之间成正相关, 相关系数是0.61?为什么?
三、相关系数的假设检验
上例中的相关系数r等于0.61,说明了31例样本中雌三醇 含量与出生体重之间存在相关关系。但是,这31例只是 总体中的一个样本,由此得到的相关系数会存在抽样误 差。
因为,总体相关系数()为零时,由于抽样误差,从
.610* *
1
Sig. (2-tailed)
.000
.
N
31
31
**. C orrelation is significant at the 0.01 lev el (2-tailed).
r
(x x) (y y) lxy
(x x)2 (y y)2 lxx lyy
Correlations
尿雌三醇 产儿体重
尿 雌 三 醇 Pear son C or relation
1
.610* *
Sig. (2-tailed)
.
.000
N
31
31
产 儿 体 重 Pear son C or relation
.610* *
1
Sig. (2-tailed)
.000
.
N
31
31
**. C orrelation is significant at the 0.01 lev el (2-tailed).