[医学]卫生统计学 第六版第12章简单回归分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
体重(kg)
14名中年健康妇女基础代谢与体重测量值的关系
h
12
min(Yi Yi)2
6000
5500
基础代谢( Kj/d)
5000
4500
4000
3500
3000 35 40 45 50 55 60 65 70 75 体重(kg)
14名中年健康妇女的基础代谢与体重测量值的关系
h
13
2. 回归参数估计的最小二乘(LSE)原则:
体重(kg)
14名中年健康妇女基础代谢与体重测量值的散点图
h
16
(2) 回归分析的基本计算公式:
Y abX
bllX XX Y( X(X X )X Y ()2 Y)X X Y -(2 (X N N )X (2Y ))
aYbX
h
17
14 名中年健康妇女基础代谢与体重测量值
编号 体重 X 基础代谢 Y
从正态分布。(专业知识、正态性检验)。 4. 等方差(equal variance):X的取值范围内,不论X取什么 值,Y都具有相同的方差。(散点图、残差散点图)
h
9
三、回归参数的估计
1. 回归模型:
简单线性回归模型: Yi Xi i
Yi 是实测Y值。 α 是模型的截距。 β 是的模型总体回归系数(斜率)。 Xi是X的实测值。 ε 是残差(residual),ei=Yi-Ŷi。
问题提出
第十一章我们学习了两变量的关联性分析,要求对每一 个研究对象同时观测两个指标,数据是成对出现的,两个指 标之间是平等的,不存在因变量和自变量的关系,关联性分 析探讨的是两变量之间的互依关系。
如果要讨论变量之间的依存关系,一个变量随另一个变 量的数量变化而变化,这时就存在因变量和自变量的关系, 应当用什么方法进行分析?
体重(kg)
14名中年健康妇女基础代谢与体重测量值的关系
h
6
一、线性回归的基本概念
1.直线回归方程中的符号及其含义:
Ŷ= a + bX 直线回归方程(Linear regression equation) X:自变量(independent variable) Y:因变量(dependent variable) Ŷ:实测Y值的估计值(the estimation of Y) a:截距(intercept) b:回归系数(regression coefficient)
h
3
回归(regression)的由来
Golton
统计的基本问题在 于“由过去的数据 来推断未来会发生 什么事”。
Pearson
h
4
表 11-1 14 名中年健康妇女的基础代谢与体重的测量值
编号
Fra Baidu bibliotek
体重 X
基础代谢 Y
例111-1 在某地一5项0.7膳食调查中,随417机5.6抽取14名40-
2
53.7
Y abX
Yi Xii
参数α和β
统计量a和b
Xi Yi abXi
Yi
估 计 均值Y
(Yi Yi)2
适宜统计量a和b
h
14
3. 回归参数的估计步骤:
表 11-1 14 名中年健康妇女的基础代谢与体重的测量值
例11编-号1 在某地一体项重 X膳食调查中,基础随代机谢抽Y 取14名40-
1
50.7
4175.6
h
10
通常情况下研究者只能获取一定数量的样本数据,
用该样本数据建立的有关X与Y变化的线性表达式为回
归方程。
样本线性回归方程: Y abX
估 计
总体线性回归模型: Yi Xi i
h
11
基础代谢 ((Kj/d)
6000
ei Yi Yi
5500
5000
4500
4000
3500
3000 35 40 45 50 55 60 65 70 75
10
58.6
5050.1
11
71.0
5355.5
12
59.7
4560.6
13
62.1
4874.4
14
61.5
5029.2
合计
777.2
63232.9
h
15
(1) 由样本数据绘制散点图:
基础代谢 ((Kj/d)
6000 5500 5000 4500 4000 3500 3000
35 40 45 50 55 60 65 70 75
h
7
2.直线回归的基本概念:
(1)直线回归:当一个变量随另一个变量有规律地线性依存 变动时,称这种数量上的线性依存变动关系为直线回归。 (2)直线回归分析:根据实测值建立回归方程,绘制回归图 形,描述两变量之间数量上的线性变化关系的方法过程。
h
8
二、线性回归模型的适用条件
1. 线性(linear):X与Y的存在线性关系。(散点图) 2. 独立(independent):任意两个观察值相互独立。(专业知识) 3. 正态(normal):在一定范围内,任意给定X值,对应Y都服
两变量的简单回归分析(直线回归分析)
h
1
Chapter 12 Simple Linear Regression Analysis
h
2
主要内容
★ 1.掌握直线回归的基本概念。 ☺ 2.熟悉直线回归方程的建立。 ★ 3.掌握回归系数的假设检验。 ☺ 4.了解直线回归方程的应用。 ★ 5.掌握直线相关和直线回归的联系与区别。
X2
Y2
XY
1
50.7
4175.6
2570.49 17435635.36 211702.92
2
53.7
4435.0
2883.69 19669225.00 238159.50
3
37.1
3460.2
1376.41 11972984.04 128373.42
5050.1
11
71.0
5355.5
12
59.7
4560.6
13
62.1
4874.4
14 合计
61.5 777.2
5029.2 63232.9
h
5
基础代谢 ((Kj/d)
6000
Ŷ= a + bX
5500
5000
4500
4000
3500
3000 35 40 45 50 55 60 65 70 75
4435.0
60岁的健3康妇女,测得37.每1 人的基础代谢34(6k0j.2/d)与体重的
4
51.7
4020.8
数据,见5表11-1。据此47数.8 据如何判断这3两987项.4 指标间有无
6
62.8
4970.6
相关?
7 8
67.3 48.6
5359.7 3970.6
9
44.6
3983.2
10
58.6
60岁的健康2 妇女,测得53.7每人的基础代谢443(5k.0j/d)与体重的
3
37.1
3460.2
数据,见表45 11-1。据此5417数..78 据如何判断这4309两2807..84项指标间有无
相关?
6 7
62.8 67.3
4970.6 5359.7
8
48.6
3970.6
9
44.6
3983.2
14名中年健康妇女基础代谢与体重测量值的关系
h
12
min(Yi Yi)2
6000
5500
基础代谢( Kj/d)
5000
4500
4000
3500
3000 35 40 45 50 55 60 65 70 75 体重(kg)
14名中年健康妇女的基础代谢与体重测量值的关系
h
13
2. 回归参数估计的最小二乘(LSE)原则:
体重(kg)
14名中年健康妇女基础代谢与体重测量值的散点图
h
16
(2) 回归分析的基本计算公式:
Y abX
bllX XX Y( X(X X )X Y ()2 Y)X X Y -(2 (X N N )X (2Y ))
aYbX
h
17
14 名中年健康妇女基础代谢与体重测量值
编号 体重 X 基础代谢 Y
从正态分布。(专业知识、正态性检验)。 4. 等方差(equal variance):X的取值范围内,不论X取什么 值,Y都具有相同的方差。(散点图、残差散点图)
h
9
三、回归参数的估计
1. 回归模型:
简单线性回归模型: Yi Xi i
Yi 是实测Y值。 α 是模型的截距。 β 是的模型总体回归系数(斜率)。 Xi是X的实测值。 ε 是残差(residual),ei=Yi-Ŷi。
问题提出
第十一章我们学习了两变量的关联性分析,要求对每一 个研究对象同时观测两个指标,数据是成对出现的,两个指 标之间是平等的,不存在因变量和自变量的关系,关联性分 析探讨的是两变量之间的互依关系。
如果要讨论变量之间的依存关系,一个变量随另一个变 量的数量变化而变化,这时就存在因变量和自变量的关系, 应当用什么方法进行分析?
体重(kg)
14名中年健康妇女基础代谢与体重测量值的关系
h
6
一、线性回归的基本概念
1.直线回归方程中的符号及其含义:
Ŷ= a + bX 直线回归方程(Linear regression equation) X:自变量(independent variable) Y:因变量(dependent variable) Ŷ:实测Y值的估计值(the estimation of Y) a:截距(intercept) b:回归系数(regression coefficient)
h
3
回归(regression)的由来
Golton
统计的基本问题在 于“由过去的数据 来推断未来会发生 什么事”。
Pearson
h
4
表 11-1 14 名中年健康妇女的基础代谢与体重的测量值
编号
Fra Baidu bibliotek
体重 X
基础代谢 Y
例111-1 在某地一5项0.7膳食调查中,随417机5.6抽取14名40-
2
53.7
Y abX
Yi Xii
参数α和β
统计量a和b
Xi Yi abXi
Yi
估 计 均值Y
(Yi Yi)2
适宜统计量a和b
h
14
3. 回归参数的估计步骤:
表 11-1 14 名中年健康妇女的基础代谢与体重的测量值
例11编-号1 在某地一体项重 X膳食调查中,基础随代机谢抽Y 取14名40-
1
50.7
4175.6
h
10
通常情况下研究者只能获取一定数量的样本数据,
用该样本数据建立的有关X与Y变化的线性表达式为回
归方程。
样本线性回归方程: Y abX
估 计
总体线性回归模型: Yi Xi i
h
11
基础代谢 ((Kj/d)
6000
ei Yi Yi
5500
5000
4500
4000
3500
3000 35 40 45 50 55 60 65 70 75
10
58.6
5050.1
11
71.0
5355.5
12
59.7
4560.6
13
62.1
4874.4
14
61.5
5029.2
合计
777.2
63232.9
h
15
(1) 由样本数据绘制散点图:
基础代谢 ((Kj/d)
6000 5500 5000 4500 4000 3500 3000
35 40 45 50 55 60 65 70 75
h
7
2.直线回归的基本概念:
(1)直线回归:当一个变量随另一个变量有规律地线性依存 变动时,称这种数量上的线性依存变动关系为直线回归。 (2)直线回归分析:根据实测值建立回归方程,绘制回归图 形,描述两变量之间数量上的线性变化关系的方法过程。
h
8
二、线性回归模型的适用条件
1. 线性(linear):X与Y的存在线性关系。(散点图) 2. 独立(independent):任意两个观察值相互独立。(专业知识) 3. 正态(normal):在一定范围内,任意给定X值,对应Y都服
两变量的简单回归分析(直线回归分析)
h
1
Chapter 12 Simple Linear Regression Analysis
h
2
主要内容
★ 1.掌握直线回归的基本概念。 ☺ 2.熟悉直线回归方程的建立。 ★ 3.掌握回归系数的假设检验。 ☺ 4.了解直线回归方程的应用。 ★ 5.掌握直线相关和直线回归的联系与区别。
X2
Y2
XY
1
50.7
4175.6
2570.49 17435635.36 211702.92
2
53.7
4435.0
2883.69 19669225.00 238159.50
3
37.1
3460.2
1376.41 11972984.04 128373.42
5050.1
11
71.0
5355.5
12
59.7
4560.6
13
62.1
4874.4
14 合计
61.5 777.2
5029.2 63232.9
h
5
基础代谢 ((Kj/d)
6000
Ŷ= a + bX
5500
5000
4500
4000
3500
3000 35 40 45 50 55 60 65 70 75
4435.0
60岁的健3康妇女,测得37.每1 人的基础代谢34(6k0j.2/d)与体重的
4
51.7
4020.8
数据,见5表11-1。据此47数.8 据如何判断这3两987项.4 指标间有无
6
62.8
4970.6
相关?
7 8
67.3 48.6
5359.7 3970.6
9
44.6
3983.2
10
58.6
60岁的健康2 妇女,测得53.7每人的基础代谢443(5k.0j/d)与体重的
3
37.1
3460.2
数据,见表45 11-1。据此5417数..78 据如何判断这4309两2807..84项指标间有无
相关?
6 7
62.8 67.3
4970.6 5359.7
8
48.6
3970.6
9
44.6
3983.2