预防医学考研资料--山大。协和版--简单回归分析101208
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
厚德
博学
笃行
济世
(4) 带入公式计算回归系数b:
lXY b l XX
( X )( Y ) ( X X )( Y Y ) XY N ( X)2 (X X )2 X2 N
卫生统计学
(Health Statistics)
厚德
博学
笃行
济世
问题提出
第十一章我们学习了两变量的关联性分析,要求对每 一个研究对象同时观测两个指标,数据是成对出现的,两
个指标之间是平等的,不存在因变量和自变量的关系,关
联性分析探讨的是两变量之间的互依关系。 如果要讨论变量之间的依存关系,一个变量随另一个 变量的数量变化而变化,这时就存在因变量和自变量的关 系,应当用什么方法进行分析?
X2 2570.49 2883.69 1376.41 2672.89 2284.84 3943.84 4529.29 2361.96 1989.16 3433.96 5041.00 3564.09 3856.41 3782.25 44290.28
Y2 17435635.36 19669225.00 11972984.04 16166832.64 15899358.76 24706864.36 28726384.09 15765664.36 15865882.24 25503510.01 28681380.25 20799072.36 23759775.36 25292852.64 290245421.47
体重(kg)
14名中年健康妇女基础代谢与体重测量值的散点图
The School of Public Health of Weifang Medical University
卫生统计学
(Health Statistics)
厚德
博学
笃行
济世
(2) 回归分析的基本计算公式:
Y a bX
l XY b l XX ( X )( Y ) ( X X )( Y Y ) XY N ( X)2 (X X )2 X2 N
卫生统计学
(Health Statistics)
厚德
博学
笃行
6000
min (Yi Y i )
济世
2
基础代谢( Kj/d)
5500 5000 4500 4000
3500
3000 35 40 45 50 55 60 65 70 75 体重(kg)
14名中年健康妇女的基础代谢与体重测量值的关系
(2)直线回归分析:根据实测值建立回归方程,绘制回归图
形,描述两变量之间数量上的线性变化关系的方法过程。
The School of Public Health of Weifang Medical University
卫生统计学
(Health Statistics)
厚德
博学
笃行
济世
二、线性回归模型的适用条件
50
55
60
65
70
75
体重(kg)
14名中年健康妇女基础代谢与体重测量值的关系
The School of Public Health of Weifang Medical University
卫生统计学
(Health Statistics)
厚德
博学
笃行
济世
一、线性回归的基本概念
1.直线回归方程中的符号及其含义:
济世
3. 回归参数的估计步骤:
表 11-1 14 名中年健康妇女的基础代谢与体重的测量值 编号 体重 X 基础代谢 Y 例11-1 在某地一项膳食调查中,随机抽取14名401 50.7 4175.6 2 53.7 4435.0 60岁的健康妇女,测得每人的基础代谢(kj/d)与体重的 3 37.1 3460.2 4 51.7 4020.8 数据,见表11-1。据此数据如何判断这两项指标间有无 5 47.8 3987.4 6 62.8 4970.6 相关? 7 67.3 5359.7 8 48.6 3970.6 9 44.6 3983.2 10 58.6 5050.1 11 71.0 5355.5 12 59.7 4560.6 13 62.1 4874.4 14 61.5 5029.2 合计 777.2 63232.9
The School of Public Health of Weifang Medical University
卫生统计学
(Health Statistics)
厚德
博学
笃行
济世
2.直线回归的基本概念:
(1)直线回归:当一个变量随另一个变量有规律地线性依存
变动时,称这种数量上的线性依存变动关系为直线回归。
统计的基本问题在 于“由过去的数据 来推断未来会发生 什么事”。
Pearson
The School of Public Health of Weifang Medical University
卫生统计学
(Health Statistics)
厚德
博学
笃行
济世
表 11-1 14 名中年健康妇女的基础代谢与体重的测量值 编号 体重 X 基础代谢 Y 1 50.7 4175.6 例11-1 在某地一项膳食调查中,随机抽取14名402 53.7 4435.0 3 37.1 3460.2 60岁的健康妇女,测得每人的基础代谢(kj/d)与体重的 4 51.7 4020.8 5 47.8 3987.4 数据,见表11-1。据此数据如何判断这两项指标间有无 6 62.8 4970.6 7 67.3 5359.7 相关? 8 48.6 3970.6 9 44.6 3983.2 10 58.6 5050.1 11 71.0 5355.5 12 59.7 4560.6 13 62.1 4874.4 14 61.5 5029.2 合计 777.2 63232.9
X i Yi a bXi
Yi Y
估计均值
(Yi Y i )2
适宜统计量a和b
The School of Public Health of Weifang Medical University
卫生统计学
(Health Statistics)
厚德
博学
笃行
值,Y都具有相同的方差。(散点图、残差散点图)
The School of Public Health of Weifang Medical University
卫生统计学
(Health Statistics)
厚德
博学
笃行
济世
三、回归参数的估计
1. 回归模型:
简单线性回归模型: Yi 是实测Y值。
Yi X i i
卫生统计学
(Health Statistics)
Biblioteka Baidu
厚德
博学
笃行
济世
6000 5500
ei Yi Y i
(Kj/d) 基础代谢(
5000 4500 4000 3500 3000
35
40
45
50
55
60
65
70
75
体重(kg)
14名中年健康妇女基础代谢与体重测量值的关系
The School of Public Health of Weifang Medical University
体重 X 50.7 53.7 37.1 51.7 47.8 62.8 67.3 48.6 44.6 58.6 71.0 59.7 62.1 61.5 777.2
基础代谢 Y 4175.6 4435.0 3460.2 4020.8 3987.4 4970.6 5359.7 3970.6 3983.2 5050.1 5355.5 4560.6 4874.4 5029.2 63232.9
α 是模型的截距。
β 是的模型总体回归系数(斜率)。
Xi是X的实测值。
ε 是残差(residual),ei=Yi-Ŷi。
The School of Public Health of Weifang Medical University
卫生统计学
(Health Statistics)
厚德
博学
笃行
济世
Y 63232.9
. XY 358063251
X 777.2 / 14 55.51
Y 63232 9 / 14 4516.64 .
The School of Public Health of Weifang Medical University
卫生统计学
(Health Statistics)
两变量的简单回归分析(直线回归分析)
The School of Public Health of Weifang Medical University
卫生统计学
(Health Statistics)
厚德
博学
笃行
济世
主要内容
★ 1.掌握直线回归的基本概念。 2.熟悉直线回归方程的建立。 ★ 3.掌握回归系数的假设检验。
The School of Public Health of Weifang Medical University
卫生统计学
(Health Statistics)
厚德
博学
笃行
济世
6000 5500
Ŷ= a + bX
(Kj/d 基础代谢( )
5000 4500 4000 3500 3000
35
40
45
通常情况下研究者只能获取一定数量的样本数据,
用该样本数据建立的有关X与Y变化的线性表达式为
回归方程。
样本线性回归方程:
Y a bX
估 计
总体线性回归模型:
Yi X i i
The School of Public Health of Weifang Medical University
Ŷ= a + bX 直线回归方程(Linear regression equation)
X:自变量(independent variable)
Y:因变量(dependent variable)
Ŷ:实测Y值的估计值(the estimation of Y)
a:截距(intercept)
b:回归系数(regression coefficient)
1. 线性(linear):X与Y的存在线性关系。(散点图) 2. 独立(independent):任意两个观察值相互独立。(专业知识)
3. 正态(normal):在一定范围内,任意给定X值,对应Y都服
从正态分布。(专业知识、正态性检验)。
4. 等方差(equal variance):X的取值范围内,不论X取什么
The School of Public Health of Weifang Medical University
卫生统计学
(Health Statistics)
厚德
博学
笃行
济世
(1) 由样本数据绘制散点图:
6000 5500
(Kj/d) 基础代谢(
5000
4500 4000 3500 3000 35 40 45 50 55 60 65 70 75
a Y bX
The School of Public Health of Weifang Medical University
卫生统计学
(Health Statistics)
厚德
博学
笃行
济世
14 名中年健康妇女基础代谢与体重测量值
编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 ∑
The School of Public Health of Weifang Medical University
卫生统计学
(Health Statistics)
厚德
博学
笃行
济世
2. 回归参数估计的最小二乘(LSE)原则:
Y a bX
参数α和β
Yi X i i
统计量a和b
The School of Public Health of Weifang Medical University
卫生统计学
(Health Statistics)
厚德
博学
笃行
济世
(3) 由样本数据计算基本统计量:
n 14
X 777.2
X 2 4429028 . Y 2 290245421 .47
XY 211702.92 238159.50 128373.42 207875.36 190597.72 312153.68 360707.81 192971.16 177650.72 295935.86 380240.50 272267.82 302700.24 309295.80 3580632.51
4.了解直线回归方程的应用。
★ 5.掌握直线相关和直线回归的联系与区别。
The School of Public Health of Weifang Medical University
卫生统计学
(Health Statistics)
厚德
博学
笃行
济世
回归(regression)的由来
Golton