《医学预防医学》PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
12
假设检验的注意事项
1. 样本可比性
2. 选用的假设检验方法应符合其应用条件
3. 正确理解差别有无显著性的统计意义
4. 均数的区间估计与假设检验
5. 正确理解假设检验过程中样本均数与总体均数
间的关系
6. 单,双侧检验的选择
7. 两类错误与检验功效
复习2009 康晓平
h
13
假设检验的结论可能发生的两类错误
• 样本均数与总
有一个随机样本均数和
体均数比较
一个标准值(经验值)
• 配对资料或同一 批对象试验前 后比较的t检验
配对设计,计算一组样 本数据差值的均数
• 两个样本均数比较 成组设计,有两个随机 样本均数
复习2009 康晓平
h
计算方法
t X 0 sX
t d d sd
F s12 s22
t X1 X2 sX1 X2
注意事项
-- 可比性(分层、标化)
-- 适用条件
h -- 结果解释
3
“应用” 统计的步骤:
样本数据 (数值变量、分类变量)
确定分组变量、结局变量
两组或 多组数据对比分析
两变量关联性分析
t 检验 F 检验 秩和 2检验
线性相关回归 2检验
论文
复习2009 康晓平
h
4
三种常用平均数
平均数
适用资料
算术均数 变量值呈对称分布,
* 总体参数的假设检验
(例如,均数的t检验和z 检
验; 率的z 检验)
h
9
均数的假设检验
• 假设检验的基本概念 所比较的两个样本均数x1 x2 两种可能性: 两样本均数来自两个相同的总体
两样本均数来自两个不同的总体
复习2009 康晓平
h
10
• 假设检验的一般步骤
1.建立假设,确定检验水准 无效假设H0, 1 = 2, (x1 x2) 备择假设H1 1 2,
复习2009 康晓平
h
16
随机区组设计方差分析的计算公式
变异来源
SS
MS
F
总 处理组间
SS总 SS处理
N-1 a-1
SS处理/ 处理 MS处理/ MS误差
区组间
SS区组
n - 1 SS区组/ 区组 MS区组/ MS误差
误差
SS总–SS处理 (a-1)(n-1) SS误差/ 误差
组
–SS区组
复习2009 康晓平
SS总=SS组间+SS组内
总=组间+组内
复习2009 康晓平
h
15
完全随机设计方差分析的计算公式
变异来源 总变异 组间变异
SS
MS
F
a ni
( yij y )2
i1 j 1
N-1
a
ni ( yi y )2
i 1
a-1
SS组间/ 组间 MS组间/ MS组内
组内变异 SS总 – SS组间 N - a SS组内/ 组内
h
6
正态分布及正态曲线下面积的分布规律
1. 标准正态分布: 当正态分布μ和б已知时,
z X
若μ和б未知,
z X X s
2. 估计观察值所在范围(95%参考值范围)
X z / 2s
X z s
复习2009 康晓平
h
7
标准差与标准误的区别
比较内容
标准差
标准误
──────────────────────
统计方法
计量资料
计数资料
统计描述 统计推断
统计描述 统计推断
统计指标
假设检验
统计指标 假设检验
-- 平均数
-- t 检验
-- 变异指标 -- 方差分析
-- 指标的应用 -- 秩和检验
--相关分析
--线性回归
复习2009 康晓平
-- 频率指标 -- 卡方检验 -- 构成指标 -- 秩和检验 --指标的应用
综合复习
北京大学公共卫生学院 流行病与卫生统计学系
82801619
康晓平
2009.11.24
复习2009 康晓平
h
1
统计方法的几个基本概念
总体
•个体 •变量值 •变异
随机抽样 样 本
抽样研究
参数 ( , )
统计量 (x , s )
系统误差; 随机测量误差; 抽样误差
复习2009 康晓平
h
Байду номын сангаас
2
“学习” 统计的步骤:
尤其正态分布
计算方法 直接法 (未分组资料) 加权法 (分组资料)
几何均数
等比级资料, 对数正态分布
直接法 (未分组资料) 加权法 (分组资料)
中位数 呈偏态分布,分布不清楚, 直接法(未分组资料)
分布一端(或两端)
位次居中的数值
无确定值
复习2009 康晓平
频数表法(分组资料)
h
5
常用描述离散趋势的指标
意义 表示个体观察值间的变异
表示样本均数间的变异
程度,说明观察值x围绕样本 均数x分散程 度的指标
程度, 说明样本均数x 围绕总体均数 的分散 程度,或者样本率p与 总体率分散程度的指标
计算方法
复习2009 康晓平
直接法 加权法
均数的标准误
sX
s n
率的标准误
h
sp
p(1 p) n
8
应用 * 表示一组观察值之间的 * 表示抽样误差的大小,
指标
计算公式
适用条件
极差R
最大值-最小值 任何分布
四分位数间距 Q
方差2、s2
Q=P75-P25
s2 (X X)2 n 1
①偏态分布,②末端无确定 值
对称分布,尤其正态分布
标准差、s
变异系数CV
复习2009 康晓平
s ( X X )2 n 1
对称分布,尤其正态分布
CV s 100% X
①量纲不同的资料②均数相 差悬殊的资料
客观实际
H0成立
H0不成立,H1成立
假设检验的结论
拒绝H0
Ⅰ型错误()
不拒绝H0 推断正确(1-)
推断正确(1-) Ⅱ型错误()
当 P < 0.05时,可能发生 错误 当 P > 0.05时,可能发生 错误
检验功效
复习2009 康晓平
=
1-
h
14
方差分析
• 方差分析的基本思想 --- 多个样本均数的比较用方差分析 (analysis of variance,简称为ANOVA), --- 其目的是检验多个总体均数是否相等。
= 0.05 2.选定检验方法和计算统计量 3.确定概率P值,作出推断结论
t t0.05,v , P 0.05,差别无统计学意义。 t t0.05,v ,P 0.05,差别有统计学意义。 t t0.01,v ,P 0.01,差别有统计学意义。
复习2009 康晓平
h
11
均数的t检验
t检验
设计类型
变异程度说明均数的
说明样本均数或样本
代表性
率的可靠
* 计算变异系数
* 估计总体参数的95%或99%
* 计算均数的标准误
的置信区间
* 当原始数据的分布近似
大样本资料:
正态分布时, 结合X 估计95%或99%的观察值
X z/2sX p z / 2sp
小样本资料:
所在范围
X t /2, sX
复习2009 康晓平
h
17
协方差分析(analysis of covariance, ANCOVA)
假设检验的注意事项
1. 样本可比性
2. 选用的假设检验方法应符合其应用条件
3. 正确理解差别有无显著性的统计意义
4. 均数的区间估计与假设检验
5. 正确理解假设检验过程中样本均数与总体均数
间的关系
6. 单,双侧检验的选择
7. 两类错误与检验功效
复习2009 康晓平
h
13
假设检验的结论可能发生的两类错误
• 样本均数与总
有一个随机样本均数和
体均数比较
一个标准值(经验值)
• 配对资料或同一 批对象试验前 后比较的t检验
配对设计,计算一组样 本数据差值的均数
• 两个样本均数比较 成组设计,有两个随机 样本均数
复习2009 康晓平
h
计算方法
t X 0 sX
t d d sd
F s12 s22
t X1 X2 sX1 X2
注意事项
-- 可比性(分层、标化)
-- 适用条件
h -- 结果解释
3
“应用” 统计的步骤:
样本数据 (数值变量、分类变量)
确定分组变量、结局变量
两组或 多组数据对比分析
两变量关联性分析
t 检验 F 检验 秩和 2检验
线性相关回归 2检验
论文
复习2009 康晓平
h
4
三种常用平均数
平均数
适用资料
算术均数 变量值呈对称分布,
* 总体参数的假设检验
(例如,均数的t检验和z 检
验; 率的z 检验)
h
9
均数的假设检验
• 假设检验的基本概念 所比较的两个样本均数x1 x2 两种可能性: 两样本均数来自两个相同的总体
两样本均数来自两个不同的总体
复习2009 康晓平
h
10
• 假设检验的一般步骤
1.建立假设,确定检验水准 无效假设H0, 1 = 2, (x1 x2) 备择假设H1 1 2,
复习2009 康晓平
h
16
随机区组设计方差分析的计算公式
变异来源
SS
MS
F
总 处理组间
SS总 SS处理
N-1 a-1
SS处理/ 处理 MS处理/ MS误差
区组间
SS区组
n - 1 SS区组/ 区组 MS区组/ MS误差
误差
SS总–SS处理 (a-1)(n-1) SS误差/ 误差
组
–SS区组
复习2009 康晓平
SS总=SS组间+SS组内
总=组间+组内
复习2009 康晓平
h
15
完全随机设计方差分析的计算公式
变异来源 总变异 组间变异
SS
MS
F
a ni
( yij y )2
i1 j 1
N-1
a
ni ( yi y )2
i 1
a-1
SS组间/ 组间 MS组间/ MS组内
组内变异 SS总 – SS组间 N - a SS组内/ 组内
h
6
正态分布及正态曲线下面积的分布规律
1. 标准正态分布: 当正态分布μ和б已知时,
z X
若μ和б未知,
z X X s
2. 估计观察值所在范围(95%参考值范围)
X z / 2s
X z s
复习2009 康晓平
h
7
标准差与标准误的区别
比较内容
标准差
标准误
──────────────────────
统计方法
计量资料
计数资料
统计描述 统计推断
统计描述 统计推断
统计指标
假设检验
统计指标 假设检验
-- 平均数
-- t 检验
-- 变异指标 -- 方差分析
-- 指标的应用 -- 秩和检验
--相关分析
--线性回归
复习2009 康晓平
-- 频率指标 -- 卡方检验 -- 构成指标 -- 秩和检验 --指标的应用
综合复习
北京大学公共卫生学院 流行病与卫生统计学系
82801619
康晓平
2009.11.24
复习2009 康晓平
h
1
统计方法的几个基本概念
总体
•个体 •变量值 •变异
随机抽样 样 本
抽样研究
参数 ( , )
统计量 (x , s )
系统误差; 随机测量误差; 抽样误差
复习2009 康晓平
h
Байду номын сангаас
2
“学习” 统计的步骤:
尤其正态分布
计算方法 直接法 (未分组资料) 加权法 (分组资料)
几何均数
等比级资料, 对数正态分布
直接法 (未分组资料) 加权法 (分组资料)
中位数 呈偏态分布,分布不清楚, 直接法(未分组资料)
分布一端(或两端)
位次居中的数值
无确定值
复习2009 康晓平
频数表法(分组资料)
h
5
常用描述离散趋势的指标
意义 表示个体观察值间的变异
表示样本均数间的变异
程度,说明观察值x围绕样本 均数x分散程 度的指标
程度, 说明样本均数x 围绕总体均数 的分散 程度,或者样本率p与 总体率分散程度的指标
计算方法
复习2009 康晓平
直接法 加权法
均数的标准误
sX
s n
率的标准误
h
sp
p(1 p) n
8
应用 * 表示一组观察值之间的 * 表示抽样误差的大小,
指标
计算公式
适用条件
极差R
最大值-最小值 任何分布
四分位数间距 Q
方差2、s2
Q=P75-P25
s2 (X X)2 n 1
①偏态分布,②末端无确定 值
对称分布,尤其正态分布
标准差、s
变异系数CV
复习2009 康晓平
s ( X X )2 n 1
对称分布,尤其正态分布
CV s 100% X
①量纲不同的资料②均数相 差悬殊的资料
客观实际
H0成立
H0不成立,H1成立
假设检验的结论
拒绝H0
Ⅰ型错误()
不拒绝H0 推断正确(1-)
推断正确(1-) Ⅱ型错误()
当 P < 0.05时,可能发生 错误 当 P > 0.05时,可能发生 错误
检验功效
复习2009 康晓平
=
1-
h
14
方差分析
• 方差分析的基本思想 --- 多个样本均数的比较用方差分析 (analysis of variance,简称为ANOVA), --- 其目的是检验多个总体均数是否相等。
= 0.05 2.选定检验方法和计算统计量 3.确定概率P值,作出推断结论
t t0.05,v , P 0.05,差别无统计学意义。 t t0.05,v ,P 0.05,差别有统计学意义。 t t0.01,v ,P 0.01,差别有统计学意义。
复习2009 康晓平
h
11
均数的t检验
t检验
设计类型
变异程度说明均数的
说明样本均数或样本
代表性
率的可靠
* 计算变异系数
* 估计总体参数的95%或99%
* 计算均数的标准误
的置信区间
* 当原始数据的分布近似
大样本资料:
正态分布时, 结合X 估计95%或99%的观察值
X z/2sX p z / 2sp
小样本资料:
所在范围
X t /2, sX
复习2009 康晓平
h
17
协方差分析(analysis of covariance, ANCOVA)