生物学效应指标的组间对比性分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(二)方差分析原理
1. 方差比与F值、F分布
n1
x1
X~N( , )
2 1
s1
s
2 1 2 1 2 2 2 2
n2
x2
s
s12 / 12 s12 F 2 2 2 s2 / 2 s2
X~N( , )
2 2
s2
2. 方差分析基本原理
• 建立在数据变异结构基础上的F分布的小概率 事件原理。 • 将测量值的总变异分解为几个组成部分(每部 分均有明确的引起其变异的原因),其自由度 也分解为相应的几部分。
t
t0.05 / 2, >A, A > t0.05 / 2, ,P<0.05
(1)假设检验的目的 (2)假设检验中P值的含义 (3)假设检验的基本原理
95%
t0.05 / 2,
A
t0.05 / 2,
A
t
2. 鉴别统计量差别是否由处理因素不同引起
Randomization Sample n Population
C ( X ij ) / N
2 i 1 j 1
(2)组间变异
各处理组由于接受处理的水平不同,各组的样本均数也大 小不等,这种变异称为组间变异。其大小用各组均数与总 均数的离均差平方和表示,表示处理因素的不同水平作用 和随机误差(个体变异+随机测量误差) 。
g g
SS组间 ni ( X i X )
MS组间 组间变异 F MS组内 组内变异
• 一般,组间变异大于或等于组内变异。 • 理论上,如果处理因素无统计学意义, F =1。 如果F >>1,说明处理因素有统计学意义。
本例“变异及自由度”计算得:
• 总离均差平方和及自由度
SS总 X ij X X ij C =2.51,υ总=n-1=23
0.4
2
A T
T
2
v=1
0.3
v=4
0.2
v=6 v=9
0.1
0.0 0 3 6 9 12 15
例
为观察药物A、B治疗某病的疗效,某医师将100例该病病人
随机分为两组,一组40人,服用A药;另一组60人,服用B
药。结果发现:服用A药40人中有30人治愈;服用B药的60 人中有11人治愈。问A、B两药的疗效有无差别?
nπ≥5且n(1-π)≥5
u
p 0
p
p1 p2 u s p1 p2 s p1 p2 1 1 pc (1 pc )( ) n1 n2
x1 x2 pc n1 n2
1.96
(五)Poisson分布法原理
1. Poisson分布的确切概率法原理
P ( X k ) e
0.2
P <0.05,拒绝H0
0.1
0.0
0
2
4
6
8
10
2 0 .05(1) 3.84
(四)二项分布法原理
1. 二项分布确切概率法原理
P( X k ) C (1 )
k n
k
k
nk
n! k (1 ) nk k!(n k )!
α=0.05
P( X k ) P( X )
将表中的理论数和实际数代入 2检验公式:
2
( A T )2 A T
2 检验自由度的计算公式为:
v =(行数-1)(列数-1)=(R-1)(C-1)
本例:(2-1)(2-1)=1
2 分布(chi-square distribution)
0.05( ) 界值记为:
2
0.3
2 2 i 1 j 1 i 1 j 1 g ni g ni
• 组间离均差平方和及自由度
SS组间 ni ( X i X )2
i 1 i 1 g g
( X ij )
j 1
ຫໍສະໝຸດ Baiduni
2
ni
C =1.97, υ组间=g-1=2
• 组内离均差平方和及自由度
SS组内 ( X ij X i )2 =0.54, υ组内=g(ni-1)=n-g=21
Randomization X21 X22 X23 X24 … … X2n2
X ~ N (, 2 )
X11 X12 X13 X14 … … X1n1
x1 s1
x2 s2
表 25例糖尿病患者两种疗法治疗2个月后空腹血糖值(mmol/L) 甲组 乙组
8.4
10.5 12.0 12.0
5.4
6.4 6.4 7.5
例
据以往经验新生儿染色体异常率为0.01;
n=400,X=1,p=0.0025;
问:当地新生儿染色体异常率低于(不同于)一般水平? H0:1=0.01 H1:1<0.01(10.01)
α=0.05
单侧检验:P=P(0)+P(1)
双侧检验:P=P(X<2)+P(X>6)
2. u检验(nπ≥5且(1-π)≥5)
2 S x1 x2 S C (
1 1 ) n1 n 2
2 SC
X
2 1
( X 1 ) 2
n1 n1 n2 2
2 X2
( X 2 ) 2 n2
2 (n1 1) S12 (n2 1) S 2 S n1 n2 2 2 C
t 2.639
表 A、B两药治疗某病疗效比较
处理组 A药 B药 合计 治愈人数 30 11 41 未治愈人数 10 49 59 合计 40 60 100 治愈率(%) 75.00 18.33 41.00
表 A、B两药治疗某病疗效比较
处理组 治愈人数 A药 B药 合计 30 11 41 未治愈人数 10 49 59 合计 40 60 100 治愈率(%) 75.00 18.33 41.00
表
三组战士行军后体温增加数(度)
不饮水 定量饮水 不限量饮水 合计 1.9 1.4 0.9 1.8 1.2 0.7 1.6 1.1 0.9 1.7 1.4 1.1 1.5 1.1 0.9 1.6 1.3 0.9 1.3 1.1 0.8 1.4 1.0 1.0
Xi
1.6
1.2
0.9
1.23
(1)总变异
生物学效应指标的组间对比性分析 (假设检验)
公共卫生学院卫生统计教研室 易 静
一、主要假设检验方法及其基本原理
(一) t(u)检验 (二)方差分析 (三)卡方检验 (四)二项分布直接概率计算法 (五)Poisson分布直接概率计算法 (六)超几何分布的确切概率法 (七)秩和检验
(一) t(u)检验原理
2
x 74 .2
S 6.5
x~t
t
t
95% -A t0.05 / 2, -A A
t0.05 / 2, A
x Sx
x 74.2 72 A Sx 6.5 / 20
0.05 / 2,
t0.05 / 2, <A< t
,P>0.05
1 0 1 0
i 1 j 1 g ni
MS组间 = 1.97 / 2 = 0.985 MS组内 = 0.54 / 21 = 0.026 F=0.985 / 0.026 = 37.88 查界值: F0.05, 2, 21=3.47 , 所以 P<0.05,三组总体均数不全相等。
多重比较
• 不拒绝H0 ,表示拒绝总体均数相等的证据不足
A药
B药 合计
30
11 41 30 11 41
10
49 59 10 49 59
40
60 100 40 60 100
75.00
18.33 41.00 H0:1=2=41%,即A、B 两药治愈率相同。
T11 40 41 16 .4 100
将本例所给数据整理成下表。
处理 A药 B药 合计 表 A、B 两药治疗某病疗效比较 治愈人数 未愈人数 合计 40 30(16.4) 10(23.6) 60 11(24.6) 49(35.4) 41 59 100 治愈率% 75.00 18.33 41.00
2.
2
0.4
2 2 2
v=1
v=4
记为 2 。
v=6
0.1
v=9
0.0 0 3 6 9 12 15
3. 界值 ( )
2
.
2
自由度为 1 的 2 分布 2 若 X ~ N (0,1), 则 X 的分布称为自由度为 1 的 2 分布。 (chi-square distribution),记为 (21) 。 图形:从纵轴某个点开始单调下降,先凸后凹。
• H0:1=2=41%,即A、B两药治愈率相同
H1:12, 即A、B两药治愈率不同 α=0.05
2 检验的基本公式
•
2 ( A T ) 2 T
式中A为实际频数(actual frequency)
T为理论频数(theoretical frequency)
表 A、B两药治疗某病疗效比较 处理组 治愈人数 未治愈人数 合计 治愈率(%)
2 i 1 i 1
( X ij )
j 1
ni
2
ni
C
(3)组内变异
在同一处理组中,虽然每个受试对象接受的处理相同, 但测量值仍各不相同,变异称为组内变异(误差)。 组内变异用组内各测量值与其所在组的均数的差值的 平方和表示,表示随机误差(个体变异+随机测量误差) 的影响。
SS组内 ( X ij X i )
i 1 j 1
g ni
2
总变异的分解
组间变异 组内变异
总变异
总自由度的分解
总自由度
组间 组内
υ总=n-1
υ组内 =m-1
υ 组间=n-m
MS组间 F MS组内
MS组间 SS组间 / 组间
•F统计量服从F分布,有
MS 组内 SS 组内 / 组内
两个自由度,即两个均方
相应的自由度。
X 0
n! X (1 )n X X 0 X !(n X )!
n
k
P( X k ) P( X )
X k X k
0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 1
n
n! X (1 )n X X !(n X )!
P(X)
X 2 3
反映所有测量值之间总的变异程度。大小用离均差
平方和(sum of squares of deviations from mean,SS)
表示,即各测量值与总均数差值的平方和。
SS总 X ij X X ij C
2 2 i 1 j 1
g ni
g ni
g ni
i 1 j 1
0.3
0.2
0.1
0.0
0
2
4
6
8
10
P <0.05,拒绝H0
2 2 0.05(1) 3.84 (1.96)2 Z 0.05/ 2 2 2 0.01(1) 6.63 (2.5758)2 Z 0.01/ 2
2 2 2 p ( np n ) ( np n ) [ n ( 1 p ) n ( 1 )] 2 u2 [ ]2 n (1 ) n n(1 ) p(1 p) n
分析终止。
• 拒绝H0,接受H1,表示总体均数不全相等
哪两两均数之间相等?
哪两两均数之间不等? 需要进一步作多重比较。
• SNK—q检验
• Dunnett—t检验
• LSD—t检验
(三)卡方检验原理
1.
值
2
2 ui2
i 1
分布 2 值的分布称为服 0.3 2 0.2 从自由度为υ的 分布,
X~N(0 72 , 2)
? 1 0 72
原因1: 1 0 ,即是同一总体。
1 0 原因2: 1 0 ,不是同一总体。 1 0
假设样本来自总体均数为72次/分的总体即1 0 是成立的。
随机抽取 n 20
) X~N(0 72,
13.9
15.3 16.7 18.0 18.7 20.7 21.1 15.2
7.6
8.1 11.6 12.0 13.4 13.5 14.8 15.6 18.7
计算检验统计量t值
t x1 x 2 S x x
1 2
t
x ( x 1 x2 ) (1 2 ) ( x 1 x2 ) 0 Sx S x1 x2 S x1 x2
1. 鉴别样本均数与总体均数差别是否由抽样引起
例
根据大量调查,已知健康成年男子的脉搏均数为72次/
分,某医生在某山区随机调查20名健康男子,得平均脉搏
数为74.2次/分,标准差为6.5次/分,能否认为该山区成年男
子的脉搏均数不同于(高于)一般成年男子的脉搏均数?
0 72
1
x 74 .2 S 6.5 n 20