非参数检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.确定P值,做出推断结论
以n1、(n2-n1)和检验统计量T 值查附表11T界值表确定 P值:若T 值在界值范围内,则P 值大于相应的概率; 若T 值在界值范围外或等于界值,则P 值小于或等于 相应概率。 本例…
19
正态近似法:
成组设计两样本比较的秩和检验 原始数据的两样本比较
• 若n1 或n2-n1 超出了附表11 T 界值表的范围,可用正 态近似法: u T n1( N 1) / 2 0.5 n1n2 ( N 1) / 12
12
1.00000
T 分布
T分布以均数为中心,均数处频数最多,左右对 称,向两侧逐渐减少。当H0 成立时,从总体随机 抽取n=5的一个样本,所得T值在均数附近的概率 最大,而T值远离均数的概率较小。随着n增大, T分布逐渐逼近正态分布,其均数为n(n+1)/4,方 差 为 n(n+1)(2n+1)/24 ; 当 n>25 时 , T 分 布 较 好 的 近似正态分布。
24
秩次范围 平均秩次
5 1~107 108~131 132~184 185~208
6 54 119.5 158.0 196.5
秩和
单纯性 肺气肿
7=2 ×6
8=3×6
3510
2268
2151
717
4740
3634
2554.4 2161.5
合计 126 82
208 —
— 12955.5 8780.5
式中N = n1+n2 ,0.5为连续性校正数。 • 若相同秩次较多(如超过25%)时应进行校正,
uc u / c ,其中 c 1
(t
3 j
t
j
)
/(N
3
N
)
tj为第j个相同秩次的个数。
20
二、频数表资料(或等级资料)的两样本比较
例7.4 用某药治疗不同病型的老年慢性支气管炎病人, 疗效见表7-4,试比较该药对2种病型的疗效?
n 5 时秩和 T 的分布
秩和组成情况
f
0
1
1
1
2
1
3
1+2
2
4
1+3
2
5
1+4
2+3
3
1+2+3
1+5
2+4
3
1+2+4
2+5
3+4
3
1+2+5
3+5
1+3+4
3
1+3+5
4+5
2+3+4
3
1+4+5
2+3+5 1+2+3+4 3
1+2+3+5 2+4+5
2
1+2+4+5 3+4+5
2
1+3+4+5
17
表 7-3 正常人与肺炎患者血铁蛋白检测结果(μg/L)
肺炎患者
正常人
血清铁蛋白 秩次
血清铁蛋白 秩次
31
1
177
17
68
11.5
172
15
237
19
34
2
174
16
47
7
457
23
132
14
492
24
54
10
199
18
47
7
515
25
52
9
599
26
47
7
238
20
294
22
68
11.5
43
9
正态近似法:
配对设计两样本比较
• 若n >25,超出附表的范围,用正态近似法作u 检验:
T n(n 1) / 4 0.5 u
n(n 1)(2n 1) / 24
• 若相同秩次较多时(不包括差值为0者),计算校正uc:
T n(n 1) / 4 0.5
uc
n(n 1)(2n 1)
配对设计符号秩和检验,n必须大于5。
13
二、单一样本与总体中位数的比较
表 7-2 12 名工人尿氟含量(mmol/L)测定结果
尿氟含量
(1)
2.15 2.10 2.20 2.12 2.42 2.52 2.62 2.72 2.99 3.19 3.37 4.57
差值
(2)=(1)-2.15
0 -0.05 0.05 -0.03 0.27 0.37 0.47 0.57 0.84 1.04 1.22 2.42
8
配对设计两样本比较
• 本例n=9,T=15.5,查附表10 T界值表,得双侧 P>0.05;故按α=0.05检验水准,不拒绝H0,尚不 能认为患者治疗前后的白细胞总数的差别有统计 学意义;即尚不能认为中草药“抗苯一号”对苯 中毒患者的白细胞总数有影响。
• 当n≤5时,应用秩和检验不能得出双侧有统计学意 义的概率,故n必须大于5。
3
主要内容
• 配对设计的符号秩和检验 • 成组设计两样本比较的秩和检验 • 成组设计多样本比较的秩和检验 • 随机区组设计资料的秩和检验
4
第一节 配对设计的符号秩和检验
Wilcoxon符号秩和检验(Wilcoxon signed rank test) 是推断其差值是否来自中位数为零的总体的方法, 可用于: ▪ 配对设计的两样本的比较 ▪ 单一样本与总体中位数的比较
24
第三节 成组设计多样本比较的秩和检验
Kruskal–Wallis检验。该法是由Kruskal和Wallis在 Wilcoxon 秩和检验的基础上扩展的方法,亦称为 K-W检验或H检验。研究目的是推断各样本分别 代表的总体分布有无差别。 原始数据的比较 频数表资料的比较
25
一、原始数据的比较
确定各等级的秩次范围,并计算其平均秩次。 (2) 求秩和并计算检验统计量 以各等级的平均秩次分别乘
以两组相应等级的例数,再分别求秩和得到T1、T2。
22
表 7-4 某药对两种病情支气管炎的疗效
疗效
1 控制 显效 有效 无效
人数
单纯性 肺气肿 合计
2
3
4
65 42
107
18
6
24
30 23
53
13 11
C
1
t
3 j
tj
N3 N
1073 107 243 24 533 53 243 24
1
2083 208
0.8443
uC u / C 0.4974/ 0.8443 0.5413
3.确定P值,做出推断结论 uc=0.5413<1.96,P>0.05,按α=0.05检验水准,不拒绝H0, 尚不能认为该药对两种病型支气管病人的疗效分布不同。
5
一、配对设计的两样本的比较
例7.1 某医院用中草药“抗苯一号”治疗9例苯中毒 患者,其治疗前后的白细胞总数如表7-1,问该药是 否对患者的白细胞总数有影响?
表 7-1 9 名苯中毒患者治疗前后白细胞总数结果(单位为 109/L)
病人号 治疗前 治疗后
差值 d
秩次
(1) (2) (3) (4)=(2)-(3)
(5)
1
6.0
4.2
1.8
6.5
2
4.8
5.5
3
4.5
6.3
4
3.4
3.8
5
7.0
4.4
6
3.8
4.0
7
6.0
5.9
8
3.5
8.0
9
4.3
5.0
-0.7
-4.5
-1.8
-6.5
-0.4
-3
2.6
8
-0.2
-2
0.1
1
-4.5
-9
-0.7
T 15.5 -4.T5 29.5
6
配对设计两样本比较
查表法(n≤25)
秩次(4)
13 15 14 12 6
非参数检验
山东大学公共卫生学院
参数统计(parametric statistics):以样本来自已 知分布(如正态分布)总体为假设基础,对未知 总体参数进行估计或检验的方法,如 t 检验、u 检验和方差分析等; 非参数统计(nonparametric statistics):总体分布 不易确定,或分布呈明显偏态、方差不齐又无适 当的变量转换方法以满足参数统计条件。 非参数统计比较分布而不是比较参数。
23
成组设计两样本比较的秩和检验
频数表或等级资料的两样本比较
本例T1=8780.5,T2=12955.5,n1=82,n2=126,故检验统计量
T=8780.5。因n1=82,需用u检验;又因该等级资料的相同秩
次过多,需进行校正:
u
|
8780.5
82
(208
1)
/wenku.baidu.com
2
|
0.5
0.4974
82126 (208 1) / 12
16
成组设计两样本比较的秩和检验
一、原始数据的两样本比较
例7.3 某医师为研究血铁蛋白与肺炎的关系,随机抽 查了10名肺炎患者和16名正常志愿者,测得血铁蛋白 (g/L)见表7-3,问肺炎患者与正常人血铁蛋白含量有 无差别? 1.建立检验假设,确定检验水准 H0: 肺炎患者与正常人的血清铁蛋白总体分布相同 H1: 肺炎患者与正常人的血清铁蛋白总体分布不同 α=0.05
1.建立检验假设,确定检验水准
H0: M = 2.15 单侧α=0.05
H1: M >2.15
2.计算检验统计量
(1) 求差值 差值为各观察值与已知总体中位数之差。
(2) 编秩次 方法同配对设计。
(3) 求秩和并确定统计量 本例T+=62.5,T-=3.5, 取T=3.5。
3.确定P 值,做出推断结论
表 7-4 某药对两种病情支气管炎的疗效
疗效
人数
单纯性 单纯合并肺气肿 合计
(1) 控制
(2) 65
(3) 42
(4) 107
显效
18
6
24
有效
30
23
53
无效
13
11
24
合计
126
82
208
21
成组设计两样本比较的秩和检验 频数表或等级资料的两样本比较
1.建立检验假设,确定检验水准 H0: 两种病型的病人疗效总体分布相同 H1: 两种病型的病人疗效总体分布不同 α=0.05 2.计算检验统计量 (1) 编秩 本例为等级资料,先计算各等级的合计人数,再
(t
3 j
t
j
)
24
48
其中tj为第j(j = 1,2…)个相同秩次的个数。
10
基本思想
假定从一总体中,随机抽取 n =5的样本,按上述步 骤,可以求出T+、T-。
当重复抽取所有可能组合的样本,秩和T+的分布见 下表。
11
秩和 T
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 合计
例7.5 某院外科用3种手术方法治疗肝癌患者15例,每 组5例,每例术后生存月数如表7-5。试问3种不同手 术方法治疗肝癌的效果有无不同?
表 7-5 3 种手术方法治疗肝癌患者的术后生存月数
甲法
乙法
丙法
月数(1)
3 7 7 6 2
秩次(2)
4 10 10 7.5 2.5
月数(3)
9 12 11 8 5
本例n =11,T =3.5,查T界值表,得P<0.005,按
α=0.05检验水准,拒绝H0,接受H1,可认为…
15
第二节 成组设计两样本比较的秩和检验
成组设计两样本比较的秩和检验 (Wilcoxon两样本比 较法),研究目的是推断两样本分别代表的总体分布 是否相同。 ▪ 原始数据的两样本比较 ▪ 频数表资料(或等级资料)的两样本比较
1.建立检验假设,确定检验水准 H0 : Md=0 H1: Md≠0 α= 0.05
2.计算检验统计量T 值 (1) 求各对的差值 (2) 编秩 按差值的绝对值由小到大编秩,依差值的正负
给秩次冠以正负号。编秩时,若差值为0,舍去不计; 若差值的绝对值相等,则取其平均秩次。
7
配对设计两样本比较
(3) 求秩和并确定统计量T 分别求出正、负秩次之和, 正秩和以T+表示,负秩和以T-表示,可任取正秩和或 负秩和为统计量T。 T++T-=n(n+1)/2,n为不等于0的对子数。 3.确定P值,做出推断结论 当n≤25时,以T值查附表10T界值表(配对设计用), 若检验统计量T值在T界值范围内,则P值大于相应的 概率水平;若T值在T界值范围外或等于界值,则P值 小于或等于相应的概率水平。
3.5
277
21
44
5
43
3.5
95
13
n1=10
T1=183.5
n2=16
T2=167.5
18
2.计算统计量T 值
成组设计两样本比较的秩和检验 原始数据的两样本比较
(1)编秩次 将2组数据由小到大统一编秩。遇有相同 数据且不同组时取平均秩次。
(2)求秩和并确定统计量T 2组秩次分别相加,其对 应的秩和分别为183.5和167.5。若2组例数相等,则任 取一组的秩和为统计量;若2组例数不等,以样本例 数较小者为n1,其对应的秩和为统计量T。
1
2+3+4+5
1
1+2+3+4+5
1
32
概率
0.03125 0.03125 0.03125 0.06250 0.06250 0.09375 0.09375 0.09375 0.09375 0.09375 0.09375 0.06250 0.06250 0.03125 0.03125 0.03125
秩次 (3)
-2.5 2.5 -1 4 5 6 7 8 9 10 11
T+=62.5 T-=3.5
例7.2 已知某地 正常人尿氟含量 的中位数为2.15 mmol/L。今在该 地某厂随机抽取 12名工人,测得 尿氟含量如表。 问该厂工人的尿 氟含量是否高于 当地正常人?
14
单一样本与总体中位数比较
2
非参数统计的优点与缺点
优点: ①适用范围广,不受总体分布的限制; ②对数据的要求不严,如某些指标难以准确测定,只
能以严重程度、优劣等级、先后次序等表示的资料 也可应用; ③方法简便,易于理解和掌握; 缺点: 如果对符合参数检验的资料应用非参数检验,因不能 充分利用资料提供的信息,会使检验效能低于参数检 验;若要使检验效能相同往往需要更大的样本含量。
相关文档
最新文档