第七章非参数检验讲解
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第七章
非参数检验
山东大学公共卫生学院
参数统计(parametric statistics):以样本来自已 知分布(如正态分布)总体为假设基础,对未知
总体参数进行估计或检验的方法,如 t 检验、u
检验和方差分析等; 非参数统计(nonparametric statistics):总体分布 不易确定,或分布呈明显偏态、方差不齐又无适 当的变量转换方法以满足参数统计条件。 非参数统计比较分布而不是比较参数。
小于或等于相应的概率水平。
8
配对设计两样本比较
• 本例n=9,T=15.5,查附表10 T界值表,得双侧 P>0.05;故按α=0.05检验水准,不拒绝H0,尚不 能认为患者治疗前后的白细胞总数的差别有统计
学意义;即尚不能认为中草药“抗苯一号”对苯
中毒患者的白细胞总数有影响。 • 当n≤5时,应用秩和检验不能得出双侧有统计学 意配对设计符号秩和检验,n必须大于5。
11
二、单一样本与总体中位数的比较
表 7-2 12 名工人尿氟含量(mmol/L)测定结果 尿氟含量 (1) 2.15 2.10 2.20 2.12 2.42 2.52 2.62 2.72 2.99 3.19 3.37 4.57 差 值 (2)=(1)-2.15 0 -0.05 0.05 -0.03 0.27 0.37 0.47 0.57 0.84 1.04 1.22 2.42 秩 次 (3) -2.5 2.5 -1 4 5 6 7 8 9 10 11
例7.2 已知某地 正常人尿氟含量 的中位数为2.15 mmol/L。今在该 地某厂随机抽取 12名工人,测得 尿氟含量如表。 问该厂工人的尿 氟含量是否高于 当地正常人?
12
T+=62.5 T-=3.5
单一样本与总体中位数比较
1.建立检验假设,确定检验水准 H0: M = 2.15 H1: M >2.15 单侧α=0.05 2.计算检验统计量 (1) 求差值 差值为各观察值与已知总体中位数之差。 (2) 编秩次 方法同配对设计。 (3) 求秩和并确定统计量 本例T+=62.5,T-=3.5, 取T=3.5。 3.确定P 值,做出推断结论 本例n =11,T =3.5,查T界值表,得P<0.005,按 α=0.05检验水准,拒绝H0,接受H1,可认为… 13
2
非参数统计的优点与缺点
优点: ①适用范围广,不受总体分布的限制; ②对数据的要求不严,如某些指标难以准确测定,只 能以严重程度、优劣等级、先后次序等表示的资料 也可应用; ③方法简便,易于理解和掌握; ④具有较好的稳健性。 缺点: 如果对符合参数检验的资料应用非参数检验,因不能 充分利用资料提供的信息,会使检验效能低于参数检 验;若要使检验效能相同往往需要更大的样本含量。
5
一、配对设计的两样本的比较
例7.1 某医院用中草药“抗苯一号”治疗9例苯中毒 患者,其治疗前后的白细胞总数如表7-1,问该药是 否对患者的白细胞总数有影响?
表 7-1 9 名苯中毒患者治疗前后白细胞总数结果(单位为 109/L) 病人号 (1) 1 2 3 4 5 6 7 8 9 治疗前 治疗后 (2) (3) 6.0 4.2 4.8 5.5 4.5 6.3 3.4 3.8 7.0 4.4 3.8 4.0 6.0 5.9 3.5 8.0 4.3 5.0 差值 d 秩次 (4)=(2)-(3) (5) 1.8 6.5 -0.7 -4.5 -1.8 -6.5 -0.4 -3 2.6 8 -0.2 -2 0.1 1 -4.5 -9 -0.7 -4.5 T 15.5 T 29.5
其中tj为第j(j = 1,2…)个相同秩次的个数。
10
T 分布
T 分布以均数为中心,均数处频数最多,左右对
称,向两侧逐渐减少。当H0 成立时,从总体随机
抽取n=5的一个样本,所得T值在均数附近的概率 最大,而T值远离均数的概率较小。随着n增大, T 分布逐渐逼近正态分布,其均数为 n(n+1)/4, 方 差为 n(n+1)(2n+1)/24 ;当 n>25 时, T 分布较好的
3
主要内容
• 配对设计的符号秩和检验 • 成组设计两样本比较的秩和检验 • 成组设计多样本比较的秩和检验 • 随机区组设计资料的秩和检验
4
第一节 配对设计的符号秩和检验
Wilcoxon符号秩和检验(Wilcoxon signed rank test) 是推断其差值是否来自中位数为零的总体的方法, 可用于: 配对设计的两样本的比较 单一样本与总体中位数的比较
7
配对设计两样本比较
(3) 求秩和并确定统计量T 负秩和为统计量T。
分别求出正、负秩次之和,
正秩和以T+表示,负秩和以 T-表示,可任取正秩和或
T++T-=n(n+1)/2,n为不等于0的对子数。 3.确定P值,做出推断结论 当n≤25时,以T值查附表10T界值表(配对设计用), 若检验统计量 T值在T界值范围内,则P值大于相应的 概率水平;若T值在T界值范围外或等于界值,则P值
6
配对设计两样本比较
查表法(n≤25)
1.建立检验假设,确定检验水准 H0 : Md=0 H1: Md≠0 α= 0.05 2.计算检验统计量T 值 (1) 求各对的差值
(2) 编秩 按差值的绝对值由小到大编秩,依差值的正负 给秩次冠以正负号。编秩时,若差值为0,舍去不计; 若差值的绝对值相等,则取其平均秩次。
9
配对设计两样本比较
正态近似法:
• 若n >25,超出附表的范围,用正态近似法作u 检验:
u T n(n 1) / 4 0.5 n(n 1)(2n 1) / 24
• 若相同秩次较多时(不包括差值为0者),计算校正uc:
uc T n( n 1) / 4 0.5
3 n( n 1)(2n 1) ( t j t j ) 24 48
第二节 成组设计两样本比较的秩和检验
成组设计两样本比较的秩和检验 (Wilcoxon两样本比 较法),研究目的是推断两样本分别代表的总体分布
是否相同。
非参数检验
山东大学公共卫生学院
参数统计(parametric statistics):以样本来自已 知分布(如正态分布)总体为假设基础,对未知
总体参数进行估计或检验的方法,如 t 检验、u
检验和方差分析等; 非参数统计(nonparametric statistics):总体分布 不易确定,或分布呈明显偏态、方差不齐又无适 当的变量转换方法以满足参数统计条件。 非参数统计比较分布而不是比较参数。
小于或等于相应的概率水平。
8
配对设计两样本比较
• 本例n=9,T=15.5,查附表10 T界值表,得双侧 P>0.05;故按α=0.05检验水准,不拒绝H0,尚不 能认为患者治疗前后的白细胞总数的差别有统计
学意义;即尚不能认为中草药“抗苯一号”对苯
中毒患者的白细胞总数有影响。 • 当n≤5时,应用秩和检验不能得出双侧有统计学 意配对设计符号秩和检验,n必须大于5。
11
二、单一样本与总体中位数的比较
表 7-2 12 名工人尿氟含量(mmol/L)测定结果 尿氟含量 (1) 2.15 2.10 2.20 2.12 2.42 2.52 2.62 2.72 2.99 3.19 3.37 4.57 差 值 (2)=(1)-2.15 0 -0.05 0.05 -0.03 0.27 0.37 0.47 0.57 0.84 1.04 1.22 2.42 秩 次 (3) -2.5 2.5 -1 4 5 6 7 8 9 10 11
例7.2 已知某地 正常人尿氟含量 的中位数为2.15 mmol/L。今在该 地某厂随机抽取 12名工人,测得 尿氟含量如表。 问该厂工人的尿 氟含量是否高于 当地正常人?
12
T+=62.5 T-=3.5
单一样本与总体中位数比较
1.建立检验假设,确定检验水准 H0: M = 2.15 H1: M >2.15 单侧α=0.05 2.计算检验统计量 (1) 求差值 差值为各观察值与已知总体中位数之差。 (2) 编秩次 方法同配对设计。 (3) 求秩和并确定统计量 本例T+=62.5,T-=3.5, 取T=3.5。 3.确定P 值,做出推断结论 本例n =11,T =3.5,查T界值表,得P<0.005,按 α=0.05检验水准,拒绝H0,接受H1,可认为… 13
2
非参数统计的优点与缺点
优点: ①适用范围广,不受总体分布的限制; ②对数据的要求不严,如某些指标难以准确测定,只 能以严重程度、优劣等级、先后次序等表示的资料 也可应用; ③方法简便,易于理解和掌握; ④具有较好的稳健性。 缺点: 如果对符合参数检验的资料应用非参数检验,因不能 充分利用资料提供的信息,会使检验效能低于参数检 验;若要使检验效能相同往往需要更大的样本含量。
5
一、配对设计的两样本的比较
例7.1 某医院用中草药“抗苯一号”治疗9例苯中毒 患者,其治疗前后的白细胞总数如表7-1,问该药是 否对患者的白细胞总数有影响?
表 7-1 9 名苯中毒患者治疗前后白细胞总数结果(单位为 109/L) 病人号 (1) 1 2 3 4 5 6 7 8 9 治疗前 治疗后 (2) (3) 6.0 4.2 4.8 5.5 4.5 6.3 3.4 3.8 7.0 4.4 3.8 4.0 6.0 5.9 3.5 8.0 4.3 5.0 差值 d 秩次 (4)=(2)-(3) (5) 1.8 6.5 -0.7 -4.5 -1.8 -6.5 -0.4 -3 2.6 8 -0.2 -2 0.1 1 -4.5 -9 -0.7 -4.5 T 15.5 T 29.5
其中tj为第j(j = 1,2…)个相同秩次的个数。
10
T 分布
T 分布以均数为中心,均数处频数最多,左右对
称,向两侧逐渐减少。当H0 成立时,从总体随机
抽取n=5的一个样本,所得T值在均数附近的概率 最大,而T值远离均数的概率较小。随着n增大, T 分布逐渐逼近正态分布,其均数为 n(n+1)/4, 方 差为 n(n+1)(2n+1)/24 ;当 n>25 时, T 分布较好的
3
主要内容
• 配对设计的符号秩和检验 • 成组设计两样本比较的秩和检验 • 成组设计多样本比较的秩和检验 • 随机区组设计资料的秩和检验
4
第一节 配对设计的符号秩和检验
Wilcoxon符号秩和检验(Wilcoxon signed rank test) 是推断其差值是否来自中位数为零的总体的方法, 可用于: 配对设计的两样本的比较 单一样本与总体中位数的比较
7
配对设计两样本比较
(3) 求秩和并确定统计量T 负秩和为统计量T。
分别求出正、负秩次之和,
正秩和以T+表示,负秩和以 T-表示,可任取正秩和或
T++T-=n(n+1)/2,n为不等于0的对子数。 3.确定P值,做出推断结论 当n≤25时,以T值查附表10T界值表(配对设计用), 若检验统计量 T值在T界值范围内,则P值大于相应的 概率水平;若T值在T界值范围外或等于界值,则P值
6
配对设计两样本比较
查表法(n≤25)
1.建立检验假设,确定检验水准 H0 : Md=0 H1: Md≠0 α= 0.05 2.计算检验统计量T 值 (1) 求各对的差值
(2) 编秩 按差值的绝对值由小到大编秩,依差值的正负 给秩次冠以正负号。编秩时,若差值为0,舍去不计; 若差值的绝对值相等,则取其平均秩次。
9
配对设计两样本比较
正态近似法:
• 若n >25,超出附表的范围,用正态近似法作u 检验:
u T n(n 1) / 4 0.5 n(n 1)(2n 1) / 24
• 若相同秩次较多时(不包括差值为0者),计算校正uc:
uc T n( n 1) / 4 0.5
3 n( n 1)(2n 1) ( t j t j ) 24 48
第二节 成组设计两样本比较的秩和检验
成组设计两样本比较的秩和检验 (Wilcoxon两样本比 较法),研究目的是推断两样本分别代表的总体分布
是否相同。