【统计学】9基于秩次的非参数检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
14
• 怎样编秩? • 编秩就是将观察值按顺序由小到大排列,并用序号代替原始变
量值本身。不同的实验设计类型,有不同的编秩规则.
15
配对资料的编秩规则
按照配对设计,先求出对子之间的差值,按其差 值的绝对值,从小到大进行排序,其序号即秩次, 并在秩次之前保持原差值的正负号不变。 编秩遇到差值为零时则舍去不编秩; 对绝对值相等的差值取平均值,并在秩次之前保持原 差值的正负号; 一般来说,秩次最小为1,最大为对子数N,当有差值 为零时,最大秩次等于对子数n减去差值为零的个数 。
第一节 单样本和配对资料的符号秩和检验
• 单样本符号秩和检验 • 又称符号秩和检验(signed rank test ),差数秩和检验 • 适用:不能用单样本t检验进行分析的资料。 • 目的:是推断样本中位数与已知总体中位数是否相等。 • 例题:已知某地正常人尿铅含量的中位数为2.5微摩尔/升,今在
• 若是随机区组设计的自非正态总体或方差不齐(转化后也不满足) 的定量资料,宜用Firedman秩和检验。
19
注意:
秩和检验确定P值通常有: ①查表确定p值,适用于小样本; ②正态近似法,计算z值,确定p值,适用于大样本的资料。 在相同秩次的个数大于样本量的25%时需要采用相应的公式进行校 正。
20
30
• 确定p值,下结论 • 查表得T0.05(12)=13-65, • 本例 T+=68, T-=10,不在范围之内,P<0.05 ,拒绝Ho,接受H1,
两种方法处理效果不同
31
两种方法治疗扁平足效果观察
病例号
原始记录 A法 B法
• A组 4.7 6.4 2.6 3.2 5.2 • B组 1.7 2.6 3.6 2.3 3.7
12
• 两组各有5个变量值。现在依从小到大的顺序将它们排列起 来,并标明秩次,结果如下:
• A组
2.6 3.2
4.7 5.2 6.4
• B组 1.7 2.3 2.6 3.6 3.7
• 秩次 1 2 3 4 5 6 7 8 9 10
22
尿铅X 0.62 0.78 2.13 2.48 2.54 2.68 2.73 3.01
差值d -1.88 -1.72 -0.37 -0.02 -0.04 0.18 0.23 0.51
秩次 -12 -10 -5 -1 -2
3 4 6
T+=108, T-=28
23
尿铅X 3.13 3.27 3.54 4.38 4.38 5.05 6.08 11.27
例题 采用配对设计,用某种放射线的A,B 两种方式分别局部照射家兔的两个部位,观察放 射性急性皮肤损伤程度,见表。 比较A,B的损 伤程度是否不同。
26
27
• 1、检验步骤:
• H0:两处理效应相同
• H1:两处理效应不相同。
•
a=0.05
• 2.求差值
• 3、编秩次、求秩和
•
28
29
• 求秩号和即将正、负秩号分别相加,本例得正秩号和为68,负秩 号和为10,正负秩号绝对值之和应等于n(n+1)/2,可用以核对, 如本例 68+10=12(12+1)/2=78,说明秩号计算正确。
• 当n>50,采用正态分布法
T n(n 1) / 4 0.5
z
•
n(n 1)(2n 1) / 24
24
T为T+或者Tn为样本含量 0.5为连续性校正数
当相同秩次(差值较多时)用校正公式:
T n(n 1) / 4 0.5
z
n(n 1)(2n 1)
(t
3 j
t
j
)
24
48
25
• 二、配对设计资料的秩和检验
法确定,可选用wilcoxon(威尔科克森)符号秩和检验方法; • 若是两组独立样本资料,来自非正态分布的定量资料或有序二分类变量
资料(等级资料)宜用wilcoxon秩和检验。
18
• 若是多组独立样本资料,来自非正态总体或方差不齐(转化后也 不满足)的定量资料或者是有序多分类变量资料(等级资料)宜 用Kruskal-Wallis秩和检验。
16
完全随机设计的两组或多组资料的编秩规则
❖将各组变量依据从小到大的顺序进行统一排序,其 序号即为秩次,
❖如果有多个相等的变量值分布在同一组中,则按顺 序依次对其编列秩次,如果有多个相等的变量值分 布在不同组中,则按顺序排序然后取其平均秩次。
17
怎样选用不同设计的秩和检验方法
• 首先要区分试验设计和资料的类型: • 若是一个样本资料或者配对设计的资料,来自非正态总体或总体分布无
该地某厂随机抽取16名工人,测定血铅值,问该厂工人的血铅值 是否高于当地正常人?
21
• 1、建立检验假设 • Ho: 该厂的工人血铅值和正常人相同 • H1:该厂的工人血铅值高于正常人 • 单侧 α=0.05 • 2、计算统计量T (见下表) • (1)求差值d=x-2.5 • (2)编秩次,根据差值绝对值排序,序号前加符号 • (3)求秩和
差值d 0.63 0.77 1.04 1.88 1.88 2.55 3.58 8.77
秩次 7 8 9 12 12 14 15 16
• 3、确定p值
• 当n≤50,查附表9 根据n的大小,当统计量T值在α界值范围之内,则 P>α,当等于界值或超出界值范围,则P ≤ α。本例T在界值范围之外, P<0.05,拒绝Ho,接受H1.
13
• 原始值中有两个“2.6”,分属A、B组,它们的秩次应是3和4,然 而它们的数值本来是同样大小的,哪组取“3”,哪组取“4”呢? 我们计算它们的平均数(3+4)/2=3.5,作为“2.6”的秩次,称为 “平均秩次”,这样才公平合理。这样两组所得的秩次及秩和如 下:
• A组 3.5 5 8 9 10 /35.5 • B组 1 2 3.5 6 7 /19.5
基于秩次的非参数检验
2
3
4
5
来自百度文库
6
5、组内个别观察值偏离过大的资料。 6、开口分组资料。
7
8
9
秩和检验几个概念 • 秩次与平均秩次 • 秩和 • 编秩与编秩原则
10
11
一、秩次和秩和
• “秩”即按数据大小排定的次序号,又称秩次号。编秩就是将观 察值按顺序由小到大排列,并用序号代替原始变量值本身。用秩次 号代替原始数据后,所得某些秩次号之和,即按某种顺序排列的序 号之和,称为秩和。设有以下两组数据:
• 怎样编秩? • 编秩就是将观察值按顺序由小到大排列,并用序号代替原始变
量值本身。不同的实验设计类型,有不同的编秩规则.
15
配对资料的编秩规则
按照配对设计,先求出对子之间的差值,按其差 值的绝对值,从小到大进行排序,其序号即秩次, 并在秩次之前保持原差值的正负号不变。 编秩遇到差值为零时则舍去不编秩; 对绝对值相等的差值取平均值,并在秩次之前保持原 差值的正负号; 一般来说,秩次最小为1,最大为对子数N,当有差值 为零时,最大秩次等于对子数n减去差值为零的个数 。
第一节 单样本和配对资料的符号秩和检验
• 单样本符号秩和检验 • 又称符号秩和检验(signed rank test ),差数秩和检验 • 适用:不能用单样本t检验进行分析的资料。 • 目的:是推断样本中位数与已知总体中位数是否相等。 • 例题:已知某地正常人尿铅含量的中位数为2.5微摩尔/升,今在
• 若是随机区组设计的自非正态总体或方差不齐(转化后也不满足) 的定量资料,宜用Firedman秩和检验。
19
注意:
秩和检验确定P值通常有: ①查表确定p值,适用于小样本; ②正态近似法,计算z值,确定p值,适用于大样本的资料。 在相同秩次的个数大于样本量的25%时需要采用相应的公式进行校 正。
20
30
• 确定p值,下结论 • 查表得T0.05(12)=13-65, • 本例 T+=68, T-=10,不在范围之内,P<0.05 ,拒绝Ho,接受H1,
两种方法处理效果不同
31
两种方法治疗扁平足效果观察
病例号
原始记录 A法 B法
• A组 4.7 6.4 2.6 3.2 5.2 • B组 1.7 2.6 3.6 2.3 3.7
12
• 两组各有5个变量值。现在依从小到大的顺序将它们排列起 来,并标明秩次,结果如下:
• A组
2.6 3.2
4.7 5.2 6.4
• B组 1.7 2.3 2.6 3.6 3.7
• 秩次 1 2 3 4 5 6 7 8 9 10
22
尿铅X 0.62 0.78 2.13 2.48 2.54 2.68 2.73 3.01
差值d -1.88 -1.72 -0.37 -0.02 -0.04 0.18 0.23 0.51
秩次 -12 -10 -5 -1 -2
3 4 6
T+=108, T-=28
23
尿铅X 3.13 3.27 3.54 4.38 4.38 5.05 6.08 11.27
例题 采用配对设计,用某种放射线的A,B 两种方式分别局部照射家兔的两个部位,观察放 射性急性皮肤损伤程度,见表。 比较A,B的损 伤程度是否不同。
26
27
• 1、检验步骤:
• H0:两处理效应相同
• H1:两处理效应不相同。
•
a=0.05
• 2.求差值
• 3、编秩次、求秩和
•
28
29
• 求秩号和即将正、负秩号分别相加,本例得正秩号和为68,负秩 号和为10,正负秩号绝对值之和应等于n(n+1)/2,可用以核对, 如本例 68+10=12(12+1)/2=78,说明秩号计算正确。
• 当n>50,采用正态分布法
T n(n 1) / 4 0.5
z
•
n(n 1)(2n 1) / 24
24
T为T+或者Tn为样本含量 0.5为连续性校正数
当相同秩次(差值较多时)用校正公式:
T n(n 1) / 4 0.5
z
n(n 1)(2n 1)
(t
3 j
t
j
)
24
48
25
• 二、配对设计资料的秩和检验
法确定,可选用wilcoxon(威尔科克森)符号秩和检验方法; • 若是两组独立样本资料,来自非正态分布的定量资料或有序二分类变量
资料(等级资料)宜用wilcoxon秩和检验。
18
• 若是多组独立样本资料,来自非正态总体或方差不齐(转化后也 不满足)的定量资料或者是有序多分类变量资料(等级资料)宜 用Kruskal-Wallis秩和检验。
16
完全随机设计的两组或多组资料的编秩规则
❖将各组变量依据从小到大的顺序进行统一排序,其 序号即为秩次,
❖如果有多个相等的变量值分布在同一组中,则按顺 序依次对其编列秩次,如果有多个相等的变量值分 布在不同组中,则按顺序排序然后取其平均秩次。
17
怎样选用不同设计的秩和检验方法
• 首先要区分试验设计和资料的类型: • 若是一个样本资料或者配对设计的资料,来自非正态总体或总体分布无
该地某厂随机抽取16名工人,测定血铅值,问该厂工人的血铅值 是否高于当地正常人?
21
• 1、建立检验假设 • Ho: 该厂的工人血铅值和正常人相同 • H1:该厂的工人血铅值高于正常人 • 单侧 α=0.05 • 2、计算统计量T (见下表) • (1)求差值d=x-2.5 • (2)编秩次,根据差值绝对值排序,序号前加符号 • (3)求秩和
差值d 0.63 0.77 1.04 1.88 1.88 2.55 3.58 8.77
秩次 7 8 9 12 12 14 15 16
• 3、确定p值
• 当n≤50,查附表9 根据n的大小,当统计量T值在α界值范围之内,则 P>α,当等于界值或超出界值范围,则P ≤ α。本例T在界值范围之外, P<0.05,拒绝Ho,接受H1.
13
• 原始值中有两个“2.6”,分属A、B组,它们的秩次应是3和4,然 而它们的数值本来是同样大小的,哪组取“3”,哪组取“4”呢? 我们计算它们的平均数(3+4)/2=3.5,作为“2.6”的秩次,称为 “平均秩次”,这样才公平合理。这样两组所得的秩次及秩和如 下:
• A组 3.5 5 8 9 10 /35.5 • B组 1 2 3.5 6 7 /19.5
基于秩次的非参数检验
2
3
4
5
来自百度文库
6
5、组内个别观察值偏离过大的资料。 6、开口分组资料。
7
8
9
秩和检验几个概念 • 秩次与平均秩次 • 秩和 • 编秩与编秩原则
10
11
一、秩次和秩和
• “秩”即按数据大小排定的次序号,又称秩次号。编秩就是将观 察值按顺序由小到大排列,并用序号代替原始变量值本身。用秩次 号代替原始数据后,所得某些秩次号之和,即按某种顺序排列的序 号之和,称为秩和。设有以下两组数据: