非参数检验课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相同秩次出现,使u值偏小,故 在相同秩次较多(如超过25%) 时,应进行校正,u经校正后略 增大,P值相应减小
uc
t C 1
3
u C
3 j
tj
N N
(二)频数表资料(或等级资料) 的两样本比较
[例3]:20名正常人和32名铅 作业工人尿棕色素定性 检查结果见下表3,问 铅作业工人尿棕色素是 否高于正常人?
u
T n1 n1 n2 1 / 2 0.5 n1n2 n1 n2 1 / 12
u
308 2020 32 1 / 2 0.5 20 3220 32 1 / 12
4.1662
由于相同秩次过多,使u值偏 小,应计算uc进行校正
C 1 t3 j tj
(2)正态近似法:对子数n > 25, 按下式计算u值
u
T nn 1 / 4 0.5
nn 12n 1 / 24
当相同秩次较多时,采用校正 公式:
u
nn 1 T 0.5 4 nn 12n 1 t t j 24 48
3 j
三、成组设计的多组资料 的比较 H 检验(Kruskal-Wallis法)是
用于完全随机设计的多个样本 比较的非参数法
例4 某地检测大气中SO2的日平均浓 度,按照功能区不同设置采样点, 结果如下表4,问各功能区SO2的日 均浓度有无差别? 表4 某地不同功能区SO2浓度比较
对照区
工业区
商业区
居民区
5.确定P值,作出推论
(1)查表法:用于对子数 n ≤ 25,查符号秩和 检验T界值表
1)若检验统计量T值在上、下界 值范围内,其P值大于表上方相 应概率水平;若T值在上、下界 值上或范围外,则P值等于或小 于相应的概率水平
2)统计量T值>界值,P>0.05
统计量T值<=界值,P<=0.05
本例有10对数值,但由于第二对 数值差值为0,所以n=10-1=9, T =10.5,查表T0.05(9)= 5,故P >0.05,按照的检验水准,不能 拒绝H0,故尚不能认为两法测定 空气中CS2的含量有差别
(1)查表法
按n1=7,n2=10查T界值表,得
n2- n1 =3
T0.05(7,3)=45-81 此题T=93.5 超出该范围,则P< 0.05,铅作业工人与非铅作业工 人血铅值的总体分布不同
(2)正态近似法
如果n1或n2超出T界值表的 范围,按下式计算u值:
u
T n1 n1 n2 1 / 2 0.5 n1n2 n1 n2 1 / 12
Ni
5
5
5
5
各组的秩次相加得到Ri
四个功能区的秩和分别为
15,81,63.5,50.5 Ni为各组的观察数,可以不同
1.建立假设 H0 :四个功能区 SO2 日均浓度总 体分布相同 H1 :四个功能区 SO2 日均浓度总 体分布不同或不全相同 α=0.05
2.编秩 将各组数据由小到大排列, 再将各组数据由小到大统一 编秩,不同组的相同数据取 其平均秩次,相同数据在同 一组内,则不必取平均秩次
1.建立假设 H0:两组工人血铅值总体分布 相同 H1:两组工人血铅值总体分布 不相同 α=0.05
2.编秩 将两组数据分别由小到大排 队,并统一编秩,不同组的 相同数据取其平均秩次,相 同数据在同一组,不用取平 均秩次
3.求T 当 n1≠n2时,取较小 n的秩和为 T 当 n1=n2时,任取一组的秩和为 T 本例n1=7,n2=10,则T=93.5 T 4.确定P值,作出推论
表3 正常人和铅作业工人尿棕色 素定性检查结果 尿棕 人数 色素 正常人 铅作业工人 + ++ 3 +++ 4
(1)假设: H0: 两组工人尿棕色素总体分 布相同 H1: 铅作业工人尿棕色素高于 正常人 α=0.05 (2)编秩
(3)计算检验统计量 由于n1=20,超出查表范围, 故需用u检验
例2 测得铅作业与非铅作业工人 的血铅值如表2,问两组工人血 铅值有无差别?
对于分布状况不明的完全随机设 计的两样本比较
表2 两组工人的血铅值比较 铅作业组 非铅作业组 血铅值 秩次 血铅值 秩次 0.82 9 0.24 1 0.87 10.5 0.24 2 0.97 12 0.29 3
1.21 1.64 2.08 2.13
浓度 秩次 浓度 秩次 浓度 秩次 浓度 秩次
10 30 30 40 51 Ri
1 2 3 4 5 15
467 665 709 802 851
9 15 18 19 20 81
231 6 338 7 501 11 352 8 630 13.5 485 10 669 16 511 12 677 17 630 13.5 63.5 50.5
N3 N 263 26 123 12 73 7 33 3 43 4 1 523 52 0.8599
uc
u C
4.1662 0.8599
4.493
(4)确定P值和得出推断结论 uc=4.493>2.58,P<0.01, 故可认为铅作业工人尿棕色 素高于正常人
14 15 16 17
0.33 0.44 0.58 0.63 0.72 0.87 1.01
4 5 6 7 8 10.5 13 T=59.5
n1=7
T=93.5
n2=10
对于完全随机设计的两组资料,编 秩的方法是把两组数据混合从小到 大编秩,不同组的相同数据要取平 均秩次,如上表中两0.87在不同组 中,本应编秩次10、11,现取平均 秩次为10.5
-
9 4
4 46.2 5 1.2 6 25.5 7 2.9 8 5.4 9 3.8 10 1.0 合计
43.2 2.2 27.5 4.9 5.0 3.2 4.0
3.0 -1.0 -2.0 -2.0 0.4 0.6 -3.0
来自百度文库
7.5
3 5 6
1 2
7.5 10.5 34.5
1.建立假设 H0:两方法无差别,即差值的 总体中位数 M = 0 H1:两方法有差别,即差值的 总体中位数 M ≠ 0 α=0.05
3.个别数据偏大或数据的某一端无 确定的数值
4.各总体方差不齐
非参数检验优点:不受总体 分布的限定,适用范围广 非参数检验不足之处:符合 作参数检验的资料(如两样本 均数比较的t检验),如用非 参数检验,检验效率低于参 数检验。一般犯第二类错误 的概率β比参数检验大
一、配对资料的符号秩和检验 (wilcoxon signed rank test, 又称差数秩和检验)
预 防 医 学
Preventive Medicine
预防医学教研室 2004.06
第十八章
秩和检验
蔡泳
非参数统计的概念 non-parametric statistics
不知道所研究样本来自总体的分 布型或已知总体分布与检验所要 求的条件不符,此时可用非参数 统计进行假设检验
适用资料: 1.总体分布为偏态或分布形式未知 2.等级资料
故P < 0.05
四个功能区SO2日均浓度有差别
例1 甲乙两方法分别测定某车 间空气中CS2的含量如表1 问两方法测定结果有无差别
表1 甲乙两方法分别测定某车间空 气中CS2的含量比较 采样 号
(1)
甲法 乙法 差值 +
( 2) ( 3) ( 4)
秩次 (6) (5)
1 2 3
50.7 3.3 28.8
60.0 3.3 30.0
-9.3 0 -1.2
3. 求各组秩和Ri Ri = 各组秩次相加 4. 计算统计量 H 值
R 12 H 3N 1 N N 1 ni
2 i
ni为各组观察值个数,
N ni
本例:
2 2 2 2 12 15 81 63.5 50.5 H 2020 1 5 5 5 5 320 1
式中,tj:第j(j=1,2,· · · ) 个相同差值的个数,假定差值中 有2个4,5个6,3个7,则t1=2, t2=5,t3=3
t
j
3 j
tj
2 2 5 5 3 3 150
3 3 3
二、两组资料的比较
亦称成组设计两样本比较的秩 和检验(Wilcoxon两样本比较法) (一)原始数据的两样本比较
2.求各对数值的差数 3.编秩:按差值的绝对值由小到 大编秩,将秩次按差值的正负 分两栏 差值的绝对值相等、符号相反 时,各取平均秩次;符号相同 的相等差值,不必取平均秩次; 差值为0,则弃去不计,并从 相应的对子数n中减去
4.确定统计量T:分别求正负秩 次之和,以绝对值较小者为统 计量T ,本例T = 10.5
19.39
5. 确定P值,作出推论
组数k=3,每组n≤5,查P162附 表11-3“秩和检验用H界值表”; 不符上面条件,按ν=k-1查χ2 界值表(若最小样本例数不小 于5,则H近似服从ν= k-1的 χ2分布)
本例ν= 4-1 = 3, H = 19.39 > χ2
0.05(3)=7.81