非参数统计部分课后习题参考答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
课后习题参考答案
第一章p23-25
2、(2)有两组学生,第一组八名学生的成绩分别为x 1:100,99,99,100,99,100,99,99;第二组三名学生的成绩分别为x 2:75,87,60。我们对这两组数据作同样水平a=0.05的t检验(假设总体均值为u ):H 0:u=100 H 1:u<100。第一组数据的检验结果为:df=7,t 值为3.4157,单边p 值为0.0056,结论为“拒绝H 0:u=100。”(注意:该组均值为99.3750);第二组数据的检验结果为:df=2,t 值为3.3290,单边p值为0.0398;结论为“接受H 0:u=100。”(注意:该组均值为74.000)。你认为该问题的结论合理吗?说出你的理由,并提出该如何解决这一类问题。 答:这个结论不合理(6分)。因为,第一组数据的结论是由于p-值太小拒绝零假设,这时可能犯第一类错误的概率较小,且我们容易把握;而第二组数据虽不能拒绝零假设,但要做出“在水平a时,接受零假设”的说法时,还必须涉及到犯第二类错误的概率。(4分)然而,在实践中,犯第二类错误的概率多不易得到,这时说接受零假设就容易产生误导。实际上不能拒绝零假设的原因很多,可能是证据不足(样本数据太少),也可能是检验效率低,换一个更有效的检验之后就可以拒绝了,当然也可能是零假设本身就是对的。本题第二组数据明显是由于证据不足,所以解决的方法只有增大样本容量。(4分)
第三章p68-71
3、在某保险种类中,一次关于1998年的索赔数额(单位:元)的随机抽样为(按升幂排列): 4632,4728,5052,5064,5484,6972,7596,9480,14760,15012,18720,21240,22836,52788,67200。已知1997年的索赔数额的中位数为5064元。
(1)是否1998年索赔的中位数比前一年有所变化?能否用单边检验来回答这个问题?(4分) (2)利用符号检验来回答(1)的问题(利用精确的和正态近似两种方法)。(10分) (3)找出基于符号检验的95%的中位数的置信区间。(8分)
解:(1)1998年的索赔数额的中位数为9480元比1997年索赔数额的中位数5064元是有变化,但这只是从中位数的点估计值看。如果要从普遍意义上比较1998年与1997年的索赔数额是否有显著变化,还得进行假设检验,而且这个问题不能用单边检验来回答。(4分)
(2)符号检验(5分)
设假设组:H 0:M =M 0=5064
H 1:M ≠M 0=5064
符号检验:因为n +=11,n-=3,所以k=min(n+,n-)=3
精确检验:二项分布b(14,0.5),
∑=-=3
0287
.0)2/1,14(n b ,双边p-值为0.0576,大于a=0.05,
所以在a水平下,样本数据还不足以拒绝零假设;但假若a=0.1,则样本数据可拒绝零假设。查二项分布表得a=0.05的临界值为(3,11),同样不足以拒绝零假设。
正态近似:(5分)
np=14/2=7,npq=14/4=3.5
z=(3+0.5-7)/5.3≈-1.87>Z a/2=-1.96
仍是在a=0.05的水平上无法拒绝零假设。说明两年的中位数变化不大。 (3)中位数95%的置信区间:(5064,21240)(8分)
7、一个监听装置收到如下的信号:0,1,0,1,1,1,0,0,1,1,0,0,0,0,1,1,1,1,1,1,1,1,1,0,1,0,0,1,1,1,0,1,0,1,0,1,0,0,0,0,0,0,0,0,1,0,1,1,0,0,1,1,1,0,1,0,1,0,0,0,1,0,0,1,0,1,0,1,0,0,0,0,0,0,0,0。能否说该信号是纯粹随机干扰?(10分)
解:建立假设组: H 0:信号是纯粹的随机干扰
H 1:信号不是纯粹的随机干扰(2分)
游程检验:因为n 1=42,n 2=34,r=37。(2分)根据正态近似公式得:
U=33.18)
13442()3442()
344234422(3442258.3813442344222
≈-++--⨯⨯⨯⨯=≈++⨯⨯σ (2分)086.033
.1858
.3837-≈-=
Z (2分)
取显著性水平a=0.05,则Za/2=-1.96,故接受零假设,可以认为信号是纯粹的随机干扰的。(2分)
第四章p91-94
1、在研究计算器是否影响学生手算能力的实验中,13个没有计算器的学生(A组)和10个拥有计算器的学生(B组)对一些计算题进行了手算测试.这两组学生得到正确答案的时间(分钟)分别如下:
A组:28, 20,20,27,3,29,25,19,16,24,29,16,29 B组:40,31, 25,29,30,25,16,30,39,25
能否说A组学生比B组学生算得更快?利用所学的检验来得出你的结论.(12分)
解、利用Wilcoxon 两个独立样本的秩和检验或Mann-Whitney U 检验法进行检验。建立假设组:H 0:两组学生的快慢一致;
H 1:A 组学生比B 组学生算得快。(2分) 两组数据混合排序(在B 组数据下划线):
3,16,16,16,19,20,20,24,25,25,25,25,27,28,29, 29, 29, 29,30, 30,31,39,40(2分)
A 组秩和R A =1+3*2+5+6.5*2+8+10.5+13+14+16.5*3=120;
B 组秩和R B =3+10.5*3+16.5+19.5*2+21+22+23=156(2分) A 组逆转数和U A =120-(13*14)/2=29
B 组逆转数和U B =156-(10*11)/2=101(2分)
当n A =13,n B =10时,样本量较大,超出了附表的范围,不能查表得Mann-Whitney 秩和检验的临界值,所以用正态近似。计算
2326
.21245
.1636
260
36
12
/)11013(*10*132/10*132912/)1(2/-≈-≈
-=
++-=
++-=B A B A B A A n n n n n n U Z (2分)
当显著性水平a 取0.05时,正态分布的临界值Z a/2=-1.96(1分) 由于Z 4、在比较两种工艺(A和B)所生产的产品性能时,利用超负荷破坏性实验。记下损坏前延迟的时间名次(数目越大越耐久)如下: 方法:A B B A B A B A A B A A A B A B A A A A 序: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 用Mann-Whitney 秩和检验判断A工艺是否比B工艺在提高耐用性方面更优良?(10分) 解、设假设组:H 0:两种工艺在提高耐用性方面的优良性一致; H 1:A 工艺比B 工艺更优良(1分,假设也可用符号表达式)