非参数统计部分课后习题参考答案

合集下载

非参数统计部分课后习题参考答案

非参数统计部分课后习题参考答案

课后习题参考答案第一章p23-252、(2)有两组学生,第一组八名学生的成绩分别为x 1:100,99,99,100,99,100,99,99;第二组三名学生的成绩分别为x 2:75,87,60。

我们对这两组数据作同样水平a=0.05的t检验(假设总体均值为u ):H 0:u=100 H 1:u<100。

第一组数据的检验结果为:df=7,t 值为3.4157,单边p 值为0.0056,结论为“拒绝H 0:u=100。

”(注意:该组均值为99.3750);第二组数据的检验结果为:df=2,t 值为3.3290,单边p值为0.0398;结论为“接受H 0:u=100。

”(注意:该组均值为74.000)。

你认为该问题的结论合理吗?说出你的理由,并提出该如何解决这一类问题。

答:这个结论不合理(6分)。

因为,第一组数据的结论是由于p-值太小拒绝零假设,这时可能犯第一类错误的概率较小,且我们容易把握;而第二组数据虽不能拒绝零假设,但要做出“在水平a时,接受零假设”的说法时,还必须涉及到犯第二类错误的概率。

(4分)然而,在实践中,犯第二类错误的概率多不易得到,这时说接受零假设就容易产生误导。

实际上不能拒绝零假设的原因很多,可能是证据不足(样本数据太少),也可能是检验效率低,换一个更有效的检验之后就可以拒绝了,当然也可能是零假设本身就是对的。

本题第二组数据明显是由于证据不足,所以解决的方法只有增大样本容量。

(4分)第三章p68-713、在某保险种类中,一次关于1998年的索赔数额(单位:元)的随机抽样为(按升幂排列): 4632,4728,5052,5064,5484,6972,7596,9480,14760,15012,18720,21240,22836,52788,67200。

已知1997年的索赔数额的中位数为5064元。

(1)是否1998年索赔的中位数比前一年有所变化?能否用单边检验来回答这个问题?(4分) (2)利用符号检验来回答(1)的问题(利用精确的和正态近似两种方法)。

非参数统计王星版第一章课后答案

非参数统计王星版第一章课后答案

非参数统计‎第一章课后‎答案#‎1.1A‎G E=c(‎18,23‎,22,2‎1,20,‎19,20‎,20,2‎0)f‎i rst3‎=sort‎(AGE)‎[(len‎g th(A‎G E)-2‎):len‎g th(A‎G E)]‎dele‎t e.1=‎o rder‎(AGE)‎[(len‎g th(A‎G E)-2‎):len‎g th(A‎G E)]‎e xcep‎t=AGE‎[-del‎e te.1‎]c(‎e xcep‎t[1:2‎],19,‎e xcep‎t[3:l‎e ngth‎(exce‎p t)])‎exc‎e pt[2‎]=22‎#1.2‎a1=r‎e p(1:‎3,rep‎(2,3)‎)a2=‎c(1,8‎,10,1‎1)a3‎=seq(‎1,30,‎l engt‎h(a2)‎)a4=‎s eq(1‎,5,2)‎a4=c‎(a1,a‎4,rep‎(0,2)‎)a5=‎2:10‎a6=c(‎a2,a3‎[-(1:‎3)],a‎4)a7‎=c(re‎p(1,1‎0),re‎p(0,8‎))#1‎.3li‎b rary‎(MASS‎)dat‎a(gey‎s er)‎a=gey‎s era‎1=sub‎s et(a‎,wait‎i ng<7‎0)a1‎=geys‎e r[ge‎y ser$‎w aiti‎n g<70‎,]#两个‎a1等价‎a2=su‎b set(‎a,wai‎t ing<‎70&wa‎i ting‎!=57)‎a2=g‎e yser‎[geys‎e r$wa‎i ting‎<70&g‎e yser‎$wait‎i ng!=‎57,]#‎两个a2等‎价a3=‎s ubse‎t(a,w‎a itin‎g<70,‎c(dur‎a tion‎))a4‎=subs‎e t(a,‎d urat‎i on>7‎0,c(w‎a itin‎g))#‎1.3l‎i brar‎y(MAS‎S)a=‎g eyse‎ratt‎a ch(a‎)b1=‎w aiti‎n g[wa‎i ting‎<70]‎b2=wa‎i ting‎[wait‎i ng<7‎0&wai‎t ing!‎=57]‎b3=du‎r atio‎n[wai‎t ing<‎70]b‎4=wai‎t ing[‎d urat‎i on>7‎0]#1‎.4x=‎c(0,1‎,1,2,‎3,4)‎n um=f‎u ncti‎o n(x)‎{r=0‎p=c(‎r ep(0‎,leng‎t h(x)‎-1))‎q=c(r‎e p(0,‎l engt‎h(x)-‎1))f‎o r(i ‎i n 1:‎(leng‎t h(x)‎-1))‎{‎f or(j‎in (‎i+1):‎l engt‎h(x))‎{‎p[i]‎=p[i]‎+I(x[‎i]<x[‎j])‎ q[‎i]=q[‎i]+I(‎x[i]>‎x[j])‎} ‎r=‎r+p[i‎]-q[i‎]}r‎}h‎=rep(‎0,100‎0)fo‎r(i i‎n 1:l‎e ngth‎(h)){‎x=‎r unif‎(5,-5‎,5)‎h[i]‎=num(‎x)}‎y=as.‎f acto‎r(h)‎y y=le‎v els(‎y)a‎=rep(‎0,11)‎#记数记‎录-10:‎10:2各‎种结果出现‎的次数p‎=rep(‎0,11)‎for(‎i in ‎1:11)‎{a‎[i]=s‎u m(h=‎=(-12‎+2*i)‎)p‎[i]=a‎[i]/l‎e ngth‎(h)}‎ap‎h ist(‎h)‎h=rep‎(0,10‎000)‎f or(i‎in 1‎:leng‎t h(h)‎){‎x=sam‎p le(1‎:5,5,‎r epla‎c e=T)‎#-5到5‎中间的整数‎随机抽样‎ h[i‎]=num‎(x)}‎y=as‎.fact‎o r(h)‎yy=l‎e vels‎(y)‎a=rep‎(0,le‎n gth(‎y y))#‎记数记录‎-10:1‎0各种结果‎出现的次数‎p=re‎p(0,l‎e ngth‎(yy))‎for(‎i in ‎1:len‎g th(y‎y)){‎ a[i‎]=sum‎(h==(‎-11+i‎))‎p[i]=‎a[i]/‎l engt‎h(h)‎}ap‎hist‎(h)‎#当随机‎取1000‎0次的一个‎结果 a‎=[71 ‎321 7‎74 12‎55 16‎37 18‎25 16‎84 12‎56 74‎3 338‎96] ‎# p=[‎0.007‎1 0.0‎321 0‎.0774‎0.12‎55 0.‎1637 ‎0.182‎5 0.1‎684 0‎.1256‎0.07‎43 0.‎0338 ‎0.009‎6] #当‎随机取十万‎次数据的一‎个结果#‎a=[79‎5 34‎21 7‎553 1‎2521 ‎16771‎1818‎0 165‎38 12‎553 ‎7418 ‎3400‎ 85‎0]#p‎=[0.0‎0795 ‎0.034‎21 0.‎07553‎0.12‎521 0‎.1677‎1 0.1‎8180 ‎0.165‎38 0.‎12553‎0.07‎4180‎.0340‎0 0.0‎0850]‎#‎1.5u‎n iroo‎t(f=f‎u ncti‎o n(x)‎2*x^‎3-4*x‎^2+3*‎x-6, ‎i nter‎v al=c‎(-10,‎10))‎f=fun‎c tion‎(x){2‎*x^3-‎4*x^2‎+3*x-‎6}f(‎0)a=‎-10b‎=10r‎o ot=f‎u ncti‎o n(a,‎b){ ‎‎c=(a+‎b)/2;‎‎w hile‎(abs(‎f(c))‎>0.00‎001){‎‎ i‎f(f(c‎)*f(a‎)<0){‎b=c; ‎c=(a+‎b)/2;‎}‎‎e lse ‎{a=c;‎c=(a‎+b)/2‎;}}‎ c‎#1.6‎x=se‎q(0,2‎*pi,0‎.2)y‎=sin(‎x)/(c‎o s(x)‎+x)‎#1.7‎c hart‎o num=‎f unct‎i on(x‎){‎a=c("‎a bcde‎f ghij‎k lmno‎p qrst‎u vwxy‎z ABCD‎E FGHI‎J KLMN‎O PQRS‎T UVWX‎Y Z");‎b=‎s trsp‎l it(a‎,"");‎fo‎r(i i‎n 1:5‎2){‎ if‎(b[[1‎]][i]‎==x){‎t=i;i‎=i+1}‎‎e lse{‎i=i+1‎}}‎t‎}#将字符‎转化为数字‎,小写为前‎26位,大‎写为后26‎位,输入为‎单个字符‎f7=fu‎n ctio‎n(x){‎y=‎s trsp‎l it(x‎,"");‎#将输入分‎为单个字符‎‎f or(i‎in 1‎:leng‎t h(y[‎[1]])‎){‎ t‎=char‎t onum‎(y[[1‎]][i]‎)‎ if‎(t<14‎){t=t‎+13;y‎[[1]]‎[i]=L‎E TTER‎S[t];‎}‎ el‎s e if‎(t>=1‎4&t<=‎26){t‎=t-13‎;y[[1‎]][i]‎=LETT‎E RS[t‎];}‎‎e lse ‎i f(t>‎=27&t‎<=39)‎{t=t+‎13-26‎;y[[1‎]][i]‎=lett‎e rs[t‎];}‎‎e lse{‎t=t-1‎3-26;‎y[[1]‎][i]=‎l ette‎r s[t]‎;}‎ }‎mima‎=y;‎mima‎}#‎1.8f‎1.81=‎f unct‎i on(a‎){‎ for‎(i in‎1:le‎n gth(‎a))‎ {c‎[i]=a‎[leng‎t h(a)‎-i+1]‎}c‎}‎f1.‎82=fu‎n ctio‎n(a,b‎){‎f or(i‎in 1‎:(len‎g th(a‎)+len‎g th(b‎))){‎ i‎f(i%%‎2==1)‎{c[i]‎=a[(i‎+1)/2‎];}‎ el‎s e{c[‎i]=b[‎i/2];‎}}‎c‎}#%%为‎求余符号‎#1.9‎f1.9=‎f unct‎i on(n‎,m){‎ a=r‎e p(1,‎n);‎i=1;‎k=‎0;‎t=1;‎ whi‎l e(su‎m(a)>‎1|a[t‎]==0)‎{‎t=i%‎%n;‎ if‎(t==0‎){t=n‎;}‎ els‎e{t=i‎%%n}‎ i‎f(a[t‎]!=0)‎{‎ k=‎k+1;i‎=i+1;‎}‎else‎{i=i+‎1}‎ i‎f(k%%‎m==0)‎{k=0;‎a[t]=‎0;}‎}‎t}#‎1.10‎s tude‎n t<-r‎e ad.t‎a ble(‎"C:\\‎D ocum‎e nts ‎a nd S‎e ttin‎g s\\A‎d mini‎s trat‎o r\\桌‎面\\非参‎数统计配套‎数据\\各‎章数据\\‎第一章\\‎s tude‎n t.tx‎t",he‎a der ‎‎‎‎ = ‎T)s‎t uden‎t1=as‎.data‎.fram‎e(stu‎d ent)‎mea‎n s=ap‎p ly(s‎t uden‎t1[,2‎:6],1‎,mean‎)b1=‎d ata.‎f rame‎(stud‎e nt1,‎m eans‎)b2‎=stud‎e nt1[‎w hich‎(b==m‎a x(b)‎),]‎b3=I(‎s tude‎n t1[,‎2:6]<‎60)#判‎断每个学生‎每门课程是‎否及格b‎4=app‎l y(b3‎,1,su‎m)#找出‎每个学生有‎几门课程不‎及格b5‎=b1[w‎h ich(‎b4>1)‎,]b6‎=b1[-‎w hich‎(b4>1‎),]‎t.te‎s t(b5‎$mean‎s,b6$‎m eans‎)#不说‎明情况下认‎为两总体方‎差不同,特‎殊说明va‎r.equ‎a l=TR‎U E 置信‎区间为均值‎差的置信区‎间wil‎c ox.t‎e st(b‎5$mea‎n s,b6‎$mean‎s)wi‎l cox.‎t est(‎b5$me‎a ns,b‎6$mea‎n s,pa‎i res=‎F ALSE‎)#1.‎11ba‎s ket<‎-read‎.tabl‎e("C:‎\\Doc‎u ment‎s and‎Sett‎i ngs\‎\Admi‎n istr‎a tor\‎\桌面\\‎非参数统计‎配套数据\‎\各章数据‎\\第一章‎\\bas‎k et.t‎x t",h‎e ader‎‎‎‎‎ = T‎)A=‎I(bas‎k et[,‎2:6]=‎='A')‎A=ba‎s ket[‎,2:6]‎=='A'‎Asum‎=appl‎y(A,1‎,sum)‎B=ba‎s ket[‎,2:6]‎=='B'‎Bsum‎=appl‎y(B,1‎,sum)‎a1=b‎a sket‎[whic‎h(Asu‎m>0&B‎s um>0‎),1]‎l engt‎h(a1)‎#求个数‎a2=ba‎s ket[‎w hich‎(Asum‎>0&Bs‎u m>=3‎),]l‎e ngth‎(a2$I‎D)#求个‎数#1.‎12x=‎s eq(-‎10,10‎,0.05‎)y1=‎s in(x‎)y2=‎c os(x‎)y3=‎y1+y2‎plot‎(x,y1‎,col=‎1,lty‎=1,ax‎e s=T,‎m ain=‎"习题1.‎12",s‎u b="s‎i n(),‎c os()‎,sin(‎)+cos‎()对比图‎")po‎i nts(‎x,y2,‎c ol=2‎,lty=‎3)po‎i nts(‎x,y3,‎c ol=3‎,lty=‎4)p‎l ot(x‎,y1,c‎o l=1,‎l ty=1‎,main‎="习题1‎.12",‎s ub="‎s in()‎,cos(‎),sin‎()+co‎s()对比‎图")l‎i nes(‎x,y1,‎c ol=1‎,lty=‎1)li‎n es(x‎,y2,c‎o l=2,‎l ty=3‎)lin‎e s(x,‎y3,co‎l=3,l‎t y=4)‎cur‎v e(si‎n(x),‎-10,1‎0,col‎=1,lt‎y=1,m‎a in="‎习题1.1‎2",su‎b="si‎n(),c‎o s(),‎s in()‎+cos(‎)对比图"‎)cur‎v e(co‎s(x),‎a dd=T‎R UE,c‎o l=2,‎l ty=3‎)cur‎v e(si‎n(x)+‎c os(x‎),add‎=TRUE‎,col=‎3,lty‎=4)#‎1.13‎x=seq‎(-5,5‎,leng‎t h=50‎)a=r‎u nif(‎500,-‎5,5)‎y=0.1‎*a*si‎n(2*a‎)f1=‎f unct‎i on(x‎,y){1‎-exp(‎-1/x^‎2+y^2‎)}z1‎=oute‎r(x/2‎,x/2,‎f1)p‎e rsp(‎z1)‎f2=fu‎n ctio‎n(x,y‎){0.1‎*x*si‎n(2*y‎)}z2‎=oute‎r(x,x‎,f2)‎p ersp‎(z2)‎f3=f‎u ncti‎o n(x,‎y){si‎n(x)+‎c os(x‎)}z3‎=oute‎r(x,x‎,f3)‎p ersp‎(z3)‎plot‎(sin(‎3*x),‎s in(6‎*x),t‎y pe="‎l")‎#1.14‎a=rn‎o rm(1‎00,3,‎s qrt(‎5))b‎=rnor‎m(20,‎5,sqr‎t(3))‎c=c(‎a,b)‎h ist(‎c)bo‎x plot‎(c)q‎q norm‎(c)#‎1.15‎x=rno‎r m(10‎0,0,1‎)y1=‎l og(a‎b s(x)‎)#lam‎d a=0‎h ist(‎y1)q‎q norm‎(y1)‎q qlin‎e(y1,‎col ‎= 2)‎y2=(x‎-1)#l‎a mda=‎1his‎t(y2)‎qqno‎r m(y2‎)qql‎i ne(y‎2, co‎l = 3‎)y3=‎1-1/x‎#lamd‎a=-1‎h ist(‎y3)q‎q norm‎(y3)‎q qlin‎e(y2,‎col ‎= 4)‎‎。

非参数统计部分课后习题参考答案

非参数统计部分课后习题参考答案

课后习题参考答案第一章p23-252、(2)有两组学生,第一组八名学生的成绩分别为x 1:100,99,99,100,99,100,99,99;第二组三名学生的成绩分别为x 2:75,87,60。

我们对这两组数据作同样水平a=0.05的t检验(假设总体均值为u ):H 0:u=100 H 1:u<100。

第一组数据的检验结果为:df=7,t 值为3.4157,单边p 值为0.0056,结论为“拒绝H 0:u=100。

”(注意:该组均值为99.3750);第二组数据的检验结果为:df=2,t 值为3.3290,单边p值为0.0398;结论为“接受H 0:u=100。

”(注意:该组均值为74.000)。

你认为该问题的结论合理吗?说出你的理由,并提出该如何解决这一类问题。

答:这个结论不合理(6分)。

因为,第一组数据的结论是由于p-值太小拒绝零假设,这时可能犯第一类错误的概率较小,且我们容易把握;而第二组数据虽不能拒绝零假设,但要做出“在水平a时,接受零假设”的说法时,还必须涉及到犯第二类错误的概率。

(4分)然而,在实践中,犯第二类错误的概率多不易得到,这时说接受零假设就容易产生误导。

实际上不能拒绝零假设的原因很多,可能是证据不足(样本数据太少),也可能是检验效率低,换一个更有效的检验之后就可以拒绝了,当然也可能是零假设本身就是对的。

本题第二组数据明显是由于证据不足,所以解决的方法只有增大样本容量。

(4分)第三章p68-713、在某保险种类中,一次关于1998年的索赔数额(单位:元)的随机抽样为(按升幂排列): 4632,4728,5052,5064,5484,6972,7596,9480,14760,15012,18720,21240,22836,52788,67200。

已知1997年的索赔数额的中位数为5064元。

(1)是否1998年索赔的中位数比前一年有所变化?能否用单边检验来回答这个问题?(4分) (2)利用符号检验来回答(1)的问题(利用精确的和正态近似两种方法)。

非参数统计答案范文

非参数统计答案范文

非参数统计答案范文1. 考察Mann-Whitney U检验:问题:对两组数据进行比较,数据不符合正态分布,要判断两组数据是否有显著差异。

如何选择合适的非参数检验方法?答案:Mann-Whitney U检验是一种适用于比较两组独立样本的非参数检验方法,适用于数据不符合正态分布的情况。

2. 考察Wilcoxon符号秩和检验:问题:对同一组数据进行配对比较,数据不符合正态分布,如何选择合适的非参数检验方法?答案:Wilcoxon符号秩和检验是一种适用于配对样本的非参数检验方法,适用于数据不符合正态分布的情况。

3. 考察Kruskal-Wallis检验:问题:有三组数据需要比较,但数据不符合正态分布,如何选择合适的非参数检验方法?答案:Kruskal-Wallis检验是一种适用于比较多组独立样本的非参数检验方法,适用于数据不符合正态分布的情况。

4. 考察Friedman检验:问题:有三组配对数据需要比较,但数据不符合正态分布,如何选择合适的非参数检验方法?答案:Friedman检验是一种适用于比较多组配对样本的非参数检验方法,适用于数据不符合正态分布的情况。

5. 考察Mood's中位数差异检验:问题:有两组独立样本数据需要比较,数据不符合正态分布,如何选择合适的非参数检验方法?答案:Mood's中位数差异检验是一种适用于比较两组独立样本的非参数检验方法,适用于数据不符合正态分布的情况。

6.考察符号检验:问题:对一组配对数据进行比较,但数据不符合正态分布,如何选择合适的非参数检验方法?答案:符号检验是一种适用于配对样本的非参数检验方法,适用于数据不符合正态分布的情况。

7.考察秩和检验:问题:有两组独立样本数据需要比较,如何选择合适的非参数检验方法?答案:秩和检验是一种适用于比较两组独立样本的非参数检验方法。

8. 考察Kolmogorov-Smirnov检验:问题:有一组数据需要验证其服从一些特定分布,如何进行检验?答案:Kolmogorov-Smirnov检验是一种非参数检验方法,可以用于验证数据是否符合一些特定分布。

王静龙《非参数统计分析》课后计算题参考答案汇编

王静龙《非参数统计分析》课后计算题参考答案汇编

学习-----好资料更多精品文档王静龙《非参数统计分析》课后习题计算题参考答案习题一1.One Sample t-test for a MeanSample Statistics for xN Mean Std. Dev. Std. Error-------------------------------------------------26 1.38 8.20 1.61 Hypothesis TestNull hypothesis: Mean of x = 0Alternative: Mean of x ^= 0t Statistic Df Prob > t---------------------------------0.861 25 0.397695 % Confidence Interval for the MeanLower Limit: -1.93Upper Limit: 4.70则接受原假设认为一样习题二1.描述性统计更多精品文档习题三1.1{}+01=1339:6500:650013=BINOMDIST(13,39,0.5,1)=0.026625957S n H me H me P S +==<≤另外:在excel2010中有公式 BINOM.INV(n,p,a) 返回一个数值,它使得累计二项式分布的函数值大于或等于临界值a 的最小整数***0*0+1inf :2BINOM.INV(39,0.5,0.05)=141sup :1132S 1313n m i n d i n m m i n d d m i d αα==⎧⎫⎛⎫⎪⎪⎛⎫=≥⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫≤=-=⎨⎬ ⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭=≤=∑∑= 以上两种都拒绝原假设,即中位数低于65001.2学习-----好资料更多精品文档****01426201inf :221inf :122BINOM.INV(40,0.5,1-0.025)=26d=n-c=40-26=14580064006200nn i c n m i n c c i n m m i x x me x αα==⎧⎫⎛⎫⎪⎪⎛⎫=≤⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫=≥-⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭====∑∑2.{}+01=4070:6500:65002402*(1-BINOMDIST(39,70,0.5,1))=0.281978922S n H me H me P S +==≠≥=则接受原假设,即房价中位数是65003.1{}+01=15521552527207911::22n 1552=5.33E-112S n H p H p P S φ+=+==>≥≈比较大,则用正态分布近似**+**0:=1552155252720791inf :221inf :122m=BINOM.INV(2079,0.5,0.975)=1084nn i c n m i S n n c c i n m m i αα===+=⎧⎫⎛⎫⎪⎪⎛⎫=≤⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫=≥-⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭∑∑另外则拒绝原假设,即相信孩子会过得更好的人多3.2P 为认为生活更好的成年人的比例,则学习-----好资料更多精品文档1522=0.7465132079p 的比估计是:4.{}00.90610.90618154157860:65:6510.9060.094~(,)181541BINOMDIST(18153,157860,0.094,1)=0S n H P H P p S b n p P S +++===>=-=≥=-因为0〈0.05则拒绝原假设习题四1.()()++0.025+W =6+8+10+1+4+12+9+11+2+7=70p 2P W 70n=12c =65p 2P W 65=0.05≥≥符号秩和检验统计量:值为,当得所以值小于即拒绝原假设2.学习-----好资料更多精品文档()()++0.025+W =2.5+2.5+7+7+7+7+10.5+14+14+14+14+14+17.5+17.5+19+20+23+24=234.5p 2P W 234.5n=25 c =236p 2P W 236=0.05≥≥符号秩和检验统计量:值为,当得所以值小于即接受原假设{}011826:0:02182*(1-BINOMDIST(17,25,0.5,1))=0.043285251S n H me H me P S +===≠≥=+符号检验:则拒绝原假设学习-----好资料更多精品文档t t =0.861df=25 p=0.3976检验:统计量接受原假设3.(1)+0.0250.0250.025++=5+2+2=9833(1)322(3)0.052(9)0.05W n c n n d c P W P W ==+=-=≤=≤>查表可得:则 接受原假设Walsh 平均由小到大排列:50 55 60 65 65 70 70 70 75 75 75 80 80 80 80 80 80 80 85 85 85 8585 90 90 90 90 90 90 95 95 95 95 95 95 100 100 100 100 100 100 100 105 105学习-----好资料 更多精品文档105 105 105 110 110 110 110 110 115 115 120N=55 则对称中心为()()^281/290N W W θ+===()()1/1/1/40.527.50.5 1.967.771011461/40.527.50.5 1.9647.22898853d n n U c n n U αα--=+--=--==+++=++=因为c 不是整数,则^+1k d L k k w w θ()()介于与之间,其中表示比大的最小整数即为8 ^L θ为70与75之间,即为72.5 []-%72.5,105H L 则的点估计为90 95的区间估计为习题五1.171(,24,25,50)0.005060988i p P i p ===∑值很小,则拒绝原假设即认为女职工的收入比男职工的低。

非参数统计题目及答案

非参数统计题目及答案

1.人们在研究肺病患者的生理性质时发现,患者的肺活量与他早在儿童时期是否接受过某种治疗有关,观察3组病人,第一组早在儿童时期接受过肺部辐射,第二组接受过胸外科手术,第三组没有治疗过,现观察到其肺活量占其正常值的百分比如下:这一经验是否可靠。

解:H 0:θ2≤θ1≤θ3 H 1:至少有一个不等式成立可得到 N=15由统计量H=)112+N N (∑=Ki i N R 1i 2-3(N+1)=)(1151512+(32×6.4+29×5.8+59×11.8)-3×(15+1)=5.46查表(5,5,5)在P(H ≥4.56)=0.100 P(H ≥5.66)=0.0509 即P (H ≥5.46)﹥0.05 故取α=0.05, P ﹥α ,故接受零假设即这一检验可靠。

2.关于生产计算机公司在一年中的生产力的改进(度量为从0到100)与它们在过去三年中在智力投资(度量为:低,中等,高)之间的关系的研究结果列在下表中:值等等及你的结果。

(利用Jonkheere-Terpstra 检验) 解:H 0:M 低=M 中=M 高 H 1:M 低﹤M 中﹤M 高U 12=0+9+2+8+10+9+10+2+10+10+8+0.5+3=82.5 U 13=10×8=80U 23=12+9+12+12+12+11+12+11=89 J=∑≤jijUi =82.5+80+89=251.5大样本近似 Z=[]72)32()324121i 222∑∑==+-+--ki i i ki n n N N n N J ()(~N (0,1)求得 Z=3.956 Ф(3.956)=0.9451取α=0.05 , P >α,故接受原假设,认为智力投资对改进生产力有帮助。

非参数统计·王星_第二章课后习题答案

非参数统计·王星_第二章课后习题答案

非参数统计 第 次作业第二章习题 2.1 解:(1)0110001000H :h H :h μ≥↔μ<建立的猜想应该与样本表现一致。

换句话说,正是样本表现使我们对总体的均值产生怀疑,进而才有了假设检验。

因此,0H 是我们就与样本想要推翻的假设,所以才要检验。

(2)由上一问,这样的假设脱离样本,样本呈现出落后于旧过程的情形,而非要用一种优于旧过程的假设,这样的假设是毫无意义的,也并不会带来好的结果。

2.2 解:(1)有问题。

假设检验在原假设条件成立下,得到拒绝域1645x .>,意思是拒绝0θ=,接受0θ≠。

而1000θ=只是其中的一种情况,故不能接受1000θ=。

改进方法:可直接提出假设对均值为1000进行检验。

即0110001000H :H :θ=↔θ≠(2)不合理。

样本2的样本量太小,不具备代表性,用其进行假设检验风险太大。

改进方法:若样本来自同一总体,独立观察,且需要对总体样本均值做出判断,可将两样本合并后再进行假设检验;若样本来自两个总体,需对两总体的均值做出比较,可取(12x x ---)作为检验统计量进行检验。

(3)t -=x -为样本均值,μ为总体均值,s 为样本标准差 01p Pr(t(n )t )=-≤,其中0t -=p 值是拒绝原假设0H 的最小显著水平。

若p α≥,则拒绝0H ;反之,接受0H(4)对总体均值进行双侧检验:00012112211111-H :|t(n )t (n )|(x t (n t (n α---αα--μ=μ↔μ≠μ⎧⎫->-⎨⎬⎩⎭α--+-拒绝域:故,置信区间为:(5)双侧检验:00101211221122''H :H :|u |u u u [x u ,x u α--αα----αα--μ=μ↔μ≠μ⎧⎫≥⎨⎬⎩⎭≤≤-+拒绝域:故置信区间为:- 当样本量很大时,依然可以用上法:222212211111_n i i _s (x x )[n(x (x ))]n n n [(x (x ))]n --=-=-=---=--∑由矩估计的相合性可知,2_x 是2E(x )的相合估计,2(x )-是2E(x )的相合估计 故2s 是2δ的相合估计。

非参数统计分析第六章课后答案

非参数统计分析第六章课后答案

非参数统计分析第六章课后答案问题1:设有10个教师分别在两个学校中进行教学,分别记录了每位教师每日的教学小时数。

假设这两个学校的教学小时数分布不符合正态分布。

现在我们想要比较这两个学校的教学小时数平均值是否相等。

解答:对于这个问题,我们可以使用非参数统计方法-秩和检验。

首先将每个教师的教学小时数按照从小到大的顺序排列,并为每个小时数分配一个序号,即用秩来代替实际的数值。

然后根据两个学校的秩之和来进行比较。

步骤如下:1.将每个学校的教学小时数按照从小到大的顺序排列,并为每个小时数分配一个序号(秩)。

2.计算两个学校的秩和,并求出差值。

3.利用秩和差值来估计两个学校教学小时数平均值的差异性。

4.根据差异性的大小,进行假设检验,判断两个学校的教学小时数平均值是否相等。

问题2:某农场试验了两种肥料对苹果树生长的影响。

为此,从两个农场中随机选择了64棵苹果树,并给予不同的肥料进行处理。

试比较两种处理的效果是否相同。

解答:对于这个问题,我们可以使用非参数统计方法-符号检验。

符号检验是一种用于比较两个相关样本的方法,适用于样本量较小或者数据不符合正态分布的情况。

步骤如下:1.对于每棵苹果树,比较两种处理对树的生长效果,根据生长情况给予正或负的符号。

2.统计正负符号的个数,得到两种处理的得分。

3.根据得分判断两种处理的效果是否相同:如果得分大致相等,则说明两种处理的效果相同;如果得分明显偏向一种处理,则说明两种处理的效果不同。

问题3:某个城市公交车站每小时通过的乘客数量分别为:20、18、14、26、22、24、16、12、16、20。

我们想要推断乘客数量的中位数。

解答:对于这个问题,我们可以使用非参数统计方法-中位数检验。

中位数是一种非参数的统计量,它不受极端值的影响,适用于数据分布不符合正态分布的情况。

步骤如下:1.将数据按照从小到大的顺序排列。

2.根据数据的个数,找出中间位置的数值,即中位数的位置。

3.如果数据个数为奇数,则中位数即为中间位置的数值;如果数据个数为偶数,则计算中间位置两个数值的平均值作为中位数。

非参数统计(R软件)参考答案

非参数统计(R软件)参考答案

⾮参数统计(R软件)参考答案内容:A.3, A.10, A.12A.3 上机实践:将MASS数据包⽤命令library(MASS)加载到R中,调⽤⾃带“⽼忠实”喷泉数据集geyer,它有两个变量:等待时间waiting和喷涌时间duration,其中…(1) 将等待时间70min以下的数据挑选出来;(2) 将等待时间70min以下,且等待时间不等于57min的数据挑选出来;(3) 将等待时间70min以下喷泉的喷涌时间挑选出来;(4) 将喷涌时间⼤于70min喷泉的等待时间挑选出来。

解:读取数据的R命令:library(MASS);#加载MASS包data(geyser);#加载数据集geyserattach(geyser);#将数据集geyser的变量置为内存变量(1) 依题意编定R程序如下:sub1geyser=geyser[which(waiting<70),1];#提取满⾜条件(waiting<70)的数据,which(),读取下标sub1geyser[1:5];#显⽰⼦数据集sub1geyser的前5⾏[1] 57 60 56 50 54(2) 依题意编定R程序如下:Sub2geyser=geyser[which((waiting<70)&(waiting!=57)),1];#提取满⾜条件(waiting<70& (waiting!=57)的数据.Sub2geyser[1:5];#显⽰⼦数据集sub1geyser的前5⾏[1] 60 56 50 54 60 ……原数据集的第1列为waiting喷涌时间,所以⽤[which(waiting<70),2](3)Sub3geyser=geyser[which(waiting<70),2];#提取满⾜条件(waiting<70)的数据,which(),读取下标Sub3geyser[1:5];#显⽰⼦数据集sub1geyser的前5⾏[1] 4.000000 4.383333 4.833333 5.450000 4.866667……原数据集的第2列为喷涌时间,所以⽤[which(waiting<70),2](4)Sub4geyser=geyser[which(waiting>70),1];#提取满⾜条件(waiting<70)的数据,which(),读取下标Sub4geyser[1:5];#显⽰⼦数据集sub1geyser的前5⾏[1] 80 71 80 75 77…….A.10如光盘⽂件student.txt中的数据,⼀个班有30名学⽣,每名学⽣有5门课程的成绩,编写函数实现下述要求:(1) 以data.frame的格式保存上述数据;(2) 计算每个学⽣各科平均分,并将该数据加⼊(1)数据集的最后⼀列;(3) 找出各科平均分的最⾼分所对应的学⽣和他所修课程的成绩;(4) 找出⾄少两门课程不及格的学⽣,输出他们的全部成绩和平均成绩;(5) ⽐较具有(4)特点学⽣的各科平均分与其余学⽣平均分之间是否存在差异。

最新第四版非参数统计第四章课后习题答案

最新第四版非参数统计第四章课后习题答案

第4章-3.一项关于销售茶叶的研究报告说明销售方式可能和售出率有关,三种方式为:在商店内等待,在门口销售和当面表演炒制茶叶,对一组商店在一段时间的调查结果列在下表中(单位为购买者人数)。

销售方式购买率(%)商店内等待20 25 29 18 17 22 18 20 门口销售26 23 15 30 26 32 28 27 表演炒制53 47 48 43 52 57 49 56 利用检验回答下面的问题,是否购买率不同?存在单调趋势吗?如果只分成表演炒制和不表演炒制两种,结论又如何?N i: 8 8 8R i: 50 86 164R: 6.25 10.75 20.5iK-W检验即拒绝零假设。

J-T检验U12=7+6+0+8+7+8+7+7=50U13=64U23=64J=50+64+64=178n较大Ф(0.2295)=2.413>0.05拒绝零假设初中物理知识点复习填空第一章声现象复习一、基础过关1.声音是由物体的产生的,一切发声的物体都在,振动,发生才停止。

2.声音是以的形式在中传播,气体、液体和都可以传播声音,声音在中传播的最慢,15℃的空气中声音的传播速度是,但不能传播声音。

3.声音通过头骨、颌骨也能传到听觉神经,引起听觉。

声音的这种传导方式叫。

4.声音具有三个显著的特性,分别是、和。

其中,与振动的频率(每秒钟物体振动的次数)有关,且频率越大,越高;与物体振动的振幅有关,且振幅越大,越大,它还与距离发生体的有关;不同的发声体不同。

5.人耳的听觉频率是。

频率高于的声叫波,频率低于的声叫波,生活中用B超检查身体及胎儿的发育情况用的是波,地震、火山、台风、海啸及一些动物交流时用的是波。

6.物理学中,把发声体做____________振动时发出的声音叫做噪声;从环保的角度,凡是影响人们正常的、和的声音都是噪声,人们用为单位来表示声音强弱的等级,符号是。

7.对噪声的控制可以在三个阶段进行减弱,分别是在_________处减弱;在___________减弱;在____________减弱。

王静龙《非参数统计分析》课后计算题参考答案解析

王静龙《非参数统计分析》课后计算题参考答案解析

王静龙《非参数统计分析》课后习题计算题参考答案习题一1.One Sample t-test for a Mean Sample Statistics for xN Mean Std. Dev. Std. Error -------------------------------------------------26 1.38 8.20 1.61 Hypothesis TestNull hypothesis: Mean of x = 0 Alternative: Mean of x ^= 0t Statistic Df Prob > t --------------------------------- 0.861 25 0.397695 % Confidence Interval for the MeanLower Limit: -1.93 Upper Limit: 4.70则接受原假设认为一样习题二1.描述性统计习题三1.1{}+01=1339:6500:650013=BINOMDIST(13,39,0.5,1)=0.026625957S n H me H me P S +==<≤另外:在excel2010中有公式 BINOM.INV(n,p,a) 返回一个数值,它使得累计二项式分布的函数值大于或等于临界值a 的最小整数***0*0+1inf :2BINOM.INV(39,0.5,0.05)=141sup :1132S 1313n m i n d i n m m i n d d m i d αα==⎧⎫⎛⎫⎪⎪⎛⎫=≥⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫≤=-=⎨⎬ ⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭=≤=∑∑= 以上两种都拒绝原假设,即中位数低于65001.2****01426201inf :221inf :122BINOM.INV(40,0.5,1-0.025)=26d=n-c=40-26=14580064006200n ni c n m i n c c i n m m i x x me x αα==⎧⎫⎛⎫⎪⎪⎛⎫=≤⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫=≥-⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭====∑∑2.{}+01=4070:6500:65002402*(1-BINOMDIST(39,70,0.5,1))=0.281978922S n H me H me P S +==≠≥=则接受原假设,即房价中位数是65003.1{}+01=15521552527207911::22n 1552=5.33E-112S n H p H p P S φ+=+==>≥≈比较大,则用正态分布近似**+**0:=1552155252720791inf :221inf :122m=BINOM.INV(2079,0.5,0.975)=1084nn i c n m i S n n c c i n m m i αα===+=⎧⎫⎛⎫⎪⎪⎛⎫=≤⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫=≥-⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭∑∑另外则拒绝原假设,即相信孩子会过得更好的人多3.2P 为认为生活更好的成年人的比例,则1522=0.7465132079p 的比估计是:4.{}00.90610.90618154157860:65:6510.9060.094~(,)181541BINOMDIST(18153,157860,0.094,1)=0S n H P H P p S b n p P S +++===>=-=≥=-因为0〈0.05则拒绝原假设习题四1.()()++0.025+W =6+8+10+1+4+12+9+11+2+7=70p 2P W 70n=12c =65p 2P W 65=0.05≥≥符号秩和检验统计量:值为,当得所以值小于即拒绝原假设2.()()++0.025+W =2.5+2.5+7+7+7+7+10.5+14+14+14+14+14+17.5+17.5+19+20+23+24=234.5p 2P W 234.5n=25 c =236p 2P W 236=0.05≥≥符号秩和检验统计量:值为,当得所以值小于即接受原假设{}011826:0:02182*(1-BINOMDIST(17,25,0.5,1))=0.043285251S n H me H me P S +===≠≥=+符号检验:则拒绝原假设t t =0.861df=25 p=0.3976检验:统计量接受原假设3.(1)+0.0250.0250.025++=5+2+2=9833(1)322(3)0.052(9)0.05W n c n n d c P W P W ==+=-=≤=≤>查表可得:则 接受原假设Walsh 平均由小到大排列:50 55 60 65 65 70 70 70 75 75 75 80 80 80 80 80 80 80 85 85 85 8585 90 90 90 90 90 90 95 95 95 95 95 95 100 100 100 100 100 100 100 105 105N=55 则对称中心为()()^281/290N W W θ+===()()1/1/1/40.527.50.5 1.967.771011461/40.527.50.5 1.9647.22898853d n n U c n n U αα--=+--=--==+++=++=因为c 不是整数,则^+1k d L k k w w θ()()介于与之间,其中表示比大的最小整数即为8 ^L θ为70与75之间,即为72.5 []-%72.5,105H L 则的点估计为90 95的区间估计为习题五1.171(,24,25,50)0.005060988i p P i p ===∑值很小,则拒绝原假设即认为女职工的收入比男职工的低。

非参数统计第五版习题答案

非参数统计第五版习题答案

非参数统计第五版习题答案非参数统计第五版习题答案非参数统计是统计学中的一个重要分支,与参数统计相对应。

在参数统计中,我们通常假设总体的分布形式,并根据样本数据来估计参数的值。

而在非参数统计中,我们不对总体的分布形式做任何假设,直接利用样本数据进行统计推断。

非参数统计方法的优势在于它的灵活性和广泛适用性。

它不依赖于特定的分布假设,因此适用于各种类型的数据。

在实际应用中,非参数统计方法常常用于处理那些不满足正态分布假设的数据,或者样本容量较小的情况。

在《非参数统计第五版》这本书中,作者对非参数统计的理论和方法进行了详细的介绍,并提供了大量的习题供读者练习。

以下是一些习题的答案和解析,希望能够帮助读者更好地理解和掌握非参数统计方法。

1. 习题:某城市的居民年龄分布情况如下:20岁以下的人数为1000人,20-30岁的人数为2000人,30-40岁的人数为3000人,40岁以上的人数为4000人。

试问该城市的年龄分布是否符合均匀分布?答案:首先,我们需要建立原假设和备择假设。

原假设(H0)是该城市的年龄分布符合均匀分布,备择假设(H1)是该城市的年龄分布不符合均匀分布。

然后,我们可以使用卡方检验来进行假设检验。

根据题目给出的数据,我们可以计算出每个年龄段的期望频数。

对于均匀分布的假设,每个年龄段的期望频数应该是相等的。

接下来,我们计算卡方统计量,并根据自由度和显著性水平查找卡方分布表,找到对应的临界值。

如果计算得到的卡方统计量大于临界值,则拒绝原假设,认为该城市的年龄分布不符合均匀分布;如果计算得到的卡方统计量小于临界值,则接受原假设,认为该城市的年龄分布符合均匀分布。

2. 习题:某医院进行了一项药物疗效的研究,随机选取了100名患者,并对其进行了治疗。

疗效被分为三个等级:显著改善、部分改善和无改善。

试问该药物的疗效是否显著?答案:为了判断该药物的疗效是否显著,我们可以使用秩和检验。

秩和检验是一种非参数检验方法,适用于两组或多组样本的比较。

非参数统计答案

非参数统计答案

1.4 对一批电器元件,抽取24个做加速寿命实验,测得其寿命数据为(单位:h):575,778,880,969,984,1003,1008,1021,1031,1034,1053,1054,1226,1393,1493,1480,1513,1611,1612,1612,1624,1627,1631,1768,求这批元件寿命分布的中位数的置信水平为0.95的置信区间。

解:a<-function(x,p=0.5,conf.level=0.95){d<-(max(x)-min(x))/1e10xgrid<-c(x,x+d,x-d)value.in.ci<-rep(NA,length(xgrid))for(fff in 1:length(xgrid)){x1<-c(sum(x<xgrid[fff]),sum(x>xgrid[fff]));n<-sum(x1)value.in.ci[fff]<-binom.test(x1,n,p,alternative="two.sided",conf.level)$p.value>=1-conf.level}ci<-c(min(xgrid[value.in.ci]),max(xgrid[value.in.ci]))result<-as.data.frame(list(percentile=p,lower=ci[1],upper=ci[2]))class(result)<-"table"result}x<-c(575,778,880,969,984,1003,1008,1021,1031,1034,1053,1054,1226,1393,1439,1480,1513,161 1,1612,1612,1624,1627,1631,1768)a(x)percentile lower upper0.5 1008 1611例1.5.2 从某工厂的产品仓库中随机取16个零件,测得它们的长度(单位:cm)为:2.14,2.10,2.13,2.15,2.13,2.12,2.13,2.10,2.15,2.12,2.14,2.10,2.13,2.11,2.14,2.11,求该零件长度分布的中位数的置信区间为0.95的置信区间。

非参数统计分析习题四答案

非参数统计分析习题四答案

非参数统计分析习题四答案非参数统计分析习题四答案在统计学中,非参数统计方法是一种不依赖于总体分布形态的统计分析方法。

与参数统计方法相比,非参数方法更加灵活,适用范围更广。

本文将针对一些非参数统计分析习题提供详细的答案和解析。

1. 问题描述:某研究人员对一批新药进行了测试,得到了一组数据:[25, 30, 32, 28, 35, 27, 29, 31, 26, 34]。

现在需要对这组数据进行非参数的中位数检验,以验证该新药是否具有显著效果。

解答:中位数检验是一种常用的非参数检验方法,用于判断两个样本的中位数是否存在显著差异。

首先,我们需要对原始数据进行排序,得到:[25, 26, 27, 28, 29, 30, 31, 32, 34, 35]。

接下来,我们需要计算两组数据的中位数。

在这个例子中,我们只有一组数据,因此只需计算一次中位数。

根据数据的个数,中位数的计算方法有所不同。

当数据个数为奇数时,中位数即为排序后的中间值;当数据个数为偶数时,中位数为排序后的中间两个数的平均值。

根据以上方法,我们可以得到该组数据的中位数为29.5。

接下来,我们需要进行中位数检验。

中位数检验的零假设是两组数据的中位数相等,备择假设是两组数据的中位数不相等。

在这个例子中,我们只有一组数据,因此无法进行中位数检验。

2. 问题描述:某超市对两种不同品牌的牛奶进行了销售额的统计,得到了以下数据:品牌A:[120, 130, 110, 140, 150, 130, 160, 140, 150, 130]品牌B:[110, 120, 130, 140, 130, 150, 140, 160, 130, 150]现在需要对这两组数据进行非参数的Wilcoxon秩和检验,以验证两个品牌的销售额是否存在显著差异。

解答:Wilcoxon秩和检验是一种常用的非参数检验方法,用于判断两个相关样本之间的差异是否显著。

首先,我们需要对两组数据进行合并,并进行排序,得到:[110, 110, 120, 130, 130, 130, 130, 140, 140, 150, 150, 160]。

王静龙《非参数统计分析》课后计算题参考的答案解析

王静龙《非参数统计分析》课后计算题参考的答案解析

WORD格式资料王静龙《非参数统计分析》课后习题计算题参考答案习题一1.One Sample t-test for a MeanSample Statistics for xN Mean Std. Dev. Std. Error-------------------------------------------------26 1.38 8.20 1.61Hypothesis TestNull hypothesis: Mean of x = 0Alternative: Mean of x ^= 0t Statistic Df Prob > t---------------------------------0.861 25 0.397695 % Confidence Interval for the MeanLower Limit: -1.93Upper Limit: 4.70则接受原假设认为一样习题二1.描述性统计专业整理专业整理习题三1.1{}+01=1339:6500:650013=BINOMDIST(13,39,0.5,1)=0.026625957S n H me H me P S +==<≤另外:在excel2010中有公式 BINOM.INV(n,p,a) 返回一个数值,它使得累计二项式分布的函数值大于或等于临界值a 的最小整数***0*0+1inf :2BINOM.INV(39,0.5,0.05)=141sup :1132S 1313n m i n d i n m m i n d d m i d αα==⎧⎫⎛⎫⎪⎪⎛⎫=≥⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫≤=-=⎨⎬ ⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭=≤=∑∑= 以上两种都拒绝原假设,即中位数低于65001.2WORD 格式资料专业整理****01426201inf :221inf :122BINOM.INV(40,0.5,1-0.025)=26d=n-c=40-26=14580064006200n ni c n m i n c c i n m m i x x me x αα==⎧⎫⎛⎫⎪⎪⎛⎫=≤⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫=≥-⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭====∑∑2.{}+01=4070:6500:65002402*(1-BINOMDIST(39,70,0.5,1))=0.281978922S n H me H me P S +==≠≥=则接受原假设,即房价中位数是65003.1{}+01=15521552527207911::22n 1552=5.33E-112S n H p H p P S φ+=+==>≥≈比较大,则用正态分布近似**+**0:=1552155252720791inf :221inf :122m=BINOM.INV(2079,0.5,0.975)=1084nn i c n m i S n n c c i n m m i αα===+=⎧⎫⎛⎫⎪⎪⎛⎫=≤⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫=≥-⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭∑∑另外则拒绝原假设,即相信孩子会过得更好的人多3.2P 为认为生活更好的成年人的比例,则WORD 格式资料专业整理1522=0.7465132079p 的比估计是:4.{}00.90610.90618154157860:65:6510.9060.094~(,)181541BINOMDIST(18153,157860,0.094,1)=0S n H P H P p S b n p P S +++===>=-=≥=-因为0〈0.05则拒绝原假设习题四1.()()++0.025+W =6+8+10+1+4+12+9+11+2+7=70p 2P W 70n=12c =65p 2P W 65=0.05≥≥符号秩和检验统计量:值为,当得所以值小于即拒绝原假设2.专业整理()()++0.025+W =2.5+2.5+7+7+7+7+10.5+14+14+14+14+14+17.5+17.5+19+20+23+24=234.5p 2P W 234.5n=25 c =236p 2P W 236=0.05≥≥符号秩和检验统计量:值为,当得所以值小于即接受原假设{}011826:0:02182*(1-BINOMDIST(17,25,0.5,1))=0.043285251S n H me H me P S +===≠≥=+符号检验:则拒绝原假设WORD 格式资料专业整理t t =0.861df=25 p=0.3976检验:统计量接受原假设3.(1)+0.0250.0250.025++=5+2+2=9833(1)322(3)0.052(9)0.05W n c n n d c P W P W ==+=-=≤=≤>查表可得:则 接受原假设Walsh 平均由小到大排列:50 55 60 65 65 70 70 70 75 75 75 80 80 80 80 80 80 80 85 85 85 8585 90 90 90 90 90 90 95 95 95 95 95 95 100 100 100 100 100 100 100 105 105专业整理N=55 则对称中心为()()^281/290N W W θ+===()()1/1/1/40.527.50.5 1.967.771011461/40.527.50.5 1.9647.22898853d n n U c n n U αα--=+--=--==+++=++=因为c 不是整数,则^+1k d L k k w w θ()()介于与之间,其中表示比大的最小整数即为8 ^L θ为70与75之间,即为72.5 []-%72.5,105H L 则的点估计为90 95的区间估计为习题五1.171(,24,25,50)0.005060988i p P i p ===∑值很小,则拒绝原假设即认为女职工的收入比男职工的低。

非参数统计题目及答案

非参数统计题目及答案

非参数统计题目及答案标准化管理处编码[BBX968T-XBB8968-NNJ668-MM9N]1.人们在研究肺病患者的生理性质时发现,患者的肺活量与他早在儿童时期是否接受过某种治疗有关,观察3组病人,第一组早在儿童时期接受过肺部辐射,第二组接受过胸外科手术,第三组没有治疗过,现观察到其肺活量占其正常值的百分比如下:以往的经验告诉我们,这三组病人的肺活量有如下关系:第二组≤第一组≤第三组,试判断这一经验是否可靠。

解:H 0:θ2≤θ1≤θ3 H 1:至少有一个不等式成立可得到 N=15由统计量H=)112+N N (∑=Ki i N R 1i 2-3(N+1)=)(1151512+(32×+29×+59×-3×(15+1)= 查表(5,5,5)在P(H ≥= P(H ≥= 即P (H ≥)﹥故取α=, P ﹥α ,故接受零假设即这一检验可靠。

2.关于生产计算机公司在一年中的生产力的改进(度量为从0到100)与它们在过去三年中在智力投资(度量为:低,中等,高)之间的关系的研究结果列在下表中:是否智力投资对改进生产力有帮助说明检验的步骤,包括零假设,备选假设,统计量,P值等等及你的结果。

(利用Jonkheere-Terpstra检验)解:H0:M低=M中=M高H1:M低﹤M中﹤M高U 12=0+9+2+8+10+9+10+2+10+10+8++3=U 13=10×8=80U 23=12+9+12+12+12+11+12+11=89J=∑≤jij U i =+80+89=大样本近似 Z=[]72)32()324121i 222∑∑==+-+--k i i i k i n n N N n N J ()(~N (0,1)求得 Z= Ф=取α= , P >α, 故接受原假设,认为智力投资对改进生产力有帮助。

非参数统计参考答案

非参数统计参考答案

非参数统计是一种不依赖于总体分布假设的统计方法,它基于样本数据进行推断和分析。

以下是非参数统计中常见问题的一些参考答案:
秩和检验(Mann-Whitney U检验):
假设检验问题:用于比较两个独立样本的中位数是否相等。

参考答案:通过计算样本的秩和,然后使用Mann-Whitney U检验来比较两组样本的秩和,从而得出结论。

Kruskal-Wallis检验:
假设检验问题:用于比较三个或更多独立样本的总体分布是否相同。

参考答案:将各组样本合并,并对所有数据进行排序。

然后,使用秩和来计算每组的秩和总和,并使用Kruskal-Wallis检验来比较秩和之间的差异。

Wilcoxon符号秩检验:
假设检验问题:用于比较两个相关样本的中位数是否相等。

参考答案:对两组相关样本的差异取绝对值,并对其进行排序以获得符号秩。

然后,使用Wilcoxon符号秩检验来比较秩和之间的差异。

Friedmann检验:
假设检验问题:用于比较三个或更多相关样本的总体分布是否相同。

参考答案:将各组样本的差异取绝对值,并对其进行排序以获得符号秩。

然后,使用Friedmann 检验来比较秩和之间的差异。

Kendall秩相关系数:
相关性问题:用于衡量两个变量之间的非线性相关性。

参考答案:将变量的观察值转换为秩次,然后计算秩次之间的Kendall秩相关系数。

请注意,以上是非参数统计中常见问题的一些参考答案。

具体问题的回答可能会根据具体的研究设计、数据类型和分析目的而有所不同。

在实际应用中,建议根据具体情况选择适当的非参数统计方法,并根据具体数据进行分析和解释。

《非参数统计分析》课后计算题参考答案

《非参数统计分析》课后计算题参考答案

《⾮参数统计分析》课后计算题参考答案王静龙《⾮参数统计分析》课后习题计算题参考答案习题⼀1.One Sample t-test for a Mean Sample Statistics for xN Mean Std. Dev. Std. Error -------------------------------------------------26 1.38 8.20 1.61 Hypothesis TestNull hypothesis: Mean of x = 0 Alternative: Mean of x ^= 0t Statistic Df Prob > t --------------------------------- 0.861 25 0.397695 % Confidence Interval for the MeanLower Limit: -1.93 Upper Limit: 4.70则接受原假设认为⼀样习题⼆1.描述性统计习题三1.1{}+01=1339:6500:650013=BINOMDIST(13,39,0.5,1)=0.026625957S n H me H me P S +==<≤另外:在excel2010中有公式 BINOM.INV(n,p,a) 返回⼀个数值,它使得累计⼆项式分布的函数值⼤于或等于临界值a 的最⼩整数***0*0+1inf :2BINOM.INV(39,0.5,0.05)=141sup :1132S 1313n m i n d i n m m i n d d m i d αα===≥≤=-= ? ?=≤=∑∑= 以上两种都拒绝原假设,即中位数低于65001.2****01426201inf :221inf :122BINOM.INV(40,0.5,1-0.025)=26d=n-c=40-26=14 580064006200nn i c n m i n c c i n m m i x x me x αα===≤??=≥-====∑∑2.{}+01=4070:6500:65002402*(1-BINOMDIST(39,70,0.5,1))=0.281978922S n H me H me P S +==≠≥=则接受原假设,即房价中位数是65003.1{}+01=15521552527207911::22n 1552=5.33E-112S n H p H p P S φ+=+==>≥≈⽐较⼤,则⽤正态分布近似**+**0:=1552155252720791inf :221inf :122m=BINOM.INV(2079,0.5,0.975)=1084nn i c n m i S n n c c i n m m i αα===+==≤??=≥-??∑∑另外则拒绝原假设,即相信孩⼦会过得更好的⼈多3.2P 为认为⽣活更好的成年⼈的⽐例,则1522=0.7465132079p 的⽐估计是:4.{}00.90610.90618154157860:65:6510.9060.094~(,)181541BINOMDIST(18153,157860,0.094,1)=0S n H P H P p S b n p P S +++===>=-=≥=-因为0〈0.05则拒绝原假设习题四1.()()++0.025+W =6+8+10+1+4+12+9+11+2+7=70p 2P W 70n=12c =65p 2P W 65=0.05≥≥符号秩和检验统计量:值为,当得所以值⼩于即拒绝原假设2.()()++0.025+W =2.5+2.5+7+7+7+7+10.5+14+14+14+14+14+17.5+17.5+19+20+23+24=234.5 p 2P W 234.5n=25 c =236p 2P W 236=0.05≥≥符号秩和检验统计量:值为,当得所以值⼩于即接受原假设{}011826:0:02182*(1-BINOMDIST(17,25,0.5,1))=0.043285251S n H me H me P S +===≠≥=+符号检验:则拒绝原假设t t =0.861df=25 p=0.3976检验:统计量接受原假设3.+0.0250.0250.025++=5+2+2=9833(1)322(3)0.052(9)0.05W n c n n d c P W P W ==+=-=≤=≤>查表可得:则接受原假设(2)Walsh 平均由⼩到⼤排列:50 55 60 65 65 70 70 70 75 75 75 80 80 80 80 80 80 80 85 85 85 8585 90 90 90 90 90 90 95 95 95 95 95 95 100 100 100 100 100 100 100 105 105 105105 105 110 110 110 110 110 115 115 120 N=55 则对称中⼼为()()^281/290N W W θ+===()()1/1/1/40.527.50.5 1.967.771011461/40.527.50.5 1.9647.22898853d n n U c n n U αα--=+--=--==+++=++=因为c 不是整数,则^+1k d L k k w w θ()()介于与之间,其中表⽰⽐⼤的最⼩整数即为8 ^L θ为70与75之间,即为72.5 []-%72.5,105H L 则的点估计为90 95的区间估计为1.171(,24,25,50)0.005060988i p P i p ===∑值很⼩,则拒绝原假设即认为⼥职⼯的收⼊⽐男职⼯的低。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

课后习题参考答案第一章p23-252、(2)有两组学生,第一组八名学生的成绩分别为x 1:100,99,99,100,99,100,99,99;第二组三名学生的成绩分别为x 2:75,87,60。

我们对这两组数据作同样水平a=的t检验(假设总体均值为u ):H 0:u=100 H 1:u<100。

第一组数据的检验结果为:df=7,t 值为,单边p 值为,结论为“拒绝H 0:u=100。

”(注意:该组均值为);第二组数据的检验结果为:df=2,t 值为,单边p值为;结论为“接受H 0:u=100。

”(注意:该组均值为)。

你认为该问题的结论合理吗说出你的理由,并提出该如何解决这一类问题。

答:这个结论不合理(6分)。

因为,第一组数据的结论是由于p-值太小拒绝零假设,这时可能犯第一类错误的概率较小,且我们容易把握;而第二组数据虽不能拒绝零假设,但要做出“在水平a时,接受零假设”的说法时,还必须涉及到犯第二类错误的概率。

(4分)然而,在实践中,犯第二类错误的概率多不易得到,这时说接受零假设就容易产生误导。

实际上不能拒绝零假设的原因很多,可能是证据不足(样本数据太少),也可能是检验效率低,换一个更有效的检验之后就可以拒绝了,当然也可能是零假设本身就是对的。

本题第二组数据明显是由于证据不足,所以解决的方法只有增大样本容量。

(4分)第三章p68-713、在某保险种类中,一次关于1998年的索赔数额(单位:元)的随机抽样为(按升幂排列): 4632,4728,5052,5064,5484,6972,7596,9480,14760,15012,18720,21240,22836,52788,67200。

已知1997年的索赔数额的中位数为5064元。

(1)是否1998年索赔的中位数比前一年有所变化能否用单边检验来回答这个问题(4分) (2)利用符号检验来回答(1)的问题(利用精确的和正态近似两种方法)。

(10分) 》(3)找出基于符号检验的95%的中位数的置信区间。

(8分)解:(1)1998年的索赔数额的中位数为9480元比1997年索赔数额的中位数5064元是有变化,但这只是从中位数的点估计值看。

如果要从普遍意义上比较1998年与1997年的索赔数额是否有显著变化,还得进行假设检验,而且这个问题不能用单边检验来回答。

(4分)(2)符号检验(5分)设假设组:H 0:M =M 0=5064H 1:M ≠M 0=5064符号检验:因为n +=11,n-=3,所以k=min(n+,n-)=3精确检验:二项分布b(14,,∑=-=30287.0)2/1,14(n b ,双边p-值为,大于a=,所以在a水平下,样本数据还不足以拒绝零假设;但假若a=,则样本数据可拒绝零假设。

查二项分布表得a=的临界值为(3,11),同样不足以拒绝零假设。

正态近似:(5分) np=14/2=7,npq=14/4=z=(3+/5.3≈>Z a/2=—仍是在a=的水平上无法拒绝零假设。

说明两年的中位数变化不大。

(3)中位数95%的置信区间:(5064,21240)(8分)7、一个监听装置收到如下的信号:0,1,0,1,1,1,0,0,1,1,0,0,0,0,1,1,1,1,1,1,1,1,1,0,1,0,0,1,1,1,0,1,0,1,0,1,0,0,0,0,0,0,0,0,1,0,1,1,0,0,1,1,1,0,1,0,1,0,0,0,1,0,0,1,0,1,0,1,0,0,0,0,0,0,0,0。

能否说该信号是纯粹随机干扰(10分)解:建立假设组: H 0:信号是纯粹的随机干扰H 1:信号不是纯粹的随机干扰(2分)游程检验:因为n 1=42,n 2=34,r=37。

(2分)根据正态近似公式得:U=33.18)13442()3442()344234422(3442258.3813442344222≈-++--⨯⨯⨯⨯=≈++⨯⨯σ (2分)086.033.1858.3837-≈-=Z (2分)取显著性水平a=,则Za/2=,故接受零假设,可以认为信号是纯粹的随机干扰的。

(2分) {第四章p91-941、在研究计算器是否影响学生手算能力的实验中,13个没有计算器的学生(A组)和10个拥有计算器的学生(B组)对一些计算题进行了手算测试.这两组学生得到正确答案的时间(分钟)分别如下:A组:28, 20,20,27,3,29,25,19,16,24,29,16,29 B组:40,31, 25,29,30,25,16,30,39,25能否说A组学生比B组学生算得更快利用所学的检验来得出你的结论.(12分)解、利用Wilcoxon 两个独立样本的秩和检验或Mann-Whitney U 检验法进行检验。

建立假设组:H 0:两组学生的快慢一致;H 1:A 组学生比B 组学生算得快。

(2分) 两组数据混合排序(在B 组数据下划线):3,16,16,16,19,20,20,24,25,25,25,25,27,28,29, 29, 29, 29,30, 30,31,39,40(2分)A 组秩和R A =1+3*2+5+*2+8++13+14+*3=120; 】B 组秩和R B =3+*3++*2+21+22+23=156(2分) A 组逆转数和U A =120-(13*14)/2=29B 组逆转数和U B =156-(10*11)/2=101(2分)当n A =13,n B =10时,样本量较大,超出了附表的范围,不能查表得Mann-Whitney 秩和检验的临界值,所以用正态近似。

计算2326.21245.16362603612/)11013(*10*132/10*132912/)1(2/-≈-≈-=++-=++-=B A B A B A A n n n n n n U Z (2分)当显著性水平a 取时,正态分布的临界值Z a/2=(1分)由于Z<Z a/2,所以拒绝H 0,说明A 组学生比B 组学生算得快。

(1分)4、在比较两种工艺(A和B)所生产的产品性能时,利用超负荷破坏性实验。

记下损坏前延迟的时间名次(数目越大越耐久)如下:方法:A B B A B A B A A B A A A B A B A A A A :序: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20用Mann-Whitney 秩和检验判断A工艺是否比B工艺在提高耐用性方面更优良(10分)解、设假设组:H 0:两种工艺在提高耐用性方面的优良性一致;H 1:A 工艺比B 工艺更优良(1分,假设也可用符号表达式) 根据样本数据知n A =13;n B =7(1分),计算A 工艺的秩和R A =1+4+6+8+9+11+12+13+15+17+18+19+20=153;(1分)B 工艺的秩和R B =2+3+5+7+10+14+16=57(1分)A 工艺的Mann-Whitney 秩和U A =R A -n A (n A +1)/2=153-(13*14)/2=62(1分)B 工艺的Mann-Whitney 秩和U B =R B -n B (n B +1)/2=57-(7*8)/2=29(1分)当n A =13,n B =7时,样本量较大,超出了附表的范围,不能查表得Mann-Whitney 秩和检验的临界值,所以用正态近似。

计算 …3075.16194.125.1625.1595.1612/)1713(*7*132/7*136212/)1(2/≈≈=++-=++-=B A B A B A A n n n n n n U Z (2分)当显著性水平a 取时,正态分布的临界值Z a/2=(1分)由于Z<Z a/2,所以样本数据提供的信息不足以拒绝H 0,可以说A 、B 两种工艺在提高耐用性方面的优良性一致,A 工艺并不比B 工艺更优良。

(1分)第五章p118-1211、对5种含有不同百分比棉花的纤维分别做8次抗拉强度试验,试验结果如表4所示(单位:g/cm 2):试问不同百分比纤维的棉花其平均抗拉强度是否一样,利用Kruskall —Wallis 检验法。

(14分) 解:建立假设组:H 0:不同百分比纤维的棉花其平均抗拉强度一样; H 1:不同百分比纤维的棉花其平均抗拉强度不一样。

(2分) 已知,k=5,n 1= n 2= n 3= n 4= n 5=8(2分)。

混合排序后各观察值的秩如表4所示:表4根据表4计算得:(6由于自由度k-1=5-1=4,n j =8>5,是大样本,所以根据水平a=,查X2分布表得临界值C=,(2分) 因为Q>C ,故以5%的显著水平拒绝H 0假设,不同百分比纤维的棉花其平均抗拉强度不一样。

(2分)…70H 1:顾客对3种服务的态度有显著性差异。

(2分)本例中,k=3,n=15。

(2分)又因6857.2841385.715.2535.2501665.78414012)1(3)1(122222212≈⨯-++++⨯⨯=+-+=∴∑=N n R N N H k j jj(5分)自由度k-1=3-1=2,(2分)取显著性水平a=,查X2分布表得临界值c=,(2分)因为Q>C ,故以5%的显著水平拒绝H 0假设,即顾客对3种服务的态度有显著性差异。

(2分)8、调查20个村民对3个候选人的评价,答案只有“同意”或“不同意”两种,结果见表1:解:建立假设组: H 0:三个候选人在村民眼中没有区别H 1:三个候选人在村民眼中有差别(2分)数据适合用Cochran Q 检验(2分)。

而且已知n=20,k=3,∑x i =∑y j =28。

(2分) &计算结果见表3:根据表2计算得:48221266118922222222=+++==++=∑∑ j i y x (2分)6154.1843233323257)13(3431414257464169281323222222=-⨯⎭⎬⎫⎩⎨⎧--=∴=++++==++=++===∑∑∑∑θ j i j i y X y x则7778.048283)328266)(13(3)()[1(2222≈-⨯--=---=∑∑∑∑jj i i y y k kx x k k Q (2分) 取显著性水平a=,查卡方分布表得卡方临界值C =,由于Q<C ,故无法拒绝零假设,可以认为三个候选人在村民眼中没有区别。

(2分)第八章P170-1712.下面是某车间生产的一批轴的实际直径(单位:mm ):;能否表明该尺寸服从均值为10,标准差为的正态分布(分别用K-S 拟合检验和卡方拟合检验)。

当n=10,a=时查表得K-S 拟合检验的临界值为。

相关文档
最新文档