王静龙非参数统计分析课后计算题参考答案Word版
王静龙《非参数统计分析》教案
王静龙《非参数统计分析》(1-8章)教案(总77页)--本页仅作为文档封面,使用时请直接删除即可----内页可以根据需求调整合适字体及大小--.引言一般统计分析分为参数分析与非参数分析,参数分析是指,知道总体分布,但其中几个参数的值未知,用统计量来估计参数值,但大部分情况,总体是未知的,这时候就不能用参数分析,如果强行用可能会出现错误的结果。
例如:分析下面的供应商的产品是否合格?合格产品的标准长度为(±),随即抽取n=100件零件,数据如下:表经计算,平均长度为cm x 4958.8=,非常接近中心位置,样本标准差为()1047.0112=--=∑=ni i n x x s cm.一般产品的质量服从正态分布,),(~2δμN X 。
%66)1047.04958.84.8()1047.04958.86.8()4.8()6.8()6.84.8(≈-Φ--Φ=-Φ--Φ=≤≤σμσμX P这说明产品有接近三分之一不合格,三分之二合格,所以需要更换供应厂 商,而用非参数分析却是另外一个结果。
以下是100个零件长度的分布表:这说明有90%的零件长度在)2.05.8(±cm 之间,有9%的零件不合格,所以工厂不需要换供应商。
例2 哪一个企业职工的工资高? 表两个企业职工的工资显然,企业1职工的工资高,倘若假设企业1与企业2的职工工资分别服从正态分布),(),,(22σσb N a N ,则这两个企业职工的工资比较问题就可以转化为一个参数的假设检验问题,原假设为b a H =:0,备择假设为b a H >:0 则 ))11(,(~2σnmb a N y x +-- 若0H 为真,则)20()2(~11t n m t nm S y x t w =-++-=其中])()([2112122∑∑==-+--+=ni i m i i wy y x x n m S拒绝域为:}325.1{)}20({90.0≥=≥t t t 检测值为:282.1=t故不能拒绝原假设,认为两企业的工资水平无差异。
《非参数统计分析》课后计算题参考答案
王静龙《非参数统计分析》课后习题计算题参考答案习题一1.One Sample t-test for a MeanSample Statistics for xN Mean Std. Dev. Std. Error-------------------------------------------------26 1.38 8.20 1.61Hypothesis TestNull hypothesis: Mean of x = 0Alternative: Mean of x ^= 0t Statistic Df Prob > t---------------------------------0.861 25 0.397695 % Confidence Interval for the MeanLower Limit: -1.93Upper Limit: 4.70则接受原假设认为一样习题二1.描述性统计习题三1.1{}+01=1339:6500:650013=BINOMDIST(13,39,0.5,1)=0.026625957S n H me H me P S +==<≤另外:在excel2010中有公式 BINOM.INV(n,p,a) 返回一个数值,它使得累计二项式分布的函数值大于或等于临界值a 的最小整数***0*0+1inf :2BINOM.INV(39,0.5,0.05)=141sup :1132S 1313n m i n d i n m m i n d d m i d αα==⎧⎫⎛⎫⎪⎪⎛⎫=≥⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫≤=-=⎨⎬ ⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭=≤=∑∑= 以上两种都拒绝原假设,即中位数低于65001.2****01426201inf :221inf :122BINOM.INV(40,0.5,1-0.025)=26d=n-c=40-26=14580064006200nn i c n m i n c c i n m m i x x me x αα==⎧⎫⎛⎫⎪⎪⎛⎫=≤⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫=≥-⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭====∑∑2.{}+01=4070:6500:65002402*(1-BINOMDIST(39,70,0.5,1))=0.281978922S n H me H me P S +==≠≥=则接受原假设,即房价中位数是65003.1{}+01=15521552527207911::22n 1552=5.33E-112S n H p H p P S φ+=+==>⎛≥≈ ⎝比较大,则用正态分布近似**+**0:=1552155252720791inf :221inf :122m=BINOM.INV(2079,0.5,0.975)=1084nn i c n m i S n n c c i n m m i αα===+=⎧⎫⎛⎫⎪⎪⎛⎫=≤⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫=≥-⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭∑∑另外则拒绝原假设,即相信孩子会过得更好的人多3.2P 为认为生活更好的成年人的比例,则1522=0.7465132079p 的比估计是:4.{}00.90610.90618154157860:65:6510.9060.094~(,)181541BINOMDIST(18153,157860,0.094,1)=0S n H P H P p S b n p P S +++===>=-=≥=-因为0〈0.05则拒绝原假设习题四1.()()++0.025+W =6+8+10+1+4+12+9+11+2+7=70p 2P W 70n=12c =65p 2P W 65=0.05≥≥符号秩和检验统计量:值为,当得所以值小于即拒绝原假设2.()()++0.025+W =2.5+2.5+7+7+7+7+10.5+14+14+14+14+14+17.5+17.5+19+20+23+24=234.5p 2P W 234.5n=25 c =236p 2P W 236=0.05≥≥符号秩和检验统计量:值为,当得所以值小于即接受原假设{}011826:0:02182*(1-BINOMDIST(17,25,0.5,1))=0.043285251S n H me H me P S +===≠≥=+符号检验:则拒绝原假设t t =0.861df=25 p=0.3976检验:统计量接受原假设3.(1)+0.0250.0250.025++=5+2+2=9833(1)322(3)0.052(9)0.05W n c n n d c P W P W ==+=-=≤=≤>查表可得:则 接受原假设(2)Walsh 平均由小到大排列:50 55 60 65 65 70 70 70 75 75 75 80 80 80 80 80 80 80 85 85 85 85 85 90 90 90 90 90 90 95 95 95 95 95 95 100 100 100 100 100 100 100 105 105105 105 105 110 110 110 110 110 115 115 120 N=55 则对称中心为()()^281/290N W W θ+===()()1/1/1/40.527.50.5 1.967.771011461/40.527.50.5 1.9647.22898853d n n U c n n U αα--=+--=--==+++++=因为c 不是整数,则^+1k d L k k w w θ()()介于与之间,其中表示比大的最小整数即为8 ^L θ为70与75之间,即为72.5 []-%72.5,105H L 则的点估计为90 95的区间估计为习题五1.171(,24,25,50)0.005060988i p P i p ===∑值很小,则拒绝原假设即认为女职工的收入比男职工的低。
王静龙《非参数统计分析》章教案
.引言一般统计分析分为参数分析与非参数分析,参数分析是指,知道总体分布,但其中几个参数的值未知,用统计量来估计参数值,但大部分情况,总体是未知的,这时候就不能用参数分析,如果强行用可能会出现错误的结果。
例如:分析下面的供应商的产品是否合格?合格产品的标准长度为(8.5±0.1),随即抽取n=100件零件,数据如下:表1.18.503 8.508 8.498 8.347 8.494 8.500 8.498 8.500 8.502 8.501 8.491 8.504 8.502 8.503 8.501 8.505 8.492 8.497 8.150 8.496 8.501 8.489 8.506 8.497 8.505 8.501 8.500 8.499 8.490 8.493 8.501 8.497 8.501 8.498 8.503 8.505 8.510 8.499 8.489 8.496 8.500 8.503 8.497 8.504 8.503 8.506 8.497 8.507 8.346 8.310 8.489 8.499 8.492 8.497 8.506 8.502 8.505 8.489 8.503 8.492 8.501 8.499 8.804 8.505 8.504 8.499 8.506 8.499 8.493 8.494 8.490 8.505 8.511 8.502 8.505 8.503 8.782 8.502 8.509 8.499 8.498 8.493 8.897 8.504 8.493 8.494 7.780 8.509 8.499 8.503 8.494 8.511 8.501 8.497 8.493 8.501 8.495 8.461 8.504 8.691经计算,平均长度为cm x 4958.8=,非常接近中心位置8.5cm ,样本标准差为()1047.0112=--=∑=ni in x x s cm.一般产品的质量服从正态分布,),(~2δμN X 。
王静龙《非参数统计分析》课后计算题参考答案汇编
学习-----好资料更多精品文档王静龙《非参数统计分析》课后习题计算题参考答案习题一1.One Sample t-test for a MeanSample Statistics for xN Mean Std. Dev. Std. Error-------------------------------------------------26 1.38 8.20 1.61 Hypothesis TestNull hypothesis: Mean of x = 0Alternative: Mean of x ^= 0t Statistic Df Prob > t---------------------------------0.861 25 0.397695 % Confidence Interval for the MeanLower Limit: -1.93Upper Limit: 4.70则接受原假设认为一样习题二1.描述性统计更多精品文档习题三1.1{}+01=1339:6500:650013=BINOMDIST(13,39,0.5,1)=0.026625957S n H me H me P S +==<≤另外:在excel2010中有公式 BINOM.INV(n,p,a) 返回一个数值,它使得累计二项式分布的函数值大于或等于临界值a 的最小整数***0*0+1inf :2BINOM.INV(39,0.5,0.05)=141sup :1132S 1313n m i n d i n m m i n d d m i d αα==⎧⎫⎛⎫⎪⎪⎛⎫=≥⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫≤=-=⎨⎬ ⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭=≤=∑∑= 以上两种都拒绝原假设,即中位数低于65001.2学习-----好资料更多精品文档****01426201inf :221inf :122BINOM.INV(40,0.5,1-0.025)=26d=n-c=40-26=14580064006200nn i c n m i n c c i n m m i x x me x αα==⎧⎫⎛⎫⎪⎪⎛⎫=≤⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫=≥-⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭====∑∑2.{}+01=4070:6500:65002402*(1-BINOMDIST(39,70,0.5,1))=0.281978922S n H me H me P S +==≠≥=则接受原假设,即房价中位数是65003.1{}+01=15521552527207911::22n 1552=5.33E-112S n H p H p P S φ+=+==>≥≈比较大,则用正态分布近似**+**0:=1552155252720791inf :221inf :122m=BINOM.INV(2079,0.5,0.975)=1084nn i c n m i S n n c c i n m m i αα===+=⎧⎫⎛⎫⎪⎪⎛⎫=≤⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫=≥-⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭∑∑另外则拒绝原假设,即相信孩子会过得更好的人多3.2P 为认为生活更好的成年人的比例,则学习-----好资料更多精品文档1522=0.7465132079p 的比估计是:4.{}00.90610.90618154157860:65:6510.9060.094~(,)181541BINOMDIST(18153,157860,0.094,1)=0S n H P H P p S b n p P S +++===>=-=≥=-因为0〈0.05则拒绝原假设习题四1.()()++0.025+W =6+8+10+1+4+12+9+11+2+7=70p 2P W 70n=12c =65p 2P W 65=0.05≥≥符号秩和检验统计量:值为,当得所以值小于即拒绝原假设2.学习-----好资料更多精品文档()()++0.025+W =2.5+2.5+7+7+7+7+10.5+14+14+14+14+14+17.5+17.5+19+20+23+24=234.5p 2P W 234.5n=25 c =236p 2P W 236=0.05≥≥符号秩和检验统计量:值为,当得所以值小于即接受原假设{}011826:0:02182*(1-BINOMDIST(17,25,0.5,1))=0.043285251S n H me H me P S +===≠≥=+符号检验:则拒绝原假设学习-----好资料更多精品文档t t =0.861df=25 p=0.3976检验:统计量接受原假设3.(1)+0.0250.0250.025++=5+2+2=9833(1)322(3)0.052(9)0.05W n c n n d c P W P W ==+=-=≤=≤>查表可得:则 接受原假设Walsh 平均由小到大排列:50 55 60 65 65 70 70 70 75 75 75 80 80 80 80 80 80 80 85 85 85 8585 90 90 90 90 90 90 95 95 95 95 95 95 100 100 100 100 100 100 100 105 105学习-----好资料 更多精品文档105 105 105 110 110 110 110 110 115 115 120N=55 则对称中心为()()^281/290N W W θ+===()()1/1/1/40.527.50.5 1.967.771011461/40.527.50.5 1.9647.22898853d n n U c n n U αα--=+--=--==+++=++=因为c 不是整数,则^+1k d L k k w w θ()()介于与之间,其中表示比大的最小整数即为8 ^L θ为70与75之间,即为72.5 []-%72.5,105H L 则的点估计为90 95的区间估计为习题五1.171(,24,25,50)0.005060988i p P i p ===∑值很小,则拒绝原假设即认为女职工的收入比男职工的低。
非参数统计参考答案
内容:, ,上机实践:将MASS数据包用命令library(MASS)加载到R中,调用自带“老忠实”喷泉数据集geyer,它有两个变量:等待时间waiting和喷涌时间duration,其中…(1) 将等待时间70min以下的数据挑选出来;(2) 将等待时间70min以下,且等待时间不等于57min的数据挑选出来;(3) 将等待时间70min以下喷泉的喷涌时间挑选出来;(4) 将喷涌时间大于70min喷泉的等待时间挑选出来。
解:读取数据的R命令:library(MASS);#加载MASS包data(geyser);#加载数据集geyserattach(geyser);#将数据集geyser的变量置为内存变量(1) 依题意编定R程序如下:sub1geyser=geyser[which(waiting<70),1];#提取满足条件(waiting<70)的数据,which(),读取下标sub1geyser[1:5];#显示子数据集sub1geyser的前5行[1] 57 60 56 50 54(2) 依题意编定R程序如下:Sub2geyser=geyser[which((waiting<70)&(waiting!=57)),1];#提取满足条件(waiting<70& (waiting!=57)的数据.Sub2geyser[1:5];#显示子数据集sub1geyser的前5行[1] 60 56 50 54 60 ……原数据集的第1列为waiting喷涌时间,所以用[which(waiting<70),2](3)Sub3geyser=geyser[which(waiting<70),2];#提取满足条件(waiting<70)的数据,which(),读取下标Sub3geyser[1:5];#显示子数据集sub1geyser的前5行[1] ……原数据集的第2列为喷涌时间,所以用[which(waiting<70),2](4)Sub4geyser=geyser[which(waiting>70),1];#提取满足条件(waiting<70)的数据,which(),读取下标Sub4geyser[1:5];#显示子数据集sub1geyser的前5行[1] 80 71 80 75 77…….如光盘文件中的数据,一个班有30名学生,每名学生有5门课程的成绩,编写函数实现下述要求:(1) 以的格式保存上述数据;(2) 计算每个学生各科平均分,并将该数据加入(1)数据集的最后一列;(3) 找出各科平均分的最高分所对应的学生和他所修课程的成绩;(4) 找出至少两门课程不及格的学生,输出他们的全部成绩和平均成绩;(5) 比较具有(4)特点学生的各科平均分与其余学生平均分之间是否存在差异。
王静龙《非参数统计分析》课后计算题参考答案解析
王静龙《非参数统计分析》课后习题计算题参考答案习题一1.One Sample t-test for a Mean Sample Statistics for xN Mean Std. Dev. Std. Error -------------------------------------------------26 1.38 8.20 1.61 Hypothesis TestNull hypothesis: Mean of x = 0 Alternative: Mean of x ^= 0t Statistic Df Prob > t --------------------------------- 0.861 25 0.397695 % Confidence Interval for the MeanLower Limit: -1.93 Upper Limit: 4.70则接受原假设认为一样习题二1.描述性统计习题三1.1{}+01=1339:6500:650013=BINOMDIST(13,39,0.5,1)=0.026625957S n H me H me P S +==<≤另外:在excel2010中有公式 BINOM.INV(n,p,a) 返回一个数值,它使得累计二项式分布的函数值大于或等于临界值a 的最小整数***0*0+1inf :2BINOM.INV(39,0.5,0.05)=141sup :1132S 1313n m i n d i n m m i n d d m i d αα==⎧⎫⎛⎫⎪⎪⎛⎫=≥⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫≤=-=⎨⎬ ⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭=≤=∑∑= 以上两种都拒绝原假设,即中位数低于65001.2****01426201inf :221inf :122BINOM.INV(40,0.5,1-0.025)=26d=n-c=40-26=14580064006200n ni c n m i n c c i n m m i x x me x αα==⎧⎫⎛⎫⎪⎪⎛⎫=≤⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫=≥-⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭====∑∑2.{}+01=4070:6500:65002402*(1-BINOMDIST(39,70,0.5,1))=0.281978922S n H me H me P S +==≠≥=则接受原假设,即房价中位数是65003.1{}+01=15521552527207911::22n 1552=5.33E-112S n H p H p P S φ+=+==>≥≈比较大,则用正态分布近似**+**0:=1552155252720791inf :221inf :122m=BINOM.INV(2079,0.5,0.975)=1084nn i c n m i S n n c c i n m m i αα===+=⎧⎫⎛⎫⎪⎪⎛⎫=≤⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫=≥-⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭∑∑另外则拒绝原假设,即相信孩子会过得更好的人多3.2P 为认为生活更好的成年人的比例,则1522=0.7465132079p 的比估计是:4.{}00.90610.90618154157860:65:6510.9060.094~(,)181541BINOMDIST(18153,157860,0.094,1)=0S n H P H P p S b n p P S +++===>=-=≥=-因为0〈0.05则拒绝原假设习题四1.()()++0.025+W =6+8+10+1+4+12+9+11+2+7=70p 2P W 70n=12c =65p 2P W 65=0.05≥≥符号秩和检验统计量:值为,当得所以值小于即拒绝原假设2.()()++0.025+W =2.5+2.5+7+7+7+7+10.5+14+14+14+14+14+17.5+17.5+19+20+23+24=234.5p 2P W 234.5n=25 c =236p 2P W 236=0.05≥≥符号秩和检验统计量:值为,当得所以值小于即接受原假设{}011826:0:02182*(1-BINOMDIST(17,25,0.5,1))=0.043285251S n H me H me P S +===≠≥=+符号检验:则拒绝原假设t t =0.861df=25 p=0.3976检验:统计量接受原假设3.(1)+0.0250.0250.025++=5+2+2=9833(1)322(3)0.052(9)0.05W n c n n d c P W P W ==+=-=≤=≤>查表可得:则 接受原假设Walsh 平均由小到大排列:50 55 60 65 65 70 70 70 75 75 75 80 80 80 80 80 80 80 85 85 85 8585 90 90 90 90 90 90 95 95 95 95 95 95 100 100 100 100 100 100 100 105 105N=55 则对称中心为()()^281/290N W W θ+===()()1/1/1/40.527.50.5 1.967.771011461/40.527.50.5 1.9647.22898853d n n U c n n U αα--=+--=--==+++=++=因为c 不是整数,则^+1k d L k k w w θ()()介于与之间,其中表示比大的最小整数即为8 ^L θ为70与75之间,即为72.5 []-%72.5,105H L 则的点估计为90 95的区间估计为习题五1.171(,24,25,50)0.005060988i p P i p ===∑值很小,则拒绝原假设即认为女职工的收入比男职工的低。
非参数统计部分课后练习习题参考答案.docx
课后习题参考答案第一章 p23-252、( 2)有两组学生,第一组八名学生的成绩分别为x1: 100, 99,99,100,99, 100, 99,99;第二组三名学生的成绩分别为x2:75,87,60 。
我们对这两组数据作同样水平a=的t检验(假设总体均值为u): H0: u=100 H 1:u<100。
第一组数据的检验结果为:df=7 , t 值为,单边p 值为,结论为“拒绝H0:u=100。
”(注意:该组均值为);第二组数据的检验结果为:df=2 , t值为,单边p值为; 结论为“接受H0: u=100。
”(注意:该组均值为)。
你认为该问题的结论合理吗说出你的理由,并提出该如何解决这一类问题。
答:这个结论不合理( 6 分)。
因为,第一组数据的结论是由于p-值太小拒绝零假设,这时可能犯第一类错误的概率较小,且我们容易把握;而第二组数据虽不能拒绝零假设,但要做出“在水平a时,接受零假设”的说法时,还必须涉及到犯第二类错误的概率。
( 4 分)然而,在实践中,犯第二类错误的概率多不易得到,这时说接受零假设就容易产生误导。
实际上不能拒绝零假设的原因很多,可能是证据不足(样本数据太少),也可能是检验效率低,换一个更有效的检验之后就可以拒绝了,当然也可能是零假设本身就是对的。
本题第二组数据明显是由于证据不足,所以解决的方法只有增大样本容量。
(4 分)第三章 p68-713、在某保险种类中,一次关于1998 年的索赔数额(单位:元)的随机抽样为(按升幂排列):4632 ,4728, 5052, 5064, 5484, 6972, 7596, 9480 ,14760,15012, 18720, 21240, 22836, 52788,67200。
已知 1997 年的索赔数额的中位数为5064 元。
( 1)是否 1998 年索赔的中位数比前一年有所变化能否用单边检验来回答这个问题(4分)( 2)利用符号检验来回答(1)的问题(利用精确的和正态近似两种方法)。
非参数统计部分课后习题参考答案
课后习题参考答案第一章p23-252、(2)有两组学生,第一组八名学生的成绩分别为x1:100,99,99,100,99,100,99,99;第二组三名学生的成绩分别为x2:75,87,60。
我们对这两组数据作同样水平a=0.05的t检验(假设总体均值为u ):H 0:u=100 H 1:u<100。
第一组数据的检验结果为:df=7,t 值为3.4157,单边p 值为0.0056,结论为“拒绝H 0:u=100。
”(注意:该组均值为99.3750);第二组数据的检验结果为:df=2,t 值为3.3290,单边p值为0.0398;结论为“接受H 0:u=100。
”(注意:该组均值为74.000)。
你认为该问题的结论合理吗?说出你的理由,并提出该如何解决这一类问题。
答:这个结论不合理(6分)。
因为,第一组数据的结论是由于p-值太小拒绝零假设,这时可能犯第一类错误的概率较小,且我们容易把握;而第二组数据虽不能拒绝零假设,但要做出“在水平a时,接受零假设”的说法时,还必须涉及到犯第二类错误的概率。
(4分)然而,在实践中,犯第二类错误的概率多不易得到,这时说接受零假设就容易产生误导。
实际上不能拒绝零假设的原因很多,可能是证据不足(样本数据太少),也可能是检验效率低,换一个更有效的检验之后就可以拒绝了,当然也可能是零假设本身就是对的。
本题第二组数据明显是由于证据不足,所以解决的方法只有增大样本容量。
(4分)第三章p68-713、在某保险种类中,一次关于1998年的索赔数额(单位:元)的随机抽样为(按升幂排列): 4632,4728,5052,5064,5484,6972,7596,9480,14760,15012,18720,21240,22836,52788,67200。
非参数考试题及答案
非参数考试题及答案一、单项选择题(每题2分,共10题)1. 非参数统计方法主要处理的是:A. 正态分布数据B. 非正态分布数据C. 离散型数据D. 连续型数据答案:B2. 斯皮尔曼等级相关系数适用于:A. 正态分布数据B. 非正态分布数据C. 有序分类数据D. 有序连续数据答案:B3. 曼-惠特尼U检验用于比较:A. 两个独立样本的均值B. 两个独立样本的中位数C. 两个配对样本的均值D. 两个配对样本的中位数答案:B4. 克鲁斯卡尔-瓦利斯检验用于:A. 单样本方差分析B. 双样本方差分析C. 多样本方差分析D. 配对样本方差分析答案:C5. 弗里德曼检验适用于:A. 单因素方差分析B. 双因素方差分析C. 多因素方差分析D. 配对样本方差分析答案:D6. 威尔科克森符号秩检验用于:A. 两个独立样本的比较B. 两个配对样本的比较C. 多个独立样本的比较D. 多个配对样本的比较答案:B7. 非参数检验中,不需要假设数据分布的是:A. t检验B. 方差分析C. 卡方检验D. 克鲁斯卡尔-瓦利斯检验答案:D8. 斯皮尔曼等级相关系数的取值范围是:A. -1到1B. 0到1C. -1到0D. 0到-1答案:A9. 以下哪个检验不是非参数检验:A. 曼-惠特尼U检验B. 克鲁斯卡尔-瓦利斯检验C. 弗里德曼检验D. 单样本t检验答案:D10. 非参数检验中,用于比较两个独立样本的秩次差异的是:A. 威尔科克森符号秩检验B. 弗里德曼检验C. 克鲁斯卡尔-瓦利斯检验D. 曼-惠特尼U检验答案:D二、多项选择题(每题3分,共5题)1. 以下哪些是非参数检验:A. 曼-惠特尼U检验B. 单样本t检验C. 克鲁斯卡尔-瓦利斯检验D. 威尔科克森符号秩检验答案:ACD2. 以下哪些检验适用于两个独立样本的比较:A. 曼-惠特尼U检验B. 威尔科克森符号秩检验C. 弗里德曼检验D. 克鲁斯卡尔-瓦利斯检验答案:AD3. 以下哪些检验适用于多个独立样本的比较:A. 威尔科克森符号秩检验B. 克鲁斯卡尔-瓦利斯检验C. 弗里德曼检验D. 曼-惠特尼U检验答案:BC4. 以下哪些检验适用于配对样本的比较:A. 单样本t检验B. 威尔科克森符号秩检验C. 弗里德曼检验D. 曼-惠特尼U检验答案:BC5. 以下哪些检验不需要假设数据的分布:A. 单样本t检验B. 曼-惠特尼U检验C. 克鲁斯卡尔-瓦利斯检验D. 威尔科克森符号秩检验答案:BCD三、简答题(每题5分,共2题)1. 请简述非参数检验与参数检验的主要区别。
最新非参数统计部分课后习题参考答案
课后习题参考答案第一章p23-252、(2)有两组学生,第一组八名学生的成绩分别为x 1:100,99,99,100,99,100,99,99;第二组三名学生的成绩分别为x 2:75,87,60。
我们对这两组数据作同样水平a=0.05的t检验(假设总体均值为u ):H 0:u=100 H 1:u<100。
第一组数据的检验结果为:df=7,t 值为3.4157,单边p 值为0.0056,结论为“拒绝H 0:u=100。
”(注意:该组均值为99.3750);第二组数据的检验结果为:df=2,t 值为3.3290,单边p值为0.0398;结论为“接受H 0:u=100。
”(注意:该组均值为74.000)。
你认为该问题的结论合理吗?说出你的理由,并提出该如何解决这一类问题。
答:这个结论不合理(6分)。
因为,第一组数据的结论是由于p-值太小拒绝零假设,这时可能犯第一类错误的概率较小,且我们容易把握;而第二组数据虽不能拒绝零假设,但要做出“在水平a时,接受零假设”的说法时,还必须涉及到犯第二类错误的概率。
(4分)然而,在实践中,犯第二类错误的概率多不易得到,这时说接受零假设就容易产生误导。
实际上不能拒绝零假设的原因很多,可能是证据不足(样本数据太少),也可能是检验效率低,换一个更有效的检验之后就可以拒绝了,当然也可能是零假设本身就是对的。
本题第二组数据明显是由于证据不足,所以解决的方法只有增大样本容量。
(4分)第三章p68-713、在某保险种类中,一次关于1998年的索赔数额(单位:元)的随机抽样为(按升幂排列): 4632,4728,5052,5064,5484,6972,7596,9480,14760,15012,18720,21240,22836,52788,67200。
已知1997年的索赔数额的中位数为5064元。
(1)是否1998年索赔的中位数比前一年有所变化?能否用单边检验来回答这个问题?(4分) (2)利用符号检验来回答(1)的问题(利用精确的和正态近似两种方法)。
非参数统计第五版习题答案
非参数统计第五版习题答案非参数统计第五版习题答案非参数统计是统计学中的一个重要分支,与参数统计相对应。
在参数统计中,我们通常假设总体的分布形式,并根据样本数据来估计参数的值。
而在非参数统计中,我们不对总体的分布形式做任何假设,直接利用样本数据进行统计推断。
非参数统计方法的优势在于它的灵活性和广泛适用性。
它不依赖于特定的分布假设,因此适用于各种类型的数据。
在实际应用中,非参数统计方法常常用于处理那些不满足正态分布假设的数据,或者样本容量较小的情况。
在《非参数统计第五版》这本书中,作者对非参数统计的理论和方法进行了详细的介绍,并提供了大量的习题供读者练习。
以下是一些习题的答案和解析,希望能够帮助读者更好地理解和掌握非参数统计方法。
1. 习题:某城市的居民年龄分布情况如下:20岁以下的人数为1000人,20-30岁的人数为2000人,30-40岁的人数为3000人,40岁以上的人数为4000人。
试问该城市的年龄分布是否符合均匀分布?答案:首先,我们需要建立原假设和备择假设。
原假设(H0)是该城市的年龄分布符合均匀分布,备择假设(H1)是该城市的年龄分布不符合均匀分布。
然后,我们可以使用卡方检验来进行假设检验。
根据题目给出的数据,我们可以计算出每个年龄段的期望频数。
对于均匀分布的假设,每个年龄段的期望频数应该是相等的。
接下来,我们计算卡方统计量,并根据自由度和显著性水平查找卡方分布表,找到对应的临界值。
如果计算得到的卡方统计量大于临界值,则拒绝原假设,认为该城市的年龄分布不符合均匀分布;如果计算得到的卡方统计量小于临界值,则接受原假设,认为该城市的年龄分布符合均匀分布。
2. 习题:某医院进行了一项药物疗效的研究,随机选取了100名患者,并对其进行了治疗。
疗效被分为三个等级:显著改善、部分改善和无改善。
试问该药物的疗效是否显著?答案:为了判断该药物的疗效是否显著,我们可以使用秩和检验。
秩和检验是一种非参数检验方法,适用于两组或多组样本的比较。
王静龙《非参数统计分析》(1-8章)教案讲课讲稿
.引言一般统计分析分为参数分析与非参数分析,参数分析是指,知道总体分布,但其中几个参数的值未知,用统计量来估计参数值,但大部分情况,总体是未知的,这时候就不能用参数分析,如果强行用可能会出现错误的结果。
例如:分析下面的供应商的产品是否合格?合格产品的标准长度为(8.5±0.1),随即抽取n=100件零件,数据如下:表1.18.503 8.508 8.498 8.347 8.494 8.500 8.498 8.500 8.502 8.501 8.491 8.504 8.502 8.503 8.501 8.505 8.492 8.497 8.150 8.496 8.501 8.489 8.506 8.497 8.505 8.501 8.500 8.499 8.490 8.493 8.501 8.497 8.501 8.498 8.503 8.505 8.510 8.499 8.489 8.496 8.500 8.503 8.497 8.504 8.503 8.506 8.497 8.507 8.346 8.310 8.489 8.499 8.492 8.497 8.506 8.502 8.505 8.489 8.503 8.492 8.501 8.499 8.804 8.505 8.504 8.499 8.506 8.499 8.493 8.494 8.490 8.505 8.511 8.502 8.505 8.503 8.782 8.502 8.509 8.499 8.498 8.493 8.897 8.504 8.493 8.494 7.780 8.509 8.499 8.503 8.494 8.511 8.501 8.497 8.493 8.501 8.495 8.461 8.504 8.691经计算,平均长度为cm x 4958.8=,非常接近中心位置8.5cm ,样本标准差为()1047.0112=--=∑=ni in x x s cm.一般产品的质量服从正态分布,),(~2δμN X 。
王静龙《非参数统计分析》课后计算题参考的答案解析
WORD格式资料王静龙《非参数统计分析》课后习题计算题参考答案习题一1.One Sample t-test for a MeanSample Statistics for xN Mean Std. Dev. Std. Error-------------------------------------------------26 1.38 8.20 1.61Hypothesis TestNull hypothesis: Mean of x = 0Alternative: Mean of x ^= 0t Statistic Df Prob > t---------------------------------0.861 25 0.397695 % Confidence Interval for the MeanLower Limit: -1.93Upper Limit: 4.70则接受原假设认为一样习题二1.描述性统计专业整理专业整理习题三1.1{}+01=1339:6500:650013=BINOMDIST(13,39,0.5,1)=0.026625957S n H me H me P S +==<≤另外:在excel2010中有公式 BINOM.INV(n,p,a) 返回一个数值,它使得累计二项式分布的函数值大于或等于临界值a 的最小整数***0*0+1inf :2BINOM.INV(39,0.5,0.05)=141sup :1132S 1313n m i n d i n m m i n d d m i d αα==⎧⎫⎛⎫⎪⎪⎛⎫=≥⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫≤=-=⎨⎬ ⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭=≤=∑∑= 以上两种都拒绝原假设,即中位数低于65001.2WORD 格式资料专业整理****01426201inf :221inf :122BINOM.INV(40,0.5,1-0.025)=26d=n-c=40-26=14580064006200n ni c n m i n c c i n m m i x x me x αα==⎧⎫⎛⎫⎪⎪⎛⎫=≤⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫=≥-⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭====∑∑2.{}+01=4070:6500:65002402*(1-BINOMDIST(39,70,0.5,1))=0.281978922S n H me H me P S +==≠≥=则接受原假设,即房价中位数是65003.1{}+01=15521552527207911::22n 1552=5.33E-112S n H p H p P S φ+=+==>≥≈比较大,则用正态分布近似**+**0:=1552155252720791inf :221inf :122m=BINOM.INV(2079,0.5,0.975)=1084nn i c n m i S n n c c i n m m i αα===+=⎧⎫⎛⎫⎪⎪⎛⎫=≤⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫=≥-⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭∑∑另外则拒绝原假设,即相信孩子会过得更好的人多3.2P 为认为生活更好的成年人的比例,则WORD 格式资料专业整理1522=0.7465132079p 的比估计是:4.{}00.90610.90618154157860:65:6510.9060.094~(,)181541BINOMDIST(18153,157860,0.094,1)=0S n H P H P p S b n p P S +++===>=-=≥=-因为0〈0.05则拒绝原假设习题四1.()()++0.025+W =6+8+10+1+4+12+9+11+2+7=70p 2P W 70n=12c =65p 2P W 65=0.05≥≥符号秩和检验统计量:值为,当得所以值小于即拒绝原假设2.专业整理()()++0.025+W =2.5+2.5+7+7+7+7+10.5+14+14+14+14+14+17.5+17.5+19+20+23+24=234.5p 2P W 234.5n=25 c =236p 2P W 236=0.05≥≥符号秩和检验统计量:值为,当得所以值小于即接受原假设{}011826:0:02182*(1-BINOMDIST(17,25,0.5,1))=0.043285251S n H me H me P S +===≠≥=+符号检验:则拒绝原假设WORD 格式资料专业整理t t =0.861df=25 p=0.3976检验:统计量接受原假设3.(1)+0.0250.0250.025++=5+2+2=9833(1)322(3)0.052(9)0.05W n c n n d c P W P W ==+=-=≤=≤>查表可得:则 接受原假设Walsh 平均由小到大排列:50 55 60 65 65 70 70 70 75 75 75 80 80 80 80 80 80 80 85 85 85 8585 90 90 90 90 90 90 95 95 95 95 95 95 100 100 100 100 100 100 100 105 105专业整理N=55 则对称中心为()()^281/290N W W θ+===()()1/1/1/40.527.50.5 1.967.771011461/40.527.50.5 1.9647.22898853d n n U c n n U αα--=+--=--==+++=++=因为c 不是整数,则^+1k d L k k w w θ()()介于与之间,其中表示比大的最小整数即为8 ^L θ为70与75之间,即为72.5 []-%72.5,105H L 则的点估计为90 95的区间估计为习题五1.171(,24,25,50)0.005060988i p P i p ===∑值很小,则拒绝原假设即认为女职工的收入比男职工的低。
非参数统计参考答案
非参数统计是一种不依赖于总体分布假设的统计方法,它基于样本数据进行推断和分析。
以下是非参数统计中常见问题的一些参考答案:
秩和检验(Mann-Whitney U检验):
假设检验问题:用于比较两个独立样本的中位数是否相等。
参考答案:通过计算样本的秩和,然后使用Mann-Whitney U检验来比较两组样本的秩和,从而得出结论。
Kruskal-Wallis检验:
假设检验问题:用于比较三个或更多独立样本的总体分布是否相同。
参考答案:将各组样本合并,并对所有数据进行排序。
然后,使用秩和来计算每组的秩和总和,并使用Kruskal-Wallis检验来比较秩和之间的差异。
Wilcoxon符号秩检验:
假设检验问题:用于比较两个相关样本的中位数是否相等。
参考答案:对两组相关样本的差异取绝对值,并对其进行排序以获得符号秩。
然后,使用Wilcoxon符号秩检验来比较秩和之间的差异。
Friedmann检验:
假设检验问题:用于比较三个或更多相关样本的总体分布是否相同。
参考答案:将各组样本的差异取绝对值,并对其进行排序以获得符号秩。
然后,使用Friedmann 检验来比较秩和之间的差异。
Kendall秩相关系数:
相关性问题:用于衡量两个变量之间的非线性相关性。
参考答案:将变量的观察值转换为秩次,然后计算秩次之间的Kendall秩相关系数。
请注意,以上是非参数统计中常见问题的一些参考答案。
具体问题的回答可能会根据具体的研究设计、数据类型和分析目的而有所不同。
在实际应用中,建议根据具体情况选择适当的非参数统计方法,并根据具体数据进行分析和解释。
王静龙定性数据分析第四章二维列联表答案
i 1 3 2
ni ni 1 2
1116558 723627
TB
j 1
n j n j 1 2
第4题
n n 1 / 2 TA n n 1 / 2 TB 负相合
• (2)相合性的检验 • H0:A(性别)和B(啤酒偏好)相互独立 • H1:A和B负相合
工资 22500-25000 25000-27500 27500-30000 30000-32500 32500-35000 35000-37500 37500-40000 40000-42500 合计 女职工 1 4 2 10 3 5 1 0 26 男职工 0 1 1 3 5 6 6 2 24
•
这是 列联表。基于列联表的检验方法,回答问题:收入和性别有没有关 系?女职工的收入是否比男职工低?
从 n 个单元中抽取 n j 个单元,则 k 由于 k 都是随机的,其分布律如下:
1, 第k个单元第一次入样 0, 否则
k
概率
n
1
0 1- n j /n
n j /n
则有 nij k yk ,则有 E (nij ) E ( k ) yk
k 1
3 3 3 3
GH
0.20054 0
2Hale Waihona Puke n n n n ( z) 488047028.8
i j
U 检验统计量:
z GH = 9.42784 ( z) ( z)
9n3
p P{N (0,1) 9.42784} 0 拒绝H 0,即是有题中的趋势
第3题
• 调查人们对某项措施的满意程度,可以问他:“你对这项措施满意 吗?”,也可以问他:“你对这项措施不满意吗?”为了解这两种提 问方式对被调查者回答问题有没有影响,向243人问:“你满意吗?”, 另外向240人问:“你不满意吗?”。 • 调查结果如下:
[定稿]非参数统计王星版第一章课后答案
非参数统计王星版第一章课后答案非参数统计第一章课后答案#1.1AGE=c(18,23,22,21,20,19,20,20,20)first3=sort(AGE)[(length(AGE)-2):length(AGE)] delete.1=order(AGE)[(length(AGE)-2):length(AGE)] except=AGE[-delete.1]c(except[1:2],19,except[3:length(except)]) except[2]=22#1.2a1=rep(1:3,rep(2,3))a2=c(1,8,10,11)a3=seq(1,30,length(a2))a4=seq(1,5,2)a4=c(a1,a4,rep(0,2))a5=2:10a6=c(a2,a3[-(1:3)],a4)a7=c(rep(1,10),rep(0,8))#1.3library(MASS)data(geyser)a=geysera1=subset(a,waiting<70)a1=geyser[geyser$waiting<70,]#两个a1等价a2=subset(a,waiting<70&waiting!=57)a2=geyser[geyser$waiting<70&geyser$waiting!=57,]#两个a2等价a3=subset(a,waiting<70,c(duration))a4=subset(a,duration>70,c(waiting))#1.3library(MASS)a=geyserattach(a)b1=waiting[waiting<70]b2=waiting[waiting<70&waiting!=57]b3=duration[waiting<70]b4=waiting[duration>70]#1.4x=c(0,1,1,2,3,4)num=function(x){r=0p=c(rep(0,length(x)-1))q=c(rep(0,length(x)-1))for(i in 1:(length(x)-1)){for(j in (i+1):length(x)){p[i]=p[i]+I(x[i]<x[j])q[i]=q[i]+I(x[i]>x[j])}r=r+p[i]-q[i]}r}h=rep(0,1000)x=runif(5,-5,5)h[i]=num(x)}y=as.factor(h)yy=levels(y)a=rep(0,11)#记数记录-10:10:2各种结果出现的次数p=rep(0,11)for(i in 1:11){a[i]=sum(h==(-12+2*i))p[i]=a[i]/length(h)}aphist(h)h=rep(0,10000)for(i in 1:length(h)){x=sample(1:5,5,replace=T)#-5到5中间的整数随机抽样h[i]=num(x)}y=as.factor(h)yy=levels(y)a=rep(0,length(yy))#记数记录-10:10各种结果出现的次数p=rep(0,length(yy))a[i]=sum(h==(-11+i))p[i]=a[i]/length(h)}aphist(h)#当随机取10000次的一个结果 a=[71 321 774 1255 1637 1825 1684 1256 743 338 96]# p=[0.0071 0.0321 0.0774 0.1255 0.1637 0.1825 0.1684 0.1256 0.0743 0.0338 0.0096]#当随机取十万次数据的一个结果#a=[795 3421 7553 12521 16771 18180 16538 12553 7418 3400 850]#p=[0.00795 0.03421 0.07553 0.12521 0.16771 0.18180 0.16538 0.12553 0.07418 0.03400 0.00850]#1.5uniroot(f=function(x) 2*x^3-4*x^2+3*x-6, interval=c(-10,10))f=function(x){2*x^3-4*x^2+3*x-6}f(0)a=-10b=10root=function(a,b){c=(a+b)/2;while(abs(f(c))>0.00001){if(f(c)*f(a)<0){b=c; c=(a+b)/2;}else {a=c; c=(a+b)/2;}}c#1.6x=seq(0,2*pi,0.2)y=sin(x)/(cos(x)+x)#1.7chartonum=function(x){a=c("abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ");b=strsplit(a,"");for(i in 1:52){if(b[[1]][i]==x){t=i;i=i+1}else{i=i+1}}t}#将字符转化为数字,小写为前26位,大写为后26位,输入为单个字符f7=function(x){y=strsplit(x,"");#将输入分为单个字符for(i in 1:length(y[[1]])){t=chartonum(y[[1]][i])if(t<14){t=t+13;y[[1]][i]=LETTERS[t];}else if(t>=14&t<=26){t=t-13;y[[1]][i]=LETTERS[t];}else if(t>=27&t<=39){t=t+13-26;y[[1]][i]=letters[t];}else{t=t-13-26;y[[1]][i]=letters[t];} }mima=y;mima}#1.8f1.81=function(a){for(i in 1:length(a)){c[i]=a[length(a)-i+1]}c}f1.82=function(a,b){for(i in 1:(length(a)+length(b))){if(i%%2==1){c[i]=a[(i+1)/2];}else{c[i]=b[i/2];}}c}#%%为求余符号#1.9f1.9=function(n,m){a=rep(1,n);i=1;k=0;t=1;while(sum(a)>1|a[t]==0){t=i%%n;if(t==0){t=n;}else{t=i%%n}if(a[t]!=0){k=k+1;i=i+1;}else{i=i+1}if(k%%m==0){k=0;a[t]=0;}}t}#1.10student<-read.table("C:\\Documents andSettings\\Administrator\\桌面\\非参数统计配套数据\\各章数据\\第一章\\student.txt",header= T)student1=as.data.frame(student)means=apply(student1[,2:6],1,mean)b1=data.frame(student1,means)b2=student1[which(b==max(b)),]b3=I(student1[,2:6]<60)#判断每个学生每门课程是否及格b4=apply(b3,1,sum)#找出每个学生有几门课程不及格b5=b1[which(b4>1),]b6=b1[-which(b4>1),]t.test(b5$means,b6$means)#不说明情况下认为两总体方差不同,特殊说明var.equal=TRUE 置信区间为均值差的置信区间wilcox.test(b5$means,b6$means)wilcox.test(b5$means,b6$means,paires=FALSE)#1.11basket<-read.table("C:\\Documents andSettings\\Administrator\\桌面\\非参数统计配套数据\\各章数据\\第一章\\basket.txt",header= T)A=I(basket[,2:6]=='A')A=basket[,2:6]=='A'Asum=apply(A,1,sum)B=basket[,2:6]=='B'Bsum=apply(B,1,sum)a1=basket[which(Asum>0&Bsum>0),1]length(a1)#求个数a2=basket[which(Asum>0&Bsum>=3),]length(a2$ID)#求个数#1.12x=seq(-10,10,0.05)y1=sin(x)y2=cos(x)y3=y1+y2plot(x,y1,col=1,lty=1,axes=T,main="习题1.12",sub="sin(),cos (),sin()+cos()对比图")points(x,y2,col=2,lty=3)points(x,y3,col=3,lty=4)plot(x,y1,col=1,lty=1,main="习题1.12",sub="sin(),cos (),sin()+cos()对比图")lines(x,y1,col=1,lty=1)lines(x,y2,col=2,lty=3)lines(x,y3,col=3,lty=4)curve(sin(x),-10,10,col=1,lty=1,main="习题1.12",sub="sin (),cos(),sin()+cos()对比图")curve(cos(x),add=TRUE,col=2,lty=3)curve(sin(x)+cos(x),add=TRUE,col=3,lty=4)#1.13x=seq(-5,5,length=50)a=runif(500,-5,5)y=0.1*a*sin(2*a)f1=function(x,y){1-exp(-1/x^2+y^2)}z1=outer(x/2,x/2,f1)persp(z1)f2=function(x,y){0.1*x*sin(2*y)}z2=outer(x,x,f2)persp(z2)f3=function(x,y){sin(x)+cos(x)}z3=outer(x,x,f3)persp(z3)plot(sin(3*x),sin(6*x),type="l")#1.14a=rnorm(100,3,sqrt(5))b=rnorm(20,5,sqrt(3))c=c(a,b)hist(c)boxplot(c)qqnorm(c)#1.15x=rnorm(100,0,1)y1=log(abs(x))#lamda=0 hist(y1)qqnorm(y1)qqline(y1, col = 2)y2=(x-1)#lamda=1hist(y2)qqnorm(y2)qqline(y2, col = 3)y3=1-1/x#lamda=-1hist(y3)qqnorm(y3)qqline(y2, col = 4)。
非参数统计试题及答案
非参数统计试题及答案一、选择题1. 非参数统计方法是指在统计分析中不依赖于数据的分布形态的统计方法。
以下哪项不是非参数统计方法的特点?A. 不需要预先假定总体分布B. 对数据的分布形态要求严格C. 适用于小样本数据D. 可用于顺序变量和计数数据答案:B2. 以下哪个统计量是用来检验两个独立样本的中位数是否有显著差异的?A. t检验B. 方差分析C. Wilcoxon秩和检验D. 卡方检验答案:C3. 在非参数统计中,如果样本量很小,以下哪个方法可以用来估计总体分布?A. 直方图B. 箱线图C. 核密度估计D. 以上都是答案:D二、简答题1. 请简述非参数统计方法相对于参数统计方法的优势。
答案:非参数统计方法的优势在于它们不依赖于数据的分布形态,因此对于不符合正态分布的数据集也能适用。
此外,非参数方法通常对异常值不敏感,适用于小样本数据,并且可以处理顺序变量和计数数据。
2. 描述一下Kruskal-Wallis H检验的基本原理及其适用场景。
答案:Kruskal-Wallis H检验是一种非参数方法,用于比较三个或更多个独立样本的中位数是否存在显著差异。
其基本原理是将所有数据合并并进行秩次排序,然后比较各组的秩和。
如果所有组的中位数相同,则各组的秩和应该大致相等。
如果发现某个组的秩和显著高于或低于其他组,则该组的中位数可能与其他组存在显著差异。
该检验适用于样本量不均等、数据不满足正态分布或未知分布的情况。
三、计算题1. 假设有四个独立样本的数据如下,使用Kruskal-Wallis H检验来检验这四个样本的中位数是否有显著差异。
样本1: 10, 12, 8样本2: 15, 18, 20, 17样本3: 22, 25, 23, 24, 21样本4: 30, 28, 29, 27, 26答案:首先,将所有数据合并并进行秩次排序。
然后计算每个样本的秩和,接着使用Kruskal-Wallis H检验的公式计算H值。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
王静龙《非参数统计分析》课后习题计算题参考答案习题一1.One Sample t-test for a Mean Sample Statistics for xN Mean Std. Dev. Std. Error -------------------------------------------------26 1.38 8.20 1.61 Hypothesis TestNull hypothesis: Mean of x = 0 Alternative: Mean of x ^= 0t Statistic Df Prob > t --------------------------------- 0.861 25 0.397695 % Confidence Interval for the MeanLower Limit: -1.93 Upper Limit: 4.70则接受原假设认为一样习题二1.描述性统计习题三1.1{}+01=1339:6500:650013=BINOMDIST(13,39,0.5,1)=0.026625957S n H me H me P S +==<≤另外:在excel2010中有公式 BINOM.INV(n,p,a) 返回一个数值,它使得累计二项式分布的函数值大于或等于临界值a 的最小整数***0*0+1inf :2BINOM.INV(39,0.5,0.05)=141sup :1132S 1313n m i n d i n m m i n d d m i d αα==⎧⎫⎛⎫⎪⎪⎛⎫=≥⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫≤=-=⎨⎬ ⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭=≤=∑∑= 以上两种都拒绝原假设,即中位数低于65001.2****01426201inf :221inf :122BINOM.INV(40,0.5,1-0.025)=26d=n-c=40-26=14580064006200nn i c n m i n c c i n m m i x x me x αα==⎧⎫⎛⎫⎪⎪⎛⎫=≤⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫=≥-⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭====∑∑2.{}+01=4070:6500:65002402*(1-BINOMDIST(39,70,0.5,1))=0.281978922S n H me H me P S +==≠≥=则接受原假设,即房价中位数是65003.1{}+01=15521552527207911::22n 1552=5.33E-112S n H p H p P S φ+=+==>≥≈比较大,则用正态分布近似**+**0:=1552155252720791inf :221inf :122m=BINOM.INV(2079,0.5,0.975)=1084nn i c n m i S n n c c i n m m i αα===+=⎧⎫⎛⎫⎪⎪⎛⎫=≤⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫=≥-⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭∑∑另外则拒绝原假设,即相信孩子会过得更好的人多3.2P 为认为生活更好的成年人的比例,则1522=0.7465132079p 的比估计是:4.{}00.90610.90618154157860:65:6510.9060.094~(,)181541BINOMDIST(18153,157860,0.094,1)=0S n H P H P p S b n p P S +++===>=-=≥=-因为0〈0.05则拒绝原假设习题四1.()()++0.025+W =6+8+10+1+4+12+9+11+2+7=70p 2P W 70n=12c =65p 2P W 65=0.05≥≥符号秩和检验统计量:值为,当得所以值小于即拒绝原假设2.()()++0.025+W =2.5+2.5+7+7+7+7+10.5+14+14+14+14+14+17.5+17.5+19+20+23+24=234.5p 2P W 234.5n=25 c =236p 2P W 236=0.05≥≥符号秩和检验统计量:值为,当得所以值小于即接受原假设{}011826:0:02182*(1-BINOMDIST(17,25,0.5,1))=0.043285251S n H me H me P S +===≠≥=+符号检验:则拒绝原假设t t =0.861df=25 p=0.3976检验:统计量接受原假设3.(1)+0.0250.0250.025++=5+2+2=9833(1)322(3)0.052(9)0.05W n c n n d c P W P W ==+=-=≤=≤>查表可得:则 接受原假设Walsh 平均由小到大排列:50 55 60 65 65 70 70 70 75 75 75 80 80 80 80 80 80 80 85 85 85 8585 90 90 90 90 90 90 95 95 95 95 95 95 100 100 100 100 100 100 100 105 105105105 105 110 110 110 110 110 115 115 120 N=55 则对称中心为()()^281/290N W W θ+===()()1/1/1/40.527.50.5 1.967.771011461/40.527.50.5 1.9647.22898853d n n U c n n U αα--=+--=--==+++=++=因为c 不是整数,则^+1k d L k k w w θ()()介于与之间,其中表示比大的最小整数即为8 ^L θ为70与75之间,即为72.5 []-%72.5,105H L 则的点估计为90 95的区间估计为习题五1.171(,24,25,50)0.005060988i p P i p ===∑值很小,则拒绝原假设即认为女职工的收入比男职工的低。
1.2()+W =1+2+3.5+5+6+7+8+10+11.5+11.5+13+15+16+17.5+17.5+20+22+24+26+29+31+32+34+35+36+44.5=478n+m=50478(1)/2p=2P W 478=0.000327643Wilcoxon W W n N =⎛⎫-+≤Θ女女秩和因为N=,查不到表,则用其渐进正态分布求解n=26,m=24,N=50,=则拒绝原假设,认为女职工的收入低2.()B +W =1+2+3+4+5+6+8+10+12=51=n+m=1951p=2P W 51=2*0.001450862Wilcoxon W =⎛⎫≤ΘB 秩和因为N ,则用其渐进正态分布求解n=9,m=10,N=19,=则拒绝原假设,认为A 比B 的作用好7.()112+0.025W =1+5+7+8+10+11+16+18+19+20=115+n =20115p=2P W 115=158158>115.0Wilcoxon W c =≥月11111月秩和因为n=n ,n =10,n =10,n=20,所以,查表可得:因为,,所以p 值一定大于05则接受原假设,认为11月和12月的波动相同1/1//20.510*10/20.523.64/20.510*10/20.576.36d nm U c nm U αα--=--=--==++=++=位置参数检验:^^+1k d =-29L L k k w w θθ()()介于与之间,其中表示比大的最小整数即为24 [][][]^^176 =17U U w w θθ-c c 介于与之间,其中c 表示比c 小的最大整数即为所以,区间为:[-29,17] 即0在区间内则认为11月和12月的波动相同8()()()()()()()[]22112321241221()2269.251121247128822*4036.7659571212*471/21/144122*25796056.5-47*(47*47-1)/144202328.727347*46y i i i i i y y t t t M a R N E M n N nm D M d N N N N N τττ=====⎡⎤--⎢⎥=-⎢⎥⎣⎦⎡⎤-=-=⎢⎥⎣⎦⎡⎤=-+--⎣⎦-==∑∑∑尺度参数检验:所以渐进正态分布计p -p==4.25641E-05 M E M ⎛⎫Θ算其值:则认为较小()()()()221123212412214()346.5+1-4N 1247+1288=22*=258.38297874*4712*47N+1116N 22*2548=24245-=6167.00503947*4616*47p A -p=y i i i i i y y t t tA a R N E A n N nm D M d N N E τττ=====⎡⎤-⎢⎥=⎢⎥⎣⎦⎡⎤-⎢⎥⎣⎦⎡⎤=-⎢⎥-⎣⎦⎡⎤⎢⎥⎣⎦Θ∑∑∑()()()所以渐进正态分布计算其值:=0.869085147A ⎛⎫则认为较大b b b<1y y M A ≠综合:因为比较小而比较大,可知 1 且应该有因为b<1,则认为机器一更有机会改进质量*答案是自己做的,但是有一次发现有个地方错了啊,还没改过来,仅作参考!(注:可编辑下载,若有不当之处,请指正,谢谢!)。