王静龙《非参数统计分析》课后计算题参考标准答案
王静龙《非参数统计分析》教案
王静龙《非参数统计分析》(1-8章)教案(总77页)--本页仅作为文档封面,使用时请直接删除即可----内页可以根据需求调整合适字体及大小--.引言一般统计分析分为参数分析与非参数分析,参数分析是指,知道总体分布,但其中几个参数的值未知,用统计量来估计参数值,但大部分情况,总体是未知的,这时候就不能用参数分析,如果强行用可能会出现错误的结果。
例如:分析下面的供应商的产品是否合格?合格产品的标准长度为(±),随即抽取n=100件零件,数据如下:表经计算,平均长度为cm x 4958.8=,非常接近中心位置,样本标准差为()1047.0112=--=∑=ni i n x x s cm.一般产品的质量服从正态分布,),(~2δμN X 。
%66)1047.04958.84.8()1047.04958.86.8()4.8()6.8()6.84.8(≈-Φ--Φ=-Φ--Φ=≤≤σμσμX P这说明产品有接近三分之一不合格,三分之二合格,所以需要更换供应厂 商,而用非参数分析却是另外一个结果。
以下是100个零件长度的分布表:这说明有90%的零件长度在)2.05.8(±cm 之间,有9%的零件不合格,所以工厂不需要换供应商。
例2 哪一个企业职工的工资高? 表两个企业职工的工资显然,企业1职工的工资高,倘若假设企业1与企业2的职工工资分别服从正态分布),(),,(22σσb N a N ,则这两个企业职工的工资比较问题就可以转化为一个参数的假设检验问题,原假设为b a H =:0,备择假设为b a H >:0 则 ))11(,(~2σnmb a N y x +-- 若0H 为真,则)20()2(~11t n m t nm S y x t w =-++-=其中])()([2112122∑∑==-+--+=ni i m i i wy y x x n m S拒绝域为:}325.1{)}20({90.0≥=≥t t t 检测值为:282.1=t故不能拒绝原假设,认为两企业的工资水平无差异。
非参数统计部分课后习题参考答案
课后习题参考答案第一章p23-252、(2)有两组学生,第一组八名学生的成绩分别为x 1:100,99,99,100,99,100,99,99;第二组三名学生的成绩分别为x 2:75,87,60。
我们对这两组数据作同样水平a=0.05的t检验(假设总体均值为u ):H 0:u=100 H 1:u<100。
第一组数据的检验结果为:df=7,t 值为3.4157,单边p 值为0.0056,结论为“拒绝H 0:u=100。
”(注意:该组均值为99.3750);第二组数据的检验结果为:df=2,t 值为3.3290,单边p值为0.0398;结论为“接受H 0:u=100。
”(注意:该组均值为74.000)。
你认为该问题的结论合理吗?说出你的理由,并提出该如何解决这一类问题。
答:这个结论不合理(6分)。
因为,第一组数据的结论是由于p-值太小拒绝零假设,这时可能犯第一类错误的概率较小,且我们容易把握;而第二组数据虽不能拒绝零假设,但要做出“在水平a时,接受零假设”的说法时,还必须涉及到犯第二类错误的概率。
(4分)然而,在实践中,犯第二类错误的概率多不易得到,这时说接受零假设就容易产生误导。
实际上不能拒绝零假设的原因很多,可能是证据不足(样本数据太少),也可能是检验效率低,换一个更有效的检验之后就可以拒绝了,当然也可能是零假设本身就是对的。
本题第二组数据明显是由于证据不足,所以解决的方法只有增大样本容量。
(4分)第三章p68-713、在某保险种类中,一次关于1998年的索赔数额(单位:元)的随机抽样为(按升幂排列): 4632,4728,5052,5064,5484,6972,7596,9480,14760,15012,18720,21240,22836,52788,67200。
已知1997年的索赔数额的中位数为5064元。
(1)是否1998年索赔的中位数比前一年有所变化?能否用单边检验来回答这个问题?(4分) (2)利用符号检验来回答(1)的问题(利用精确的和正态近似两种方法)。
王静龙《非参数统计分析》(1-8章)教案
王静龙《非参数统计分析》(1-8章)教案.引言一般统计分析分为参数分析与非参数分析,参数分析是指,知道总体分布,但其中几个参数的值未知,用统计量来估计参数值,但大部分情况,总体是未知的,这时候就不能用参数分析,如果强行用可能会出现错误的结果。
例如:分析下面的供应商的产品是否合格?合格产品的标准长度为(8.5±0.1),随即抽取n=100件零件,数据如下:表1.18.503 8.508 8.498 8.347 8.494 8.500 8.498 8.500 8.502 8.501 8.491 8.504 8.502 8.503 8.501 8.505 8.492 8.497 8.150 8.496 8.501 8.489 8.506 8.497 8.505 8.501 8.500 8.499 8.490 8.493 8.501 8.497 8.501 8.498 8.503 8.505 8.510 8.499 8.489 8.496 8.500 8.503 8.497 8.504 8.503 8.506 8.497 8.507 8.346 8.310 8.489 8.499 8.492 8.497 8.506 8.502 8.505 8.489 8.503 8.492 8.501 8.499 8.804 8.505 8.504 8.499 8.506 8.499 8.493 8.494 8.490 8.505 8.511 8.502 8.505 8.503 8.782 8.502 8.509 8.499 8.498 8.493 8.897 8.504 8.493 8.494 7.780 8.509 8.499 8.503 8.494 8.511 8.501 8.497 8.493 8.501 8.495 8.461 8.504 8.691经计算,平均长度为cm x 4958.8=,非常接近中心位置8.5cm ,样本标准差为()1047.0112=--=∑=ni i n x x s cm.一般产品的质量服从正态分布,),(~2δμN X 。
王静龙《非参数统计分析》课后计算题参考答案汇编
学习-----好资料更多精品文档王静龙《非参数统计分析》课后习题计算题参考答案习题一1.One Sample t-test for a MeanSample Statistics for xN Mean Std. Dev. Std. Error-------------------------------------------------26 1.38 8.20 1.61 Hypothesis TestNull hypothesis: Mean of x = 0Alternative: Mean of x ^= 0t Statistic Df Prob > t---------------------------------0.861 25 0.397695 % Confidence Interval for the MeanLower Limit: -1.93Upper Limit: 4.70则接受原假设认为一样习题二1.描述性统计更多精品文档习题三1.1{}+01=1339:6500:650013=BINOMDIST(13,39,0.5,1)=0.026625957S n H me H me P S +==<≤另外:在excel2010中有公式 BINOM.INV(n,p,a) 返回一个数值,它使得累计二项式分布的函数值大于或等于临界值a 的最小整数***0*0+1inf :2BINOM.INV(39,0.5,0.05)=141sup :1132S 1313n m i n d i n m m i n d d m i d αα==⎧⎫⎛⎫⎪⎪⎛⎫=≥⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫≤=-=⎨⎬ ⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭=≤=∑∑= 以上两种都拒绝原假设,即中位数低于65001.2学习-----好资料更多精品文档****01426201inf :221inf :122BINOM.INV(40,0.5,1-0.025)=26d=n-c=40-26=14580064006200nn i c n m i n c c i n m m i x x me x αα==⎧⎫⎛⎫⎪⎪⎛⎫=≤⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫=≥-⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭====∑∑2.{}+01=4070:6500:65002402*(1-BINOMDIST(39,70,0.5,1))=0.281978922S n H me H me P S +==≠≥=则接受原假设,即房价中位数是65003.1{}+01=15521552527207911::22n 1552=5.33E-112S n H p H p P S φ+=+==>≥≈比较大,则用正态分布近似**+**0:=1552155252720791inf :221inf :122m=BINOM.INV(2079,0.5,0.975)=1084nn i c n m i S n n c c i n m m i αα===+=⎧⎫⎛⎫⎪⎪⎛⎫=≤⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫=≥-⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭∑∑另外则拒绝原假设,即相信孩子会过得更好的人多3.2P 为认为生活更好的成年人的比例,则学习-----好资料更多精品文档1522=0.7465132079p 的比估计是:4.{}00.90610.90618154157860:65:6510.9060.094~(,)181541BINOMDIST(18153,157860,0.094,1)=0S n H P H P p S b n p P S +++===>=-=≥=-因为0〈0.05则拒绝原假设习题四1.()()++0.025+W =6+8+10+1+4+12+9+11+2+7=70p 2P W 70n=12c =65p 2P W 65=0.05≥≥符号秩和检验统计量:值为,当得所以值小于即拒绝原假设2.学习-----好资料更多精品文档()()++0.025+W =2.5+2.5+7+7+7+7+10.5+14+14+14+14+14+17.5+17.5+19+20+23+24=234.5p 2P W 234.5n=25 c =236p 2P W 236=0.05≥≥符号秩和检验统计量:值为,当得所以值小于即接受原假设{}011826:0:02182*(1-BINOMDIST(17,25,0.5,1))=0.043285251S n H me H me P S +===≠≥=+符号检验:则拒绝原假设学习-----好资料更多精品文档t t =0.861df=25 p=0.3976检验:统计量接受原假设3.(1)+0.0250.0250.025++=5+2+2=9833(1)322(3)0.052(9)0.05W n c n n d c P W P W ==+=-=≤=≤>查表可得:则 接受原假设Walsh 平均由小到大排列:50 55 60 65 65 70 70 70 75 75 75 80 80 80 80 80 80 80 85 85 85 8585 90 90 90 90 90 90 95 95 95 95 95 95 100 100 100 100 100 100 100 105 105学习-----好资料 更多精品文档105 105 105 110 110 110 110 110 115 115 120N=55 则对称中心为()()^281/290N W W θ+===()()1/1/1/40.527.50.5 1.967.771011461/40.527.50.5 1.9647.22898853d n n U c n n U αα--=+--=--==+++=++=因为c 不是整数,则^+1k d L k k w w θ()()介于与之间,其中表示比大的最小整数即为8 ^L θ为70与75之间,即为72.5 []-%72.5,105H L 则的点估计为90 95的区间估计为习题五1.171(,24,25,50)0.005060988i p P i p ===∑值很小,则拒绝原假设即认为女职工的收入比男职工的低。
非参数统计参考答案
内容:, ,上机实践:将MASS数据包用命令library(MASS)加载到R中,调用自带“老忠实”喷泉数据集geyer,它有两个变量:等待时间waiting和喷涌时间duration,其中…(1) 将等待时间70min以下的数据挑选出来;(2) 将等待时间70min以下,且等待时间不等于57min的数据挑选出来;(3) 将等待时间70min以下喷泉的喷涌时间挑选出来;(4) 将喷涌时间大于70min喷泉的等待时间挑选出来。
解:读取数据的R命令:library(MASS);#加载MASS包data(geyser);#加载数据集geyserattach(geyser);#将数据集geyser的变量置为内存变量(1) 依题意编定R程序如下:sub1geyser=geyser[which(waiting<70),1];#提取满足条件(waiting<70)的数据,which(),读取下标sub1geyser[1:5];#显示子数据集sub1geyser的前5行[1] 57 60 56 50 54(2) 依题意编定R程序如下:Sub2geyser=geyser[which((waiting<70)&(waiting!=57)),1];#提取满足条件(waiting<70& (waiting!=57)的数据.Sub2geyser[1:5];#显示子数据集sub1geyser的前5行[1] 60 56 50 54 60 ……原数据集的第1列为waiting喷涌时间,所以用[which(waiting<70),2](3)Sub3geyser=geyser[which(waiting<70),2];#提取满足条件(waiting<70)的数据,which(),读取下标Sub3geyser[1:5];#显示子数据集sub1geyser的前5行[1] ……原数据集的第2列为喷涌时间,所以用[which(waiting<70),2](4)Sub4geyser=geyser[which(waiting>70),1];#提取满足条件(waiting<70)的数据,which(),读取下标Sub4geyser[1:5];#显示子数据集sub1geyser的前5行[1] 80 71 80 75 77…….如光盘文件中的数据,一个班有30名学生,每名学生有5门课程的成绩,编写函数实现下述要求:(1) 以的格式保存上述数据;(2) 计算每个学生各科平均分,并将该数据加入(1)数据集的最后一列;(3) 找出各科平均分的最高分所对应的学生和他所修课程的成绩;(4) 找出至少两门课程不及格的学生,输出他们的全部成绩和平均成绩;(5) 比较具有(4)特点学生的各科平均分与其余学生平均分之间是否存在差异。
非参数统计部分课后习题参考答案
课后习题参考答案第一章p23-252、(2)有两组学生,第一组八名学生的成绩分别为x1:100,99,99,100,99,100,99,99;第二组三名学生的成绩分别为x2:75,87,60。
我们对这两组数据作同样水平a=0.05的t检验(假设总体均值为u ):H 0:u=100 H 1:u<100。
第一组数据的检验结果为:df=7,t 值为3.4157,单边p 值为0.0056,结论为“拒绝H 0:u=100。
”(注意:该组均值为99.3750);第二组数据的检验结果为:df=2,t 值为3.3290,单边p值为0.0398;结论为“接受H 0:u=100。
”(注意:该组均值为74.000)。
你认为该问题的结论合理吗?说出你的理由,并提出该如何解决这一类问题。
答:这个结论不合理(6分)。
因为,第一组数据的结论是由于p-值太小拒绝零假设,这时可能犯第一类错误的概率较小,且我们容易把握;而第二组数据虽不能拒绝零假设,但要做出“在水平a时,接受零假设”的说法时,还必须涉及到犯第二类错误的概率。
(4分)然而,在实践中,犯第二类错误的概率多不易得到,这时说接受零假设就容易产生误导。
实际上不能拒绝零假设的原因很多,可能是证据不足(样本数据太少),也可能是检验效率低,换一个更有效的检验之后就可以拒绝了,当然也可能是零假设本身就是对的。
本题第二组数据明显是由于证据不足,所以解决的方法只有增大样本容量。
(4分)第三章p68-713、在某保险种类中,一次关于1998年的索赔数额(单位:元)的随机抽样为(按升幂排列): 4632,4728,5052,5064,5484,6972,7596,9480,14760,15012,18720,21240,22836,52788,67200。
王静龙《非参数统计分析》课后计算题参考标准答案
王静龙《非参数统计分析》课后习题计算题参考答案习题一1.One Sample t-test for a MeanSample Statistics for xN Mean Std. Dev. Std. Error-------------------------------------------------26 1.38 8.20 1.61Hypothesis TestNull hypothesis: Mean of x = 0Alternative: Mean of x ^= 0t Statistic Df Prob > t---------------------------------0.861 25 0.397695 % Confidence Interval for the MeanLower Limit: -1.93Upper Limit: 4.70则接受原假设认为一样习题二1.描述性统计习题三1.1{}+01=1339:6500:650013=BINOMDIST(13,39,0.5,1)=0.026625957S n H me H me P S +==<≤另外:在excel2010中有公式 BINOM.INV(n,p,a) 返回一个数值,它使得累计二项式分布的函数值大于或等于临界值a 的最小整数***0*0+1inf :2BINOM.INV(39,0.5,0.05)=141sup :1132S 1313n m i n d i n m m i n d d m i d αα==⎧⎫⎛⎫⎪⎪⎛⎫=≥⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫≤=-=⎨⎬ ⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭=≤=∑∑= 以上两种都拒绝原假设,即中位数低于65001.2****01426201inf :221inf :122BINOM.INV(40,0.5,1-0.025)=26d=n-c=40-26=14580064006200nn i c n m i n c c i n m m i x x me x αα==⎧⎫⎛⎫⎪⎪⎛⎫=≤⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫=≥-⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭====∑∑2.{}+01=4070:6500:65002402*(1-BINOMDIST(39,70,0.5,1))=0.281978922S n H me H me P S +==≠≥=则接受原假设,即房价中位数是65003.1{}+01=15521552527207911::22n 1552=5.33E-112S n H p H p P S φ+=+==>≥≈比较大,则用正态分布近似**+**0:=1552155252720791inf :221inf :122m=BINOM.INV(2079,0.5,0.975)=1084nn i c n m i S n n c c i n m m i αα===+=⎧⎫⎛⎫⎪⎪⎛⎫=≤⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫=≥-⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭∑∑另外则拒绝原假设,即相信孩子会过得更好的人多3.2P 为认为生活更好的成年人的比例,则1522=0.7465132079p 的比估计是:4.{}00.90610.90618154157860:65:6510.9060.094~(,)181541BINOMDIST(18153,157860,0.094,1)=0S n H P H P p S b n p P S +++===>=-=≥=-因为0〈0.05则拒绝原假设习题四1.()()++0.025+W =6+8+10+1+4+12+9+11+2+7=70p 2P W 70n=12c =65p 2P W 65=0.05≥≥符号秩和检验统计量:值为,当得所以值小于即拒绝原假设2.()()++0.025+W =2.5+2.5+7+7+7+7+10.5+14+14+14+14+14+17.5+17.5+19+20+23+24=234.5p 2P W 234.5n=25 c =236p 2P W 236=0.05≥≥符号秩和检验统计量:值为,当得所以值小于即接受原假设{}011826:0:02182*(1-BINOMDIST(17,25,0.5,1))=0.043285251S n H me H me P S +===≠≥=+符号检验:则拒绝原假设t t =0.861df=25 p=0.3976检验:统计量接受原假设3.(1)+0.0250.0250.025++=5+2+2=9833(1)322(3)0.052(9)0.05W n c n n d c P W P W ==+=-=≤=≤>查表可得:则 接受原假设Walsh 平均由小到大排列:50 55 60 65 65 70 70 70 75 75 75 80 80 80 80 80 80 80 85 85 85 8585 90 90 90 90 90 90 95 95 95 95 95 95 100 100 100 100 100 100 100 105 105105 105 105 110 110 110 110 110 115 115 120 N=55 则对称中心为()()^281/290N W W θ+===()()1/1/1/40.527.50.5 1.967.771011461/40.527.50.5 1.9647.22898853d n n U c n n U αα--=+--=--==+++=++=因为c 不是整数,则^+1k d L k k w w θ()()介于与之间,其中表示比大的最小整数即为8 ^L θ为70与75之间,即为72.5 []-%72.5,105H L 则的点估计为90 95的区间估计为习题五1.171(,24,25,50)0.005060988i p P i p ===∑值很小,则拒绝原假设即认为女职工的收入比男职工的低。
王静龙《非参数统计分析》教案
.引言一般统计分析分为参数分析与非参数分析,参数分析是指,知道总体分布,但其中几个参数的值未知,用统计量来估计参数值,但大部分情况,总体是未知的,这时候就不能用参数分析,如果强行用可能会出现错误的结果。
例如:分析下面的供应商的产品是否合格?合格产品的标准长度为(±),随即抽取n=100件零件,数据如下:表经计算,平均长度为cm x 4958.8=,非常接近中心位置,样本标准差为()1047.0112=--=∑=ni in x x s cm.一般产品的质量服从正态分布,),(~2δμN X 。
这说明产品有接近三分之一不合格,三分之二合格,所以需要更换供应厂 商,而用非参数分析却是另外一个结果。
以下是100个零件长度的分布表:这说明有90%的零件长度在)2.05.8(±cm 之间,有9%的零件不合格,所以工厂不需要换供应商。
例2 哪一个企业职工的工资高? 表两个企业职工的工资显然,企业1职工的工资高,倘若假设企业1与企业2的职工工资分别服从正态分布),(),,(22σσb N a N ,则这两个企业职工的工资比较问题就可以转化为一个参数的假设检验问题,原假设为b a H =:0,备择假设为b a H >:0 则 ))11(,(~2σnm b a N y x +-- 若0H 为真,则其中])()([2112122∑∑==-+--+=ni i m i i wy y x x n m S 拒绝域为:}325.1{)}20({90.0≥=≥t t t 检测值为:282.1=t故不能拒绝原假设,认为两企业的工资水平无差异。
也可以用值-P 检验由于1073.0)282.1)20((=≥t P故不能拒绝原假设,认为两企业的工资水平无差异。
这里我们采用的显着性水平为.但这个统计结论与实际数据不相符合。
主要是因为假设工资服从正态分布,这个假设是错误的,用错误的假设结合参数分析自然得出的结论不可靠。
王静龙《非参数统计分析》课后计算题参考的答案解析
WORD格式资料王静龙《非参数统计分析》课后习题计算题参考答案习题一1.One Sample t-test for a MeanSample Statistics for xN Mean Std. Dev. Std. Error-------------------------------------------------26 1.38 8.20 1.61Hypothesis TestNull hypothesis: Mean of x = 0Alternative: Mean of x ^= 0t Statistic Df Prob > t---------------------------------0.861 25 0.397695 % Confidence Interval for the MeanLower Limit: -1.93Upper Limit: 4.70则接受原假设认为一样习题二1.描述性统计专业整理专业整理习题三1.1{}+01=1339:6500:650013=BINOMDIST(13,39,0.5,1)=0.026625957S n H me H me P S +==<≤另外:在excel2010中有公式 BINOM.INV(n,p,a) 返回一个数值,它使得累计二项式分布的函数值大于或等于临界值a 的最小整数***0*0+1inf :2BINOM.INV(39,0.5,0.05)=141sup :1132S 1313n m i n d i n m m i n d d m i d αα==⎧⎫⎛⎫⎪⎪⎛⎫=≥⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫≤=-=⎨⎬ ⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭=≤=∑∑= 以上两种都拒绝原假设,即中位数低于65001.2WORD 格式资料专业整理****01426201inf :221inf :122BINOM.INV(40,0.5,1-0.025)=26d=n-c=40-26=14580064006200n ni c n m i n c c i n m m i x x me x αα==⎧⎫⎛⎫⎪⎪⎛⎫=≤⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫=≥-⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭====∑∑2.{}+01=4070:6500:65002402*(1-BINOMDIST(39,70,0.5,1))=0.281978922S n H me H me P S +==≠≥=则接受原假设,即房价中位数是65003.1{}+01=15521552527207911::22n 1552=5.33E-112S n H p H p P S φ+=+==>≥≈比较大,则用正态分布近似**+**0:=1552155252720791inf :221inf :122m=BINOM.INV(2079,0.5,0.975)=1084nn i c n m i S n n c c i n m m i αα===+=⎧⎫⎛⎫⎪⎪⎛⎫=≤⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫=≥-⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭∑∑另外则拒绝原假设,即相信孩子会过得更好的人多3.2P 为认为生活更好的成年人的比例,则WORD 格式资料专业整理1522=0.7465132079p 的比估计是:4.{}00.90610.90618154157860:65:6510.9060.094~(,)181541BINOMDIST(18153,157860,0.094,1)=0S n H P H P p S b n p P S +++===>=-=≥=-因为0〈0.05则拒绝原假设习题四1.()()++0.025+W =6+8+10+1+4+12+9+11+2+7=70p 2P W 70n=12c =65p 2P W 65=0.05≥≥符号秩和检验统计量:值为,当得所以值小于即拒绝原假设2.专业整理()()++0.025+W =2.5+2.5+7+7+7+7+10.5+14+14+14+14+14+17.5+17.5+19+20+23+24=234.5p 2P W 234.5n=25 c =236p 2P W 236=0.05≥≥符号秩和检验统计量:值为,当得所以值小于即接受原假设{}011826:0:02182*(1-BINOMDIST(17,25,0.5,1))=0.043285251S n H me H me P S +===≠≥=+符号检验:则拒绝原假设WORD 格式资料专业整理t t =0.861df=25 p=0.3976检验:统计量接受原假设3.(1)+0.0250.0250.025++=5+2+2=9833(1)322(3)0.052(9)0.05W n c n n d c P W P W ==+=-=≤=≤>查表可得:则 接受原假设Walsh 平均由小到大排列:50 55 60 65 65 70 70 70 75 75 75 80 80 80 80 80 80 80 85 85 85 8585 90 90 90 90 90 90 95 95 95 95 95 95 100 100 100 100 100 100 100 105 105专业整理N=55 则对称中心为()()^281/290N W W θ+===()()1/1/1/40.527.50.5 1.967.771011461/40.527.50.5 1.9647.22898853d n n U c n n U αα--=+--=--==+++=++=因为c 不是整数,则^+1k d L k k w w θ()()介于与之间,其中表示比大的最小整数即为8 ^L θ为70与75之间,即为72.5 []-%72.5,105H L 则的点估计为90 95的区间估计为习题五1.171(,24,25,50)0.005060988i p P i p ===∑值很小,则拒绝原假设即认为女职工的收入比男职工的低。
王静龙《非参数统计分析》(1-6章)教案---精品管理资料
引言一般统计分析分为参数分析与非参数分析,参数分析是指,知道总体分布,但其中几个参数的值未知,用统计量来估计参数值,但大部分情况,总体是未知的,这时候就不能用参数分析,如果强行用可能会出现错误的结果。
例如:分析下面的供应商的产品是否合格?合格产品的标准长度为(8.5±0.1),随即抽取n=100件零件,数据如下:表1。
18.503 8.508 8.498 8。
347 8。
494 8。
500 8。
498 8.500 8.502 8.501 8。
491 8.504 8。
502 8.503 8.501 8。
505 8.492 8。
497 8。
150 8.496 8。
501 8.489 8.506 8.497 8。
505 8。
501 8。
500 8。
499 8.490 8.493 8.501 8.497 8.501 8.498 8.503 8。
505 8.510 8。
499 8。
489 8.496 8.500 8。
503 8.497 8。
504 8。
503 8.506 8.497 8。
507 8。
346 8.310 8.489 8。
499 8.492 8。
497 8。
506 8。
502 8.505 8.489 8.503 8.492 8.501 8。
499 8.804 8。
505 8。
504 8.499 8。
506 8。
499 8。
493 8。
494 8。
490 8。
505 8。
511 8。
502 8。
505 8。
503 8.782 8.502 8.509 8。
499 8.498 8.493 8.897 8.504 8。
493 8。
494 7.780 8.509 8.499 8.503 8。
494 8.511 8。
501 8。
497 8。
493 8.501 8.495 8。
461 8.504 8。
691经计算,平均长度为cm x 4958.8=,非常接近中心位置8。
5cm,样本标准差为()1047.0112=--=∑=ni i n x x s cm 。
非参数统计参考答案
非参数统计是一种不依赖于总体分布假设的统计方法,它基于样本数据进行推断和分析。
以下是非参数统计中常见问题的一些参考答案:
秩和检验(Mann-Whitney U检验):
假设检验问题:用于比较两个独立样本的中位数是否相等。
参考答案:通过计算样本的秩和,然后使用Mann-Whitney U检验来比较两组样本的秩和,从而得出结论。
Kruskal-Wallis检验:
假设检验问题:用于比较三个或更多独立样本的总体分布是否相同。
参考答案:将各组样本合并,并对所有数据进行排序。
然后,使用秩和来计算每组的秩和总和,并使用Kruskal-Wallis检验来比较秩和之间的差异。
Wilcoxon符号秩检验:
假设检验问题:用于比较两个相关样本的中位数是否相等。
参考答案:对两组相关样本的差异取绝对值,并对其进行排序以获得符号秩。
然后,使用Wilcoxon符号秩检验来比较秩和之间的差异。
Friedmann检验:
假设检验问题:用于比较三个或更多相关样本的总体分布是否相同。
参考答案:将各组样本的差异取绝对值,并对其进行排序以获得符号秩。
然后,使用Friedmann 检验来比较秩和之间的差异。
Kendall秩相关系数:
相关性问题:用于衡量两个变量之间的非线性相关性。
参考答案:将变量的观察值转换为秩次,然后计算秩次之间的Kendall秩相关系数。
请注意,以上是非参数统计中常见问题的一些参考答案。
具体问题的回答可能会根据具体的研究设计、数据类型和分析目的而有所不同。
在实际应用中,建议根据具体情况选择适当的非参数统计方法,并根据具体数据进行分析和解释。
非参数统计和回归分析习题参考答案
非参数统计和回归分析习题参考答案班级: 姓名: 学号: 得分一、单项选择题:1、相关关系是指变量间的 ( D )A 、严格的函数关系B 、简单关系和复杂关系C 、严格的依存关系D 、不严格的依存关系 2、进行简单直线回归分析时,总是假定 ( A )。
A 自变量是非随机变量、因变量是随机变量 B 两变量都是随机变量 C 自变量是随机变量、因变量是确定性变量 D 两变量都不是随机变量 3、回归方程i i x y5.1123ˆ+=中的回归系数数值表明:当自变量每增加一个单位时,因变量 ( B )。
A 增加1.5个单位 B 平均增加1.5个单位 C 增加123个单位 D 平均增加123个单位4、设某种产品产量为 1000 件时,其生产成本为 30000 元,其中固定成本 6000 元,则总生产成本对产量的一元线性回归方程为: ( B ) A 、y=6+0.24x B 、y=6000+24x C 、y=24000+6x D 、y=24+6000x5、在回归分析中,要求对应的两个变量 ( B ) A.都是随机变量 B.不是对等关系 C.是对等关系 D.都不是随机变量6、下列现象的相关密切程度高的是 ( B )。
A 某商店的职工人数与商品销售额之间的相关系数为0.87B 流通费用率与商业利润率之间的相关系数为-0.94C 商品销售额与商业利润率之间的相关系数为0.51D 商品销售额与流通费用率之间的相关系数为-0.817.相关系数r =0表示 ( D ) (A )不存在相关关系 (B )存在平衡关系(C )两变量独立 (D )不存在线性相关关系8.若物价上涨,商品的需求量相应减少,那么物价与商品需求量之间的关系为 ( B )A 、不相关B 、负相关C 、正相关D 、复相关9、回归估计标准误差的剂量单位与 ( B )A 、自变量单位相同B 、因变量单位相同C 、相关系数单位相同D 、自变量、因变量的单位都不同10、在回归分析中,F 检验主要是用来检验 ( C )A 、相关系数的显著性B 、回归系数的显著性C 、线性关系的显著性D 、估计标准误差的显著性11、下列检验中不属于非参数统计方法的是 ( B )A 、总体是否服从正态分布B 、总体的方差值是否为某一个值C 、两组随机变量之间是否独立D 、样本的取得是否具有独立性12、下列情况中,最适合非参数统计方法的是 ( C ) A 、反映两个大学新生成绩的差别B 、反映两个法学毕业英语六级的及格率的差别C 、反映两个大学四年级同学对于就业前景看法的差别D 、反映两个大学在校生平均月支出的差别二、计算题1、一农场10年前在一鱼塘中按比例20:15:40:25投放了四种鱼,鲑鱼、鲈鱼、2、在对某城市家庭社会经济特性的调查中,一个市场研究公司想确定电话拥有数与汽车拥有数是否独立。
最新非参数统计部分课后习题参考答案
课后习题参考答案第一章p23-252、(2)有两组学生,第一组八名学生的成绩分别为x 1:100,99,99,100,99,100,99,99;第二组三名学生的成绩分别为x 2:75,87,60。
我们对这两组数据作同样水平a=0.05的t检验(假设总体均值为u ):H 0:u=100 H 1:u<100。
第一组数据的检验结果为:df=7,t 值为3.4157,单边p 值为0.0056,结论为“拒绝H 0:u=100。
”(注意:该组均值为99.3750);第二组数据的检验结果为:df=2,t 值为3.3290,单边p值为0.0398;结论为“接受H 0:u=100。
”(注意:该组均值为74.000)。
你认为该问题的结论合理吗?说出你的理由,并提出该如何解决这一类问题。
答:这个结论不合理(6分)。
因为,第一组数据的结论是由于p-值太小拒绝零假设,这时可能犯第一类错误的概率较小,且我们容易把握;而第二组数据虽不能拒绝零假设,但要做出“在水平a时,接受零假设”的说法时,还必须涉及到犯第二类错误的概率。
(4分)然而,在实践中,犯第二类错误的概率多不易得到,这时说接受零假设就容易产生误导。
实际上不能拒绝零假设的原因很多,可能是证据不足(样本数据太少),也可能是检验效率低,换一个更有效的检验之后就可以拒绝了,当然也可能是零假设本身就是对的。
本题第二组数据明显是由于证据不足,所以解决的方法只有增大样本容量。
(4分)第三章p68-713、在某保险种类中,一次关于1998年的索赔数额(单位:元)的随机抽样为(按升幂排列): 4632,4728,5052,5064,5484,6972,7596,9480,14760,15012,18720,21240,22836,52788,67200。
已知1997年的索赔数额的中位数为5064元。
(1)是否1998年索赔的中位数比前一年有所变化?能否用单边检验来回答这个问题?(4分) (2)利用符号检验来回答(1)的问题(利用精确的和正态近似两种方法)。
王静龙《非参数统计分析》(6章)课程教案
引言一般统计分析分为参数分析与非参数分析,参数分析是指,知道总体分布,但其中几个参数的值未知,用统计量来估计参数值,但大部分情况,总体是未知的,这时候就不能用参数分析,如果强行用可能会出现错误的结果。
例如:分析下面的供应商的产品是否合格?合格产品的标准长度为(8.5±0.1),随即抽取n=100件零件,数据如下:表1.18.503 8.508 8.498 8.347 8.494 8.500 8.498 8.500 8.502 8.501 8.491 8.504 8.502 8.503 8.501 8.505 8.492 8.497 8.150 8.496 8.501 8.489 8.506 8.497 8.505 8.501 8.500 8.499 8.490 8.493 8.501 8.497 8.501 8.498 8.503 8.505 8.510 8.499 8.489 8.496 8.500 8.503 8.497 8.504 8.503 8.506 8.497 8.507 8.346 8.310 8.489 8.499 8.492 8.497 8.506 8.502 8.505 8.489 8.503 8.492 8.501 8.499 8.804 8.505 8.504 8.499 8.506 8.499 8.493 8.494 8.490 8.505 8.511 8.502 8.505 8.503 8.782 8.502 8.509 8.499 8.498 8.493 8.897 8.504 8.493 8.494 7.780 8.509 8.499 8.503 8.494 8.511 8.501 8.497 8.493 8.501 8.495 8.461 8.504 8.691经计算,平均长度为cm x 4958.8=,非常接近中心位置8.5cm ,样本标准差为()1047.0112=--=∑=ni in x x s cm.一般产品的质量服从正态分布,),(~2δμN X 。
王静龙《非参数统计分析》(1-8章)教案讲课讲稿
.引言一般统计分析分为参数分析与非参数分析,参数分析是指,知道总体分布,但其中几个参数的值未知,用统计量来估计参数值,但大部分情况,总体是未知的,这时候就不能用参数分析,如果强行用可能会出现错误的结果。
例如:分析下面的供应商的产品是否合格?合格产品的标准长度为(8.5±0.1),随即抽取n=100件零件,数据如下:表1.18.503 8.508 8.498 8.347 8.494 8.500 8.498 8.500 8.502 8.501 8.491 8.504 8.502 8.503 8.501 8.505 8.492 8.497 8.150 8.496 8.501 8.489 8.506 8.497 8.505 8.501 8.500 8.499 8.490 8.493 8.501 8.497 8.501 8.498 8.503 8.505 8.510 8.499 8.489 8.496 8.500 8.503 8.497 8.504 8.503 8.506 8.497 8.507 8.346 8.310 8.489 8.499 8.492 8.497 8.506 8.502 8.505 8.489 8.503 8.492 8.501 8.499 8.804 8.505 8.504 8.499 8.506 8.499 8.493 8.494 8.490 8.505 8.511 8.502 8.505 8.503 8.782 8.502 8.509 8.499 8.498 8.493 8.897 8.504 8.493 8.494 7.780 8.509 8.499 8.503 8.494 8.511 8.501 8.497 8.493 8.501 8.495 8.461 8.504 8.691经计算,平均长度为cm x 4958.8=,非常接近中心位置8.5cm ,样本标准差为()1047.0112=--=∑=ni in x x s cm.一般产品的质量服从正态分布,),(~2δμN X 。
王静龙《非参数统计分析》(1-8章)教案讲课讲稿
.引言一般统计分析分为参数分析与非参数分析,参数分析是指,知道总体分布,但其中几个参数的值未知,用统计量来估计参数值,但大部分情况,总体是未知的,这时候就不能用参数分析,如果强行用可能会出现错误的结果。
例如:分析下面的供应商的产品是否合格?合格产品的标准长度为(8.5±0.1),随即抽取n=100件零件,数据如下:表1.18.503 8.508 8.498 8.347 8.494 8.500 8.498 8.500 8.502 8.501 8.491 8.504 8.502 8.503 8.501 8.505 8.492 8.497 8.150 8.496 8.501 8.489 8.506 8.497 8.505 8.501 8.500 8.499 8.490 8.493 8.501 8.497 8.501 8.498 8.503 8.505 8.510 8.499 8.489 8.496 8.500 8.503 8.497 8.504 8.503 8.506 8.497 8.507 8.346 8.310 8.489 8.499 8.492 8.497 8.506 8.502 8.505 8.489 8.503 8.492 8.501 8.499 8.804 8.505 8.504 8.499 8.506 8.499 8.493 8.494 8.490 8.505 8.511 8.502 8.505 8.503 8.782 8.502 8.509 8.499 8.498 8.493 8.897 8.504 8.493 8.494 7.780 8.509 8.499 8.503 8.494 8.511 8.501 8.497 8.493 8.501 8.495 8.461 8.504 8.691经计算,平均长度为cm x 4958.8=,非常接近中心位置8.5cm ,样本标准差为()1047.0112=--=∑=ni in x x s cm.一般产品的质量服从正态分布,),(~2δμN X 。
王静龙《非参数统计分析》(1-8章)教案
王静龙《非参数统计分析》(1-8章)教案.引言一般统计分析分为参数分析与非参数分析,参数分析是指,知道总体分布,但其中几个参数的值未知,用统计量来估计参数值,但大部分情况,总体是未知的,这时候就不能用参数分析,如果强行用可能会出现错误的结果。
例如:分析下面的供应商的产品是否合格?合格产品的标准长度为(8.5±0.1),随即抽取n=100件零件,数据如下:表1.18.503 8.508 8.498 8.347 8.494 8.500 8.498 8.500 8.502 8.501 8.491 8.504 8.502 8.503 8.501 8.505 8.492 8.497 8.150 8.496 8.501 8.489 8.506 8.497 8.505 8.501 8.500 8.499 8.490 8.493 8.501 8.497 8.501 8.498 8.503 8.505 8.510 8.499 8.489 8.496 8.500 8.503 8.497 8.504 8.503 8.506 8.497 8.507 8.346 8.310 8.489 8.499 8.492 8.497 8.506 8.502 8.505 8.489 8.503 8.492 8.501 8.499 8.804 8.505 8.504 8.499 8.506 8.499 8.493 8.494 8.490 8.505 8.511 8.502 8.505 8.503 8.782 8.502 8.509 8.499 8.498 8.493 8.897 8.504 8.493 8.494 7.780 8.509 8.499 8.503 8.494 8.511 8.501 8.497 8.493 8.501 8.495 8.461 8.504 8.691经计算,平均长度为cm x 4958.8=,非常接近中心位置8.5cm ,样本标准差为()1047.0112=--=∑=ni i n x x s cm.一般产品的质量服从正态分布,),(~2δμN X 。
王静龙《非参数统计分析》(1-8章)教案
.引言一般统计分析分为参数分析与非参数分析,参数分析是指,知道总体分布,但其中几个参数的值未知,用统计量来估计参数值,但大部分情况,总体是未知的,这时候就不能用参数分析,如果强行用可能会出现错误的结果。
例如:分析下面的供应商的产品是否合格?合格产品的标准长度为(8.5±0.1),随即抽取n=100件零件,数据如下:表1.18.503 8.508 8.498 8.347 8.494 8.500 8.498 8.500 8.502 8.501 8.491 8.504 8.502 8.503 8.501 8.505 8.492 8.497 8.150 8.496 8.501 8.489 8.506 8.497 8.505 8.501 8.500 8.499 8.490 8.493 8.501 8.497 8.501 8.498 8.503 8.505 8.510 8.499 8.489 8.496 8.500 8.503 8.497 8.504 8.503 8.506 8.497 8.507 8.346 8.310 8.489 8.499 8.492 8.497 8.506 8.502 8.505 8.489 8.503 8.492 8.501 8.499 8.804 8.505 8.504 8.499 8.506 8.499 8.493 8.494 8.490 8.505 8.511 8.502 8.505 8.503 8.782 8.502 8.509 8.499 8.498 8.493 8.897 8.504 8.493 8.494 7.780 8.509 8.499 8.503 8.494 8.511 8.501 8.497 8.493 8.501 8.495 8.461 8.504 8.691经计算,平均长度为cm x 4958.8=,非常接近中心位置8.5cm ,样本标准差为()1047.0112=--=∑=ni in x x s cm.一般产品的质量服从正态分布,),(~2δμN X 。
王静龙《非参数统计分析》(1-8章)教案汇编
.引言一般统计分析分为参数分析与非参数分析,参数分析是指,知道总体分布,但其中几个参数的值未知,用统计量来估计参数值,但大部分情况,总体是未知的,这时候就不能用参数分析,如果强行用可能会出现错误的结果。
例如:分析下面的供应商的产品是否合格?合格产品的标准长度为(8.5 _ 0.1),随即抽取n=100件零件,数据如下:表1.18.503 8.508 8.498 8.347 8.494 8.500 8.498 8.500 8.502 8.501 8.491 8.5048.502 8.503 8.501 8.505 8.492 8.497 8.150 8.496 8.501 8.489 8.506 8.4978.505 8.501 8.500 8.499 8.490 8.493 8.501 8.497 8.501 8.498 8.503 8.5058.510 8.499 8.489 8.496 8.500 8.503 8.497 8.504 8.503 8.506 8.497 8.5078.346 8.310 8.489 8.499 8.492 8.497 8.506 8.502 8.505 8.489 8.503 8.4928.501 8.499 8.804 8.505 8.504 8.499 8.506 8.499 8.493 8.494 8.490 8.5058.511 8.502 8.505 8.503 8.782 8.502 8.509 8.499 8.498 8.493 8.897 8.5048.493 8.494 7.780 8.509 8.499 8.503 8.494 8.511 8.501 8.497 8.493 8.5018.495 8.461 8.504 8.691经计算,平均长度为x - 8.4958cm,非常接近中心位置8.5cm,样本标准差为X j-X? n -1 = 0.1047 cm.—般产品的质量服从正态分布,X~N(・,2)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
王静龙《非参数统计分析》课后习题计算题参考答案习题一1. One Sample t-test for a Mea nSample Statistics for xN Mea n Std. Dev. Std. Error26 1.38 8.20 1.61Hypothesis TestNull hypothesis: Mea n of x = 0Alternative: Mea n of x A= 0t Statistic Df Prob > t0.861 25 0.397695 % Con fide nee In terval for the Mea nLower Limit: -1.93Upper Limit: 4.70则接受原假设认为一样习题二1.描述性统计习题二1.1S+=13 n 39H o: me 6500 H〔:me 6500PS 13 二BINOMDIST(13,39,0.5,1)=0.026625957另外:在excel2010中有公式BINOM.INV(n,p,a)返回一个数值,它使得累计二项式分布的函数值大于或等于临界值a的最小整数* 1 m nm inf m ■2 i 0 iBINO M」N V(39,0.5,0.05)=14* n1 *d nd=sup d : m 1 132 i 0 iS+13 d 13以上两种都拒绝原假设,即中位数低于65001.2n1infn **1 mn m inf m :-2 i o i BINOM.INV(40,0.5,1 -0.025)=26 d=n-c=40-26=14 x 14 5800 x 26 6400me x 2062002.S +=40 n 70H 0: me 6500 H 1: me 6500 2P S 402*(1-BIN0MDIST(39,70,0.5,1))=0.281978922则接受原假设,即房价中位数是 65003.1S +=1552 n 1552 527 2079inf m inf m=BINOM.INV(2079,0.5,0.975)=1084则拒绝原假设,即相信孩子会过得更好的人多3.2P 为认为生活更好的成年人的比例,则H 。
: p 出:pn 比较大,则用正态分布近似 P S 15521039.5-1552+0.5、519.75=5.33E-112另外:S +=1552n 1552 527 20792.p 的比估计是:1522=0.74651320794.S 18154 n 157860p 1 0.906 0.094S ~b(n,p) P S 18154 1 BIN0MDIST(18153,157860,0.094,1)=0因为0 〈 0.05则拒绝原假设习题四1.符号秩和检验统计量:+W =6+8+10+1+4+12+9+11+2+7=70 p 值为2P W + 70,当 n=12得5.025=65 所以p 值小于2P W + 65 =0.05 即拒绝原假设H 0 : 1~0.90665H 1 : P 0.90665符号秩和检验统计量:W +=2.5+2.5+7+7+7+7+10.5+14+14+14+14+14+ 17.5+17.5+19+20+23+24=234.5p 值为2P W + 234.5,当 n=25 得c °.°25=236 所以p 值小于2P W + 236 =0.05 即接受原假设符号检验:26+S 18 n H 。
:me 0 H 1 : me 02P S18 2*(1-BIN0MDIST(17,25,0.5,1))=0.043285251则拒绝原假设t检验:t 统计量=0.861 df=25 p=0.3976接受原假设3.(1)W+=5+2+2=9 n 8查表可得:C o.025 33n(n 1) 3d0.025 2 C0.025 32P(W+3) 0.052P(W+9) 0.05则接受原假设Walsh平均由小到大排列:50 55 60 65 65 70 70 70 7575 75 80 80 80 80 80 80 80 85 85 85 85 85 90 90 90 90 90 90 95 95 95 95 95 95 100 100 100 100 100 100 100 105 105105 105 105 110 110 110 110 110 115 115 120AN=55则对称中心为W N 1/2W28 90d n n 1 /4 0.5 U1 /^ n n 1 2n 1 /24 27.5 0.5 1.96 .10 11 21/24 7.77101146 c n n 1 /4 0.5 U1 /2、n n 1 2n 1 /24 27.5 0.5 1.96 ,10 11 21/24 47.22898853A因为c不是整数,则L介于w(k)与w(k+1)之间,其中k表示比d大的最小整数即为8AL为70与75之间,即为72.5则H-L的点估计为9095%的区间估计为72.5,105习题五1.122800 25200 26550 26550 26900 27350 28500 28950 29900 30150 30450 30450 30650 30800 31000 31300 31350 31350 31800 32050 32250 32350 32750 32900 33250 33550 33700 33950 34100 34800 35050 35200 35500 35600 35700 35900 36100 36300 36700 37250 37400 37750 38050 3820038200 38800 39200 39700 40400 410007p i 1P(i,24,25,50) 0.005060988P值很小,则拒绝原假设即认为女职工的收入比男职工的低。
1.2Wilcoxon 秩和W女=1+2+3.5+5+6+7+8+10+11.5+11.5+13+15+16+17.5+17.5+20+22+24+26+29+31+32+34+35+36+44.5=478因为N=i+m=50,查不到表,则用其渐进正态分布求解n=26,m=24,N=50, W女478+W女n(N 1)/2p=2P W 478 =-女=0.000327643Jmn (N 1)/12则拒绝原假设,认为女职工的收入低2.Wilcoxo n 秩和W B=1+2+3+4+5+6+8+10+12=51因为N=n+m=19,则用其渐进正态分布求解n=9,m=1O,N=19,Ws 51p=2P W+51 =2*W B n(N 1)/2B=0.00145086 2.mn(N 1)/12则拒绝原假设,认为A比B的作用好7.Wilcoxon 秩和W^月=1+5+7+8+10+11+16+18+19+20=115 因为n=n 1+ n2=20,n1=10,n 1 = 10,n=20, W1 月115所以,p=2P W+115查表可得:C o.O25 = 158因为,158>115,所以p值一定大于O.O5则接受原假设,认为11月和12月的波动相同位置参数检验:d nm/2 0.5 U1 /2, nm(N 1)/12 1O*1O/2 0.51.96.10*10*101/12 23.64c nm/2 0.5 U1 /2. nm(N 1)/12 1O*1O/2 0.51.96.10*10*101/12 76.36A AL介于w(k)与w(k+1)之间,其中k表示比d大的最小整数即为24 L =-29AU介于w c 1与w c之间,其中c表示比c小的最大整数即为76 U =17 所以,区间为:[-29,17]即O在区间内则认为11月和12月的波动相同8尺度参数检验:2212 12*4722*25 47*46所以渐进正态分布计算其p 值:M y - E M yp= 一=4.25641E-05 J D M y则认为较小M yia(R)2269.25E M yN 21212 3i 1 i i12N22*472 1 2884036.765957D M ynm N N 112 t 1t d tN4/2N N 21 /144796056.5-47*(47*47-1)/144202328.727322A y a(R) 346.5i 12 12 3(N+) ii i in —— 4N 12N =22* (47+1)-28^ =258.38297874*47 12*47D M y nm12 d 2 ( N+1) N N22*2548424245=6167.005039 47*46 16*47 所以渐进正态分布计算其p 值:则认为较大 综合:因为M y 比较小而A y 比较大,可知b 1且b 应该有b<1因为b<1,则认为机器一更有机会改进质量*答案是自己做的,但是有一次发现有个地方错了啊,还没改过来,仅作参考! E A y P= =0.869085147。