【清华】实验12-统计推断(011813)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

解:(1)设患胃溃疡的病人溶菌酶含量的均值为 µ1,标准差为 σ1;无胃溃疡 的人溶菌酶含量的均值为为 µ2,标准差为 σ2。由于所取样本数较多,并且未给 出分布类型,因此近似将两组总体看做正态分布处理。根据题意,建立如下原假
设和备择假设:

;:
由于两个总体的标准差也未知,故只能假设二者标准差一致,并采用双正态 总体均值的 t 检验,首先去显著性水平为 0.05,编写程序和运行结果如下:
116.96
h2 = 1 sig = 1.3241e-006 ci = 119.01
122.49
由此可以清晰地看出结果:
1 月份:接受原假设 H0,即认为“汽油的价格是 115 美分/gal”的说法是可 靠的,此时油价的置信区间为[113.34,116.96];
2 月份:拒绝原假设 H0,接受备择假设 H1,即认为“汽油的价格是 115 美分 /gal”的说法是不可靠的,此时油价的置信区间为[119.01,122.49]。
h=0; else
h=1; end end if tail==1 u=norminv(1-alpha); sig=1-normcdf(z); if z<=u
h=0; else
h=1; end
数学实验 焦阳 2009011813
end if tail==-1
u=norminv(alpha); sig=normcdf(z); if z>=u
注:以上结论都是基于显著性水平为 0.05 给出的。 (3)根据前两问的结果可知,2 月份的油价总体上要高出 1 月份,因此对油价 均值之差 µ2-µ1 建立原假设和备择假设:

;:
由于两个总体的标准差都未知,故而假设两者的标准差相等,并采用双总体 均值的 t 检验,编写程序和运行结果如下:
[h,sig,ci]=ttest2(x2,x1,0.05,0)
function [h,sig] = ztest01(x,n,p,alpha,tail) xbar=x/n; z=(xbar-p)/(p*(1-p)/n)^0.5; if tail==0
u=norminv(1-alpha/2); sig=2*(1-normcdf(abs(z))); if abs(z)<=u
x1=[0.2,10.4,0.3,0.4,10.9,11.3,1.1,2,12.4,16.2,2.1,17.6,18.9,3.3,3.8,20.7,4.5,4.8,24,25 .4,4.9,40,5,42.2,5.3,50,60,7.5,9.8,45]; x2=[0.2,5.4,0.3,5.7,0.4,5.8,0.7,7.5,1.2,8.7,1.5,8.8,1.5,9.1,1.9,10.3,2,15.6,2.4,16.1,2.5, 16.5,2.8,16.7,3.6,20,4.8,20.7,4.8,33];
机选择了一些加油站,得到某年 1 月和 2 月的数据如下: 1 月 119 117 115 116 112 121 115 122 116 118 1 月 109 112 119 112 117 113 114 109 109 118 2 月 118 119 115 122 118 121 120 122 128 116 2 月 120 123 121 119 117 119 128 126 118 125 (1) 分别用两个月的数据验证这种说法的可靠性; (2) 分别给出 1 月和 2 月汽油价格的置信区间(α=0.05); (3) 如何给出 1 月和 2 月汽油价格差的置信区间(α=0.05)。
115.15 xbar2 =
120.75 结果为:1 月的平均油价大致为 115.15 美分/gal,2 月的平均油价大致为 120.75 美分/gal,根据直观判断,“汽油的价格是 115 美分/gal”这种说法对于该地 1 月 份而言比较可靠,而对于 2 月份而言并不大可靠。当然,这只是一种直观的感觉, 如果要更准确的认识,需要进行定量的假设检验,这是后两问的内容。 (2)对油价的总体均值 µ 建立原假设和备择假设:
h=0; else
h=1; end end end 注:函数参数中 x 代表值为 1 的样本数量,n 表示样本容量,p 在本题中可 以表示合格率,广义地讲可以代表 0-1 分布的数学期望。 本题中:代入 p=0.9,α=0.05,x=43,n=50 等条件求解,运行结果如下:
p=0.9;alpha=0.05; x=43;n=50; [h,sig]=ztest01(x,n,p,alpha,-1) h=0 sig = 0.17289
3.题目 7: 为研究胃溃疡的病理,医院作了两组人胃液成分的试验,患胃溃疡的病人组
与无胃溃疡的对照组各取 30 人,胃液中溶菌酶含量见下表(溶菌酶是一种能破坏 某些细菌细胞壁的酶)。
病人
0.2 10.4 0.3 0.4 10.9 11.3 1.1 2 12.4 16.2 2.1 17.6 18.9 3.3 3.8 20.7 4.5 4.8 24 25.4
结果显示:应该接受原假设 H0,即认为在置信水平 95%的情况下,货品的 合格率不低于 90%,从而同意接收这批货物。
这似乎与直观感觉产生了矛盾,样本的合格率明明只有 86%,但是经过假设 检验之后的结果却告诉我们:应该认为货物总体的合格率不低于 90%。这种现象 显然是由于置信水平过高导致的。通俗地理解,正是因为乙方对于甲方比较信赖 (这可能来自于长期的合作经历或者外界的好评等因素),所以尽管样品的合格率 已经在一定程度上不满足原假设,但还是不足以推翻乙方信任度非常高的 90% 合格率的假设。
好是同一个加油站的数据,那么我们就可以将原始数据进行简单的处理,将来自
同一间加油站的油价相减,得到关于 µ2-µ1 的样本如下:
µ2-µ1
-1
2 0660 5
0
12 -2
µ2-µ1
11 11 2 7 0 6 14 17
9
7
对这一组样本所对应的总体均值进行区间估计,编写程序和运行结果如下:
[mu,sigma,muci,sigmaci]=normfit(x2-x1,0.05) mu = 5.6 sigma = 5.4715 muci =

依据中心极限定理,当样本数足够大时,有这样的近似结论:
即 z 近似服从标准正态分布,由此可对总体的合格率 p 建立如下的原假设和 备择假设:

;:
此为单侧假设,故取标准正态的 1-α 分位数 u1-α:由于


所以假设检验的准则是:

时接受 H0;反之拒绝 H0,接受 H1
由于 MATLAB 中没有 0-1 分布总体均值假设检验的内核函数,因此首先编 写函数文件,在进行调用,函数程序如下所示:
2.题目 5: 甲方向乙方成批供货,甲方承诺合格率为 90%,双方商定置信概率为 95%,
先从一批货中抽取 50 键,43 件为合格品,问乙方应否接收这批货物?你能为乙 方不接受它出谋划策吗?
问题分析:由于每一件货品只有合格与不合格两种状态,因此这是一个 0-1
分布总体均值的假设检验问题。设 X=1 表示合格,X=0 表示不合格,若将合格 率设为 p,则经计算得到 X 的特征数:
清华实验12统计推断011813
数学实验 焦阳 2009011813
实验 12 统计推断
化学工程系 分 9 班 焦阳 2009011813 【实验目的】
1.掌握数据的参数估计、假设检验的基本原理、算法,及用MATLAB实现的方法; 2.练习用这些方法解决实际问题。
【实验内容】
1.题目 2: 据说某地汽油的价格是 115 美分/gal,为了验证这种说法,一位司机开车随
h = 1 sig = 3.6952e-005
ci = 3.1727
8.0273
结果显示:在显著性水平为 0.05 的情况下,两个月油价差值的置信区间为
[3.1727,8.0273]。由第一问可知,样本均值之差为 5.6,恰好为此置信区间的中
值。
◆改变一种思路:
如果这名司机在做一次安排和周详的调研,以至于两个月中相对应的油价恰
可以看出,当置信水平为 90%时,依然能够接受原假设;而当置信水平进一 步下降到 80%的时候,就可以拒绝原假设,接受备择假设了。
所以,将置信水平下调至 80%,再进行假设检验和决策,最终的结果就是 乙方不接受此次这批货物。
数学实验 焦阳 2009011813
◆一点思考:
1.本题中通过下调置信度来拒收货物,而实际情况下,我认为,更为负责的 决策人应该采取这样的行动:首先,0-1 分布总体是经过中心极限定理的近似才 化为正态分布处理的,乙方既然对结果有所怀疑,可以要求甲方提供货物整体质 量上更为详尽的信息,例如分布、均值和标准差等等,这样做起假设检验来,结 果才更加可信;其次,在信息不足的情况下,应该尽可能多地取样本,保证信息 的全面性,也有利于中心极限定理的近似精度。总而言之,乙方在提高统计推断 准确度方面还有上升的空间;
解:(1)直接利用 1 月和 2 月的数据计算样本均值,利用样本均值估计总体均 值,再与 115 比较,命令和运行结果如下:
x1=[119,117,115,116,112,121,115,122,116,118,109,112,119,112,117,113,114,109,10 9,118]; x2=[118,119,115,122,118,121,120,122,128,116,120,123,121,119,117,119,128,126,11 8,125]; xbar1=mean(x1) xbar2=mean(x2) xbar1 =
3.0393
8.1607
sigmaci =
4照这种思路,在显著性水平为 0.05 的情况下,两个月油价差值 的置信区间为[3.0393,8.1607]。5.6 依然是此置信区间的中值。
综上可知:两种方法有一定的偏差,但中值相同,其中以第二种思路的置信 区间较大。
数学实验 焦阳 2009011813

;:
分别利用 1 月份和 2 月份的数据来进行假设检验,由于总体的标准差未知, 故而采用 t 检验,编写程序和运行结果如下:
数学实验 焦阳 2009011813
[h1,sig,ci]=ttest(x1,115,0.05,0)
[h2,sig,ci]=ttest(x2,115,0.05,0)
h1 = 0 sig = 0.86422 ci = 113.34
4.9 40 5 42.2 5.3 50 60 7.5 9.8 45
0.2 5.4 0.3 5.7 0.4 5.8 0.7 7.5 1.2 8.7 正常人 1.5 8.8 1.5 9.1 1.9 10.3 2 15.6 2.4 16.1
2.5 16.5 2.8 16.7 3.6 20 4.8 20.7 4.8 33 (1) 根据数据判断患胃溃疡病人的溶菌酶含量与“正常人”有无显著差别; (2) 若上表中患胃溃疡病人组的最后 5 个数据有误,去掉后再作判断。
那么,如果要拒绝接收这批货物,最直接的决策方案就是降低置信水平,重 新做假设检验。在此,我进行了两次实验,分别将置信水平降到 90%和 80%, 相应的 α 分别为 0.1 和 0.2,重新计算,命令及运行结果如下:
p=0.9;alpha=0.1; x=43;n=50; [hh,sig]=ztest01(x,n,p,alpha,-1) hh = 0 sig = 0.17289 p=0.9;alpha=0.2; x=43;n=50; [hhh,sig]=ztest01(x,n,p,alpha,-1) hhh = 1 sig = 0.17289
2.现实中存在置信水平下降的情形。比如,即使乙方接受假设检验的结果, 之后发现实际的来货质量差强人意,这样就会形成一种反馈效应,造成信任程度 降低。待到下一次的合作,乙方的置信水平一定会下调。同样合格率的样本连续 几次,很快就会被拒绝。这也间接说明品牌效应和业内评价的重要性。
3.当然,更直接的办法就是乙方提高要求,将合格率提升(经过计算大致要在 93%以上)到更高的水平,这样一来甲方的样本经过计算后无法符合要求,即可 以拒绝。但是,如果结合实际,通常这种合格率的标准应该会在双方的合同中写 明,具有法律效力,不允许某一方擅自临时改动。所以这种方法虽然在理论上可 行,但是事实上却不能这样去做
相关文档
最新文档