统计学第四版第七章答案

合集下载

《统计学》-第7章-习题答案

《统计学》-第7章-习题答案

第七章思考与练习参考答案1.答:函数关系是两变量之间的确定性关系,即当一个变量取一定数值时,另一个变量有确定值与之相对应;而相关关系表示的是两变量之间的一种不确定性关系,具体表示为当一个变量取一定数值时,与之相对应的另一变量的数值虽然不确定,但它仍按某种规律在一定的范围内变化。

2.答:相关和回归都是研究现象及变量之间相互关系的方法。

相关分析研究变量之间相关的方向和相关的程度,但不能确定变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况;回归分析则可以找到研究变量之间相互关系的具体形式,并可变量之间的数量联系进行测定,确定一个回归方程,并根据这个回归方程从已知量推测未知量。

3.答:单相关系数是度量两个变量之间线性相关程度的指标,其计算公式为:总体相关系数,样本相关系数。

复相关系数是多元线性回归分析中度量因变量与其它多个自变量之间的线性相关程度的指标,它是方程的判定系数2R 的正的平方根。

偏相关系数是多元线性回归分析中度量在其它变量不变的情况下两个变量之间真实相关程度的指标,它反映了在消除其他变量影响的条件下两个变量之间的线性相关程度。

4.答:回归模型假定总体上因变量Y 与自变量X 之间存在着近似的线性函数关系,可表示为t t t u X Y ++=10ββ,这就是总体回归函数,其中u t 是随机误差项,可以反映未考虑的其他各种因素对Y 的影响。

根据样本数据拟合的方程,就是样本回归函数,以一元线性回归模型的样本回归函数为例可表示为:tt X Y 10ˆˆˆββ+=。

总体回归函数事实上是未知的,需要利用样本的信息对其进行估计,样本回归函数是对总体回归函数的近似反映。

两者的区别主要包括:第一,总体回归直线是未知的,它只有一条;而样本回归直线则是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回归直线。

第二,总体回归函数中的0β和1β是未知的参数,表现为常数;而样本回归直线中的0ˆβ和1ˆβ是随机变量,其具体数值随所抽取的样本观测值不同而变动。

统计学贾俊平第四版第七章课后答案目前最全

统计学贾俊平第四版第七章课后答案目前最全

7.1从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。

(1) 样本均值的抽样标准差x σ等于多少?(2) 在95%的置信水平下,允许误差是多少?解:已知总体标准差σ=5,样本容量n =40,为大样本,样本均值x =25, (1)样本均值的抽样标准差x σ=n σ=405=0.7906 (2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E =nα/2σZ =1.96×0.7906=1.5496。

7.2 某快餐店想要估计每位顾客午餐的平均花费金额。

在为期3周的时间里选取49名顾客组成了一个简单随机样本。

(1)假定总体标准差为15元,求样本均值的抽样标准误差。

x nσ=49==2.143 (2)在95%的置信水平下,求边际误差。

x x t σ∆=⋅,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=2z α 因此,x x t σ∆=⋅2x z ασ=⋅0.025x z σ=⋅=1.96×2.143=4.2 (3)如果样本均值为120元,求总体均值 的95%的置信区间。

置信区间为:(),x x x x -∆+∆=()120 4.2,120 4.2-+=(115.8,124.2) 7.37.4 从总体中抽取一个n=100的简单随机样本,得到x =81,s=12。

要求:大样本,样本均值服从正态分布:2,xN n σμ⎛⎫ ⎪⎝⎭或2,s xN n μ⎛⎫⎪⎝⎭置信区间为:2x z x z n n αα⎛-+ ⎝n 100=1.2 (1)构建μ的90%的置信区间。

2z α=0.05z =1.645,置信区间为:()81 1.645 1.2,81 1.645 1.2-⨯+⨯=(79.03,82.97)(2)构建μ的95%的置信区间。

2z α=0.025z =1.96,置信区间为:()81 1.96 1.2,81 1.96 1.2-⨯+⨯=(78.65,83.35)(3)构建μ的99%的置信区间。

统计学课后习题答案(第四版)贾俊平(第4、5、7、10章)

统计学课后习题答案(第四版)贾俊平(第4、5、7、10章)

《统计学》第四版 第四章练习题答案众数:M o =1O;中位数:中位数位置=n+1/2=5.5 , M e =10 ;平均数:(2) Q L 位置=n/4=2.5, Q L =4+7/2=5.5 ; Q u 位置=3n/4=7.5 , Q u =12(4) 4.2 和 M O =23。

将原始数据排序后,计算中位数的位置为:中位数位置=n+1/2=13,第13个位置上的数值为23,所以中位数为 M e =23(2)Q L 位置=n/4=6.25, Q L ==19 ; Q u 位置=3n/4=18.75,Q u =26.5茎 叶 频数 5 5 1 6 6 7 8 3 71 3 4 8 85(3)第一种排队方式: 离散程度大于第二种排队方式。

(4 )选方法二,因为第二种排队方式的平均等待时间较短,且离散程度小于第一种排队方 式。

_ Z X i4.4 ( 1)X8223/30=274.14.1 ( 1 ) 二X i X =n96.9,6 102' (X i-X ) _156.4 42n -1, 9由于平均数小于中位数和众数,所以汽车销售量为左偏分布。

(1)从表中数据可以看出,年龄出现频数最多的是 19和23,故有个众数,即 M O =19(3)⑶平均数-A =600/25=24,标准差—(XLX)\ n —1210626.6525-1n(4) 偏态系数SK=1.08,峰态系数K=0.77(5) 分析:从众数、中位数和平均数来看,网民年龄在 23-24岁的人数占多数。

由于标准差较大,说明网民年龄之间有较大差异。

从偏态系数来看,年龄分布为右偏,由于偏态系数 1,所以,偏斜程度很大。

由于峰态系数为正值,所以为尖峰分布。

(1)茎叶图如下: 大于 4.3 —2'(X 一 X ) 4.080.714nn -1■ 8由于两种排队方式的平均数不同,所以用离散系数进行比较。

(2) X 二一^ =63/9=7, S = ■■n中位数位置=n+1/2=15.5 , M e=272+273/2=272.5(2) Q L位置=n/4=7.5, Q L==(258+261)/2=259.5 ; Q u 位置=3n/4=22.5 , Q u=(284+291)/2=287.5' (^-X ^ /3002-7 = 21.17 I n —1 \ 30—12100 +3000 +15004.5 (1)甲企业的平均成本=总成本/总产量=-2100 3000---- + ----- 15 20乙企业的平均成本=总成本/总产量=3255150015006255=18.293255 1500 1500 342____ + _____ + _____152030原因:尽管两个企业的单位成本相同, 但单位成本较低的产品在乙企业的产量中所占比重较 大,因此拉低了总平均成本。

应用统计学(第四版) 第7章案例题目及答案

应用统计学(第四版)  第7章案例题目及答案

应用统计学(第四版)第7章案例题目及答案案例分析题一个纺织品制造商收到一个很大的用于制作制服的衣料订单,这些衣料由4条不同的染色流水线进行染色,每条流水线每天生产的衣料数量大致相同。

通常,如果订单数量不是很大,只会用到一条流水线来完成订单,因为这样衣料的图案亮度会控制得较好,而不同流水线染色的图案亮度总会有些差异。

但是这个订单很大,要同时用到4条流水线,这时候需要通过使所有生产的衣料的图案亮度的方差最小化来尽可能使图案保持一致。

最近,顾客抱怨图案亮度的差异太大了。

因此决定对4条流水线生产的衣料图案亮度进行方差分析检验。

从每条流水线随机抽取样本并测量亮度,测量值在0~100之间,数据如下表所示。

要求:(1) 在 =0.05的显著性水平下进行检验并给出你的结论。

(2) 哪两条流水线染色的衣料的平均亮度有明显的不同?(3) 在生产过程中停止某一流水线进行亮度调整的成本很高,如果只能将一条流水线停下来调整,应该调整哪一条呢?应该将其调整到多少亮度值才能使所染色的衣料的图案尽可能保持一致?答案P207四、案例分析因F=10.590967> F crit=2.7826004或P-value=1.526E-05<α=0.05,拒绝原假设H0,即不同流水线对衣料图案的亮度有显著影响。

(2)利用Fisher最小显著差异(LSD)方法进行多重比较,可判断哪些均值间有显著差异。

t分布的自由度为n-k=56-4=52,所以/20.025(52)t tα==2.0066,MSE=6.2109,有关样本均值差的绝对值及相应的LSD计算结果如下表所示:判断:若均值差绝对值大于相应的LSD就拒绝H0,表明它们之间衣料平均亮度有显著差异;否则不拒绝H0,不能认为它们之间有显著差异。

因此,根据上表计算结果判断如下:流水线1和2,流水线1和3,流水线2和4,流水线3和4它们之间衣料的图案的平均亮度有明显的不同。

(3)我们把各样本均值与样本总均值进行比较,从中找出偏离样本总均值最大者,则停止该流水线并将其图案亮度调整到样本总均值,能够使所染色衣料的图案亮度尽可能保持一致。

统计学课后习题答案_(第四版)4.5.7.8章

统计学课后习题答案_(第四版)4.5.7.8章

《统计学》第四版 第四章练习题答案4.1 (1)众数:M 0=10; 中位数:中位数位置=n+1/2=5.5,M e =10;平均数:6.91096===∑nxx i(2)Q L 位置=n/4=2.5, Q L =4+7/2=5.5;Q U 位置=3n/4=7.5,Q U =12 (3)2.494.1561)(2==-=∑-n i s x x (4)由于平均数小于中位数和众数,所以汽车销售量为左偏分布。

4.2 (1)从表中数据可以看出,年龄出现频数最多的是19和23,故有个众数,即M 0=19和M 0=23。

将原始数据排序后,计算中位数的位置为:中位数位置= n+1/2=13,第13个位置上的数值为23,所以中位数为M e =23(2)Q L 位置=n/4=6.25, Q L ==19;Q U 位置=3n/4=18.75,Q U =26.5(3)平均数==∑nx x i600/25=24,标准差65.612510621)(2=-=-=∑-n i s x x(4)偏态系数SK=1.08,峰态系数K=0.77(5)分析:从众数、中位数和平均数来看,网民年龄在23-24岁的人数占多数。

由于标准差较大,说明网民年龄之间有较大差异。

从偏态系数来看,年龄分布为右偏,由于偏态系数大于1,所以,偏斜程度很大。

由于峰态系数为正值,所以为尖峰分布。

4.3 (1(2)==∑nx x i63/9=7,714.0808.41)(2==-=∑-n i s x x (3)由于两种排队方式的平均数不同,所以用离散系数进行比较。

第一种排队方式:v 1=1.97/7.2=0.274;v 2=0.714/7=0.102.由于v 1>v 2,表明第一种排队方式的离散程度大于第二种排队方式。

(4)选方法二,因为第二种排队方式的平均等待时间较短,且离散程度小于第一种排队方式。

4.4 (1)==∑nx x i8223/30=274.1中位数位置=n+1/2=15.5,M e =272+273/2=272.5(2)Q L 位置=n/4=7.5, Q L ==(258+261)/2=259.5;Q U 位置=3n/4=22.5,Q U =(284+291)/2=287.5(3) 17.211307.130021)(2=-=-=∑-n i s x x4.5 (1)甲企业的平均成本=总成本/总产量=41.193406600301500203000152100150030002100==++++乙企业的平均成本=总成本/总产量=29.183426255301500201500153255150015003255==++++原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。

统计学贾俊平_第四版课后习题答案第七章

统计学贾俊平_第四版课后习题答案第七章

7.11 (1) 解:已知n=50,1a -=0.9522,ss x z xz nn a aæö-×+×ç÷èø=81.822981.8229101.491.966,101.491.9665050æö-´+´ç÷èø= (100.89,101.91)(2)解:已知n=50,1a -=0.95,2z a =00.0225z =1.96,样本比率p=(50-5)/50=0.9 则食品合格率的95%的置信区间:()()2211,p p p p p zp z nna aæö--ç÷-×+×ç÷èø=()()0.910.90.910.90.9 1.91.966,0.9 1.91.9665050æö---´+´ç÷èø=(0.8168,0.9832)7.22 (1)由题知,该题为大样本,方差已知,则有21m m -的95%的置信区间为:176.12100201001696.1)2325()(2221212/21±=+´±-=+±-n s n s z x x a即(0.824,3.176)(2m m -的95%的置信区间为:()()64.42112212212/21±=÷÷øöççèæ+-+±-n n s n ntxxpa 即(—2.64,6.64) (3)由题知,该题为小样本,方差不同, 则有21m m -的95%的置信区间为:()()64.42112212212/21±=÷÷øöççèæ+-+±-n n s n n tx x p a 即(—2.64,6.64) (4)由题知,该题为小样本,样本量不等,方差相等,则合并估计量为()()713128524211212222112==-+-+-=n n s n s n s p 则有21m m -的95%的置信区间为:()()02.42112212212/21±=÷÷øöççèæ+-+±-n n s n n tx x p a 即(—2.02,6.02) ,2z a =00.0225z =1.96。

统计学第四版第七章课后题最全答案

统计学第四版第七章课后题最全答案
7.23下表就是由4对观察值组成得随机样本。
配对号
来自总体A得样本
来自总体B得样本
1
2
3
4
2
5
10
8
0
7
6
5
(1)计算A与B各对观察值之差,再利用得出得差值计算与。
=1、75,=2、62996
(2)设分别为总体A与总体B得均值,构造得95%得置信区间。
解:小样本,配对样本,总体方差未知,用t统计量
均值=1、75,样本标准差s=2、62996
(2)已知:E=0、1,=0、8,=0、05,=1、96
应抽取得样本量为:=≈62
7.20
(1)构建第一种排队方式等待时间标准差得95%得置信区间。
解:估计统计量
经计算得样本标准差=3、318
置信区间:
=0、95,n=10,==19、02,==2、7
==(0、1075,0、7574)
因此,标准差得置信区间为(0、3279,0、8703)
(3)已知=0、01,=2、58
由于n=100为大样本,所以总体均值得99%得置信区间为:
=812、58*813、096,即(77、94,84、096)
7、5(1)已知=3、5,n=60,=25,=0、05,=1、96
由于总体标准差已知,所以总体均值得95%得置信区间为:
=251、96*250、89,即(24、11,25、89)
7、4(1)已知n=100,=81,s=12, =0、1,=1、645
由于n=100为大样本,所以总体均值得90%得置信区间为:
=811、645*811、974,即(79、026,82、974)
(2)已知=0、05,=1、96
由于n=100为大样本,所以总体均值得95%得置信区间为:

统计学(第四版)课后题答案

统计学(第四版)课后题答案

者比平均分数高 出 1 个标准差,而在 B 项测试中只高出平均分数 0.5 个标准差,由于 A 项 测试的标准化值高于 B 项测试,所以 A 项测试比较理想。 3.10 通过标准化值来判断,各天的标准化值如下表 日期 周一 周二 周三 周四 周五 周六 周日 标准化值 Z 3 -0.6 -0.2 0.4 -1.8 -2.2 0 周一和周六两天失去了控制。
-15~-10 10 -10~-5 13 -5~0 12 0~5 4 5~10 7 合计 60 (3)直方图(略) 。 2.9 (1)直方图(略) 。 (2)自学考试人员年龄的分布为右偏。 2.10(1)茎叶图如下
A班 数据个数 树 叶 树茎 B班 树叶 数据个数பைடு நூலகம்
0 3 59 2 1 4 4 0448 4 2 97 5 122456677789 12 11 97665332110 6 011234688 9 23 98877766555554443332100 7 00113449 8 7 6655200 8 123345 6 6 632220 9 011456 6 0 10 000 3 (2)A 班考试成绩的分布比较集中,且平均分数较高;B 班考试成绩的分 布比 A 班分散, 且平均成绩较 A 班低。 2.11(略) 。 2.12(略) 。 2.13(略) 。 2.14(略) 。 2.15箱线图如下: (特征请读者自己分析)
2 4.1 (1)200。 (2)5。 (3)正态分布。 (4) (100 1) 。
4.2 (1)32。 (2)0.91。 4.3 0.79。 4.4 (1) x 25 ~ N (17,2 2 ) 。 (2) x100 ~ N (17,1) 。 4.5 (1)1.41。 (2)1.41,1.41,1.34。 4.6 (1)0.4。 (2)0.024 。 (3)正态分布。 4.7 (1)0.050,0.035,0.022,016。 (2)当样本量增大时,样本比例的标准 差越来越小。 4.8 (1) (2)E=4.2; (3) (115.8,124.2) 。 x 2.14 ; 4.9 (87819,121301) 。 4.10(1)81±1.97; (2)81±2.35; (3)81±3.10。 4.11(1) (24.11,25.89) ; (2) (113.17,126.03) ; (3) (3.136,3.702) 4.12(1) (8687,9113) ; (2) (8734 ,9066) ; (3) (8761,9039) ; (4) (8682, 9118) 。 4.13(2.88,3.76) ;(2.80,3.84);(2.63,4.01)。 4.14(7.1,12.9) 。 4.15(7.18,11.57) 。 4.16(1) (148.9,150.1) ; (2)中心极限定理。 4.17(1) (100.9,123.7) ; (2) (0.017,0.183) 。 4.18(15.63,16.55) 。 4.19(10.36,16.76) 。

统计学(贾俊平四版)七练习题详细答案

统计学(贾俊平四版)七练习题详细答案

第七章 练习题参考答案7.1 (1)已知σ=5,n=40,x =25,α=0.05,z205.0=1.96样本均值的抽样标准差σx=nσ=79.0405=(2)估计误差(也称为边际误差)E=z 2αnσ=1.96*0.79=1.557.2(1)已知σ=15,n=49,x =120,α=0.05,z205.0=1.96(2)样本均值的抽样标准差σx=nσ==4915 2.14估计误差E=z 2αnσ=1.96*=4915 4.2(3)由于总体标准差已知,所以总体均值μ的95%的置信区间为: nx z σα±=120±1.96*2.14=120±4.2,即(115.8,124.2)7.3(1)已知σ=85414,n=100,x =104560,α=0.05,z205.0=1.96由于总体标准差已知,所以总体均值μ的95%的置信区间为: nx z σα±=104560±1.96*=10085414104560±16741.144即(87818.856,121301.144)7.4(1)已知n=100,x =81,s=12,α=0.1,z 21.0=1.645由于n=100为大样本,所以总体均值μ的90%的置信区间为:ns x z 2α±=81±1.645*=1001281±1.974,即(79.026,82.974)(2)已知α=0.05,z205.0=1.96由于n=100为大样本,所以总体均值μ的95%的置信区间为:ns x z 2α±=81±1.96*=1001281±2.352,即(78.648,83.352)(3)已知α=0.01,z201.0=2.58由于n=100为大样本,所以总体均值μ的99%的置信区间为:ns x z 2α±=81±2.58*=1001281±3.096,即(77.94,84.096)7.5(1)已知σ=3.5,n=60,x =25,α=0.05,z205.0=1.96由于总体标准差已知,所以总体均值μ的95%的置信区间为: nx z σα±=25±1.96*=60.5325±0.89,即(24.11,25.89)(2)已知n=75,x =119.6,s=23.89,α=0.02,z 202.0=2.33由于n=75为大样本,所以总体均值μ的98%的置信区间为:ns x z 2α±=119.6±2.33*=759.823119.6±6.43,即(113.17,126.03)(3)已知x =3.419,s=0.974,n=32,α=0.1,z21.0=1.645由于n=32为大样本,所以总体均值μ的90%的置信区间为:ns x z 2α±=3.419±1.645*=3274.90 3.419±0.283,即(3.136,3.702)7.6(1)已知:总体服从正态分布,σ=500,n=15,x =8900,α=0.05,z205.0=1.96由于总体服从正态分布,所以总体均值μ的95%的置信区间为:nx z σα2±=8900±1.96*=155008900±253.03,即(8646.97,9153.03)(2)已知:总体不服从正态分布,σ=500,n=35,x =8900,α=0.05,z205.0=1.96虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的95%的置信区间为:nx z σα2±=8900±1.96*=355008900±165.65,即(8734.35,9065.65)(3)已知:总体不服从正态分布,σ未知, n=35,x =8900,s=500,α=0.1,z 21.0=1.645虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的90%的置信区间为:ns x z 2α±=8900±1.645*=355008900±139.03,即(8760.97,9039.03)(4)已知:总体不服从正态分布,σ未知, n=35,x =8900,s=500,α=0.01,z 01.0=2.58虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的99%的置信区间为:ns x z 2α±=8900±2.58*=355008900±218.05,即(8681.95,9118.05)7.7 已知:n=36,当α=0.1,0.05,0.01时,相应的z21.0=1.645,z205.0=1.96,z201.0=2.58根据样本数据计算得:x =3.32,s=1.61由于n=36为大样本,所以平均上网时间的90%置信区间为:ns x z 2α±=3.32±1.645*=361.61 3.32±0.44,即(2.88,3.76)平均上网时间的95%置信区间为:ns x z 2α±=3.32±1.96*=361.61 3.32±0.53,即(2.79,3.85)平均上网时间的99%置信区间为:ns x z 2α±=3.32±2.58*=361.61 3.32±0.69,即(2.63,4.01)7.8 已知:总体服从正态分布,但σ未知,n=8为小样本,α=0.05,)(18t05.0-=2.365根据样本数据计算得:x =10,s=3.46 总体均值μ的95%的置信区间为:ns x t α±=10±2.365*=83.4610±2.89,即(7.11,12.89)7.9 已知:总体服从正态分布,但σ未知,n=16为小样本,α=0.05,)(116t205.0-=2.131根据样本数据计算得:x =9.375,s=4.113从家里到单位平均距离的95%的置信区间为:ns x t α±=9.375±2.131*=144.1139.375±2.191,即(7.18,11.57)7.10 (1)已知:n=36,x =149.5,α=0.05,z205.0=1.96由于n=36为大样本,所以零件平均长度的95%的置信区间为:ns x z 2α±=149.5±1.96*=361.93149.5±0.63,即(148.87,150.13)(2)在上面的估计中,使用了统计中的中心极限定理。

统计学第七章课后题及答案解析

统计学第七章课后题及答案解析

第七章 一、单项选择题1.按指数所包括的范围不同, 可以把它分为( )A.个体指数和总指数 B .数量指标指数和质量指标指数C.综合指数和平均指数 D.定基指数和环比指数2. 某集团公司为了反映所属各企业劳动生产率水平的提高情况 ,需要编制(A.质量指标综合指数B.数量指标综合指数C.可变构成指数D.固定构成指数3.在一般情况下,商品销售量指数和工资水平指数的同度量因素分别为( 商品销售量、平均工资水平 单位商品销售价格、职工人数 下列指数中属于数量指标指数的是 产品价格指数 产量指数 下面属于价格指数的是(B .商品销售量、职工人数D.单位商品销售价格、平均工资水平 )B .单位成本指数 D.劳动生产率指数5. A.工RQ 1 氓Q 1B -F 1Q 1ZFO Q OC.QZP0QoD E pQ oZP0Q O6. A.7. 某商品价格发生变化,现在的10%B. 90% 固定构成指数的公式是(100元只值原来的 C. 110%)90元,则价格指数为(D. 111%A. C.1. A. D.2. A. C. E.3. A. D.4.A. C. ZX i F i ZF iZX 1F 1ZF I... ZX P F O 1F0 D. ZX O F^ IXo F oIX 0F 1ZF iZFoIX 1F 0ZF O、多项选择题下列属于数量指标指数的有( 产量指数单位产品成本指数 下列表述正确的是( 综合指数是先综合后对比 平均数指数必须使用全面资料 固定构成指数受总体结构影响 同度量因素的作用有( 同度量作用 B.比较作用E. )B.销售量指数E.职工人数指数C.价格指数B .平均数指数是先对比后综合 D.平均数指数可以使用固定权数联系作用平衡作用c.权数作用对某商店某时期商品销售额的变动情况进行分析,其指数体系包括( 销售量指数B.销售价格指数总平均价格指数 D.销售额指数 E.个体指数若用某企业职工人数和劳动生产率的分组资料来进行分析时,该企业总的劳动生产率的A.C.4.A.C.变动主要受到()A.企业全部职工人数变动的影响B.企业劳动生产率变动的影响C.企业各类职工人数在全部职工人数中所占比重的变动影响D.企业各类工人劳动生产率的变动影响E.受各组职工人数和相应劳动生产率两因素的影响6.下列指数中,属于拉氏指数的有()' Q1P01 0 1 01 1 1 1P0Q0 P0Q1 C X Q0 P0 P0Q1 Q0 P1 7.某企业产品总成本报告期为183150元,比基期增长10%单位成本综合指数为104%则()A.总成本指数110%B.产量增长了5.77%C.基期总成本为166500元D.单位成本上升使总成本增加了7044元E.产量增产使总成本增加了9606元三、判断题1.综合指数的编制方法是先综合后对比。

概率论与数理统计(理工类,第四版)吴赣昌主编课后习题答案第七章

概率论与数理统计(理工类,第四版)吴赣昌主编课后习题答案第七章

写在前面:由于答案是一个个复制到word中,比较耗时耗力,故下载收取5分,希望需要的朋友给予理解和支持!PS:网上有一些没经我同意就将我的答案整合、转换成pdf,放在文库里的,虽然是免费的,但是窃取了我的劳动成果,希望有心的朋友支持我一下,下载我的原版答案。

第七章假设检验7.1 假设检验的基本概念习题1样本容量n确定后,在一个假设检验中,给定显著水平为α,设此第二类错误的概率为β,则必有(). (A)α+β=1;(B)α+β>1;(C)α+β<1;(D)α+β<2.解答:应选(D).当样本容量n确定后,α,β不能同时都很小,即α变小时,β变大;而β变小时,α变大.理论上,自然希望犯这两类错误的概率都很小,但α,β的大小关系不能确定,并且这两类错误不能同时发生,即α=1且β=1不会发生,故选(D).习题2设总体X∼N(μ,σ2),其中σ2已知,若要检验μ,需用统计量U=X¯-μ0σ/n.(1)若对单边检验,统计假设为H0:μ=μ0(μ0已知),H1:μ>μ0,则拒绝区间为;(2)若单边假设为H0:μ=μ0,H1:μ<μ0,则拒绝区间为(给定显著性水平为α,样本均值为X¯,样本容量为n,且可记u1-α为标准正态分布的(1-α)分位数).解答:应填(1)U>u1-α;(2)U<uα.由单侧检验及拒绝的概念即可得到.习题3如何理解假设检验所作出的“拒绝原假设H0”和“接受原假设H0”的判断?解答:拒绝H0是有说服力的,接受H0是没有充分说服力的. 因为假设检验的方法是概率性质的反证法,作为反证法就是必然要“推出矛盾”,才能得出“拒绝H0”的结论,这是有说服力的,如果“推不出矛盾”,这时只能说“目前还找不到拒绝H0的充分理由”,因此“不拒绝H0”或“接受H0”,这并没有肯定H0一定成立. 由于样本观察值是随机的,因此拒绝H0,不意味着H0是假的,接受H0也不意味着H0是真的,都存在着错误决策的可能.当原假设H0为真,而作出了拒绝H0的判断,这类决策错误称为第一类错误,又叫弃真错误,显然犯这类错误的概率为前述的小概率α:α=P(拒绝H0|H0为真);而原假设H0不真,却作出接受H0的判断,称这类错误为第二类错误,又称取伪错误,它发生的概率β为β=P(接受H0|H0不真).习题4犯第一类错误的概率α与犯第二类错误的概率β之间有何关系?解答:一般来说,当样本容量固定时,若减少犯一类错误的概率,则犯另一类错误的概率往往会增大.要它们同时减少,只有增加样本容量n.在实际问题中,总是控制犯第一类错误的概率α而使犯第二类错误的概率尽可能小.α的大小视具体实际问题而定,通常取α=0.05,0.005等值.习题5在假设检验中,如何理解指定的显著水平α?解答:我们希望所作的检验犯两类错误的概率尽可能都小,但实际上这是不可能的. 当样本容量n固定时,一般地,减少犯其中一个错误的概率就会增加犯另一个错误的概率. 因此,通常的作法是只要求犯第一类错误的概率不大于指定的显著水平α,因而根据小概率原理,最终结论为拒绝H0较为可靠,而最终判断力接受H0则不大可靠,其原因是不知道犯第二类错误的概率β究竟有多少,且α小,β就大,所以通常用“H0相容”,“不拒绝H0”等词语来代替“接受H0”,而“不拒绝H0”还包含有再进一步作抽样检验的意思.习题6在假设检验中,如何确定原假设H0和备择假设H1?解答:在实际中,通常把那些需要着重考虑的假设视为原假设H0,而与之对应的假设视为备择假设H1.(1)如果问题是要决定新方案是否比原方案好,往往将原方案取假设,而将新方案取为备择假设;(2)若提出一个假设,检验的目的仅仅是为了判断这个假设是否成立,这时直接取此假设为原假设H0即可.习题7假设检验的基本步骤有哪些?解答:根据反证法的思想和小概率原理,可将假设检验的步骤归纳如下:(1)根据问题的要求,提出原理假设H0和备择假设H1.(2)根据检验对象,构造检验统计量T(X1,X2,⋯,Xn),使当H0为真时,T有确定的分布.(3)由给定的显著水平α,查统计量T所服从的分布表,定出临界值λ,使P(∣T∣>λ)=α,或P(T>λ1)=P(T<λ2)=α/2,从而求出H0的拒绝域:∣T∣>λ或T>λ1,T<λ2.(4)由样本观察值计算统计量T的观察值t.(5)作出判断,将t的值与临界值比较大小作出结论:当t∈拒绝域量时,则拒绝H0,否则,不拒绝H0,即认为在显著水平α下,H0与实际情况差异不显著.习题8假设检验与区间估计有何异同?解答:假设检验与区间估计的提法虽不同,但解决问题的途径是相通的. 参数θ的置信水平为1-α的置信区间对应于双边假设检验在显著性水平α下的接受域;参数θ的置信水平为1-α的单侧置信区对应于单边假设检验在显著性水平α下的接受域.在总体的分布已知的条件下,假设检验与区间估计是从不同的角度回答同一个问题. 假设检验是判别原假设H0是否成立,而区间估计解决的是“多少”(或范围),前者是定性的,后者是定量的.习题9某天开工时,需检验自动包装工作是否正常. 根据以往的经验,其装包的质量在正常情况下服从正态分布N(100,1.52)(单位:kg).现抽测了9包,其质量为:99.3,98.7,100.5,101.2,98.3,99.7,99.5,102.0,100.5.问这天包装机工作是否正常?将这一问题化为假设检验问题. 写出假设检验的步骤(α=0.05).解答:(1)提出假设检验问题H0:μ=100,H1:μ≠100;(2)选取检验统计量U:U=X¯-1001.59,H0成立时, U∼N(0,1);(3)α=0.05,uα/2=1.96,拒绝域W={∣u∣>1.96};(4)x¯≈99.97,∣u∣=0.06.因∣u∣<uα/2=1.96,故接受H0,认为包装机工作正常.习题10设总体X∼N(μ,1),X1,X2,⋯,Xn是取自X的样本. 对于假设检验H0:μ=0,H1:μ≠0,取显著水平α,拒绝域为W={∣u∣>uα/2},其中u=nX¯,求:(1)当H0成立时, 犯第一类错误的概率α0;(2)当H0不成立时(若μ≠0),犯第二类错误的概率β.解答:(1)X∼N(μ,1),X¯∼N(μ,1/n),故nX¯=u∼N(0,1).α0=P{∣u∣>uα/2∣μ=0}=1-P{-uα/2≤u≤uα/2}=1-[Φ(uα/2)-Φ(-uα/2)]=1-[(1-α2)-α2]=α,即犯第一类错误的概率是显著水平α.(2)当H0不成立,即μ≠0时,犯第二类错误的概率为β=P{∣u∣≤uα/2∣E(X)=μ}=P{-uα/2≤u≤uα/2∣E(X)=μ}=P{-uα/2≤nX¯≤uα/2∣E(X)=μ}=P{-uα/2-nμ≤n(X¯-μ)≤uα/2-nμ∣E(X)=μ}=Φ(uα/2-nμ)-Φ(-uα/2-nμ).注1当μ→+∞或μ→-∞时,β→0.由此可见,当实际均值μ偏离原假设较大时,犯第二类错误的概率很小,检验效果较好.注2当μ≠0但接近于0时,β≈1-α.因α很小,故犯第二类错误的概率很大,检验效果较差.7.2 单正态总体的假设检验习题1已知某炼铁厂铁水含碳量服从正态分布N(4.55,0.1082).现在测定了9炉铁水,其平均含碳量为4.484.如果估计方差没有变化,可否认为现在生产的铁水平均含碳量仍为4.55(α=0.05)?解答:本问题是在α=0.05下检验假设H0:μ=4.55,H1:μ≠4.55.由于σ2=0.1082已知,所以可选取统计量U=X¯-4.550.108/9,在H0成立的条件下,U∼N(0,1),且此检验问题的拒绝域为∣U∣=∣X¯-4.550.108/9∣>uα/2,这里u=4.484-4.550.108/9≈-1.833,uα/2=1.96.显然∣u∣=1.833<1.96=uα/2.说明U没有落在拒绝域中,从而接受H0,即认为现在生产之铁水平均含碳量仍为4.55.习题2要求一种元件平均使用寿命不得低于1000小时,生产者从一批这种元件中随机抽取25件,测得其寿命的平均值为950小时. 已知该种元件寿命服从标准差为σ=100小时的正态分布,试在显著性水平α=0.05下确定这批元件是否合格?设总体均值为μ,μ未知,即需检验假设H0:μ≥1000,H1:μ<1000.解答:检验假设H0:μ≥1000,H1:μ<1000.这是单边假设检验问题. 由于方差σ2=0.05,故用u检验法. 对于显著性水平α=0.05,拒绝域为W={X¯-1000σ/n<-uα.查标准正态分布表,得u0.05=1.645.又知n=25,x¯=950,故可计算出x¯-1000σ/n=950-1000100/25=-2.5.因为-2.5<-1.645,故在α=0.05下拒绝H0,认为这批元件不合格.习题3打包机装糖入包,每包标准重为100kg.每天开工后,要检验所装糖包的总体期望值是否合乎标准(100kg).某日开工后,测得9包糖重如下(单位:kg):99.398.7100.5101.298.399.799.5102.1100.5打包机装糖的包得服从正态分布,问该天打包机工作是否正常(α=0.05)?解答:本问题是在α=0.05下检验假设H0:μ=100,H1:μ≠100.由于σ2未知,所以可选取统计量T=X¯-100S/n,在H0成立的条件下,T∼t(n-1),且此检验问题的拒绝域为∣T∣=∣X¯-100S/n∣>tα/2(n-1),这里t=x¯-100s/n≈99.978-1001.2122/9≈-0.0544,t0.025(8)=2.306.显然∣t∣=0.0544<2.306=t0.025(8),即t未落在拒绝域中,从而接受H0,即可以认为该天打包工作正常.习题4机器包装食盐,假设每袋盐的净重服从正态分布,规定每袋标准含量为500g,标准差不得超过10g.某天开工后,随机抽取9袋,测得净重如下(单位:g):497,507,510,475,515,484,488,524,491,试在显著性水平α=0.05下检验假设:H0:μ=500,H1:μ≠500.解答:x¯=499,s≈16.031,n=9,t=(x¯-μ0)sn=499-50016.0319=-0.1871,α=0.05,t0.025(8)=2.306.因∣t∣<t0.025(8),故接受H0,认为该天每袋平均质量可视为500g.习题5从清凉饮料自动售货机,随机抽样36杯,其平均含量为219(mL),标准差为14.2mL,在α=0.05的显著性水平下,试检验假设:H0:μ=μ0=222,H1:μ<μ0=222.解答:设总体X∼N(μ,σ2),X代表自动售货机售出的清凉饮料含量,检验假设H0:μ=μ0=222(mL),H1:μ<222(mL).由α=0.05,n=36,查表得t0.05(36-1)=1.6896,拒绝域为W={t=x¯-μ0s/n<-tα(n-1).计算t值并判断:t=219-22214.2/36≈-1.27>-1.6896,习题6某种导线的电阻服从正态分布N(μ,0.0052).今从新生产的一批导线中抽取9根,测其电阻,得s=0.008Ω,对于α=0.05,能否认为这批导线电阻的标准差仍为0.005?解答:本问题是在α=0.05下检验假设H0:σ2=0.0052,H1:σ2≠0.0052.选取统计量χ2=n-1σ2S2,在H0成立的条件下,χ2∼χ2(n-1),且此检验问题的拒绝域为χ2>χα/22(n-1)或χ2<χ1-α/22(n-1).这里χ2=9-10.0052s2=80.0052×0.0082=20.48,χ0.9752(8)=2.18,χ0.0252(8)=17.5.显然χ2落在拒绝域中,从而拒绝H0,即不能认为这批导线电阻的标准差仍为0.005.习题7某厂生产的铜丝,要求其折断力的方差不超过16N2.今从某日生产的铜丝中随机抽取容量为9的样本,测得其折断力如下(单位:N):289,286,285,286,285,284,285,286,298,292设总体服从正态分布,问该日生产的铜线的折断力的方差是否符合标准(α=0.05)?解答:检验问题为H0:σ2≤16,H1:σ2>16,n=9,s2≈20.3611,χ2=8×s216≈10.181,α=0.05,χ0.052(8)=15.507.因χ2<χ0.052(8)=15.507,故接受H0,可认为铜丝的折断力的方差不超过16N2.习题8过去经验显示,高三学生完成标准考试的时间为一正态变量,其标准差为6min.若随机样本为20位学生,其标准差为s=4.51,试在显著性水平α=0.05下,检验假设:H0:σ≥6,H1:σ<6.解答:H0:σ≥6,H1:σ<6.α=0.05,n-1=19,s=4.51,χ0.952(19)=10.117.拒绝域为W={χ2<10.117}.计算χ2值χ2=(20-1)×4.51262≈10.74.因为10.74>10.117,故接受H0,认为σ≥6.习题9测定某种溶液中的水分,它的10个测定值给出s=0.037%,设测定值总体服从正态分布,σ2为总体方差,σ2未知,试在α=0.05水平下检验假设:H0:σ≥0.04%,H1:σ<0.04%.解答:在α=0.05下,拒绝域为W={(n-1)S2σ02<χ1-α2(9).查χ2分布表得χ0.952(9)=3.325.计算得(n-1)s2σ02=(10-1)×(0.037\per)2(0.04\per)2≈7.7006>3.325,未落入拒绝域,故接受H0.sw=(5-1)×(1.971)2+(4-1)×(1.167)25+4-2≈1.674.查表得t0.005(7)=1.895.算得t=2.86-2.075-01.67415+14≈0.699<1.895.因为0.699<1.895,故不拒绝H0,认为此药无效.习题3据现在的推测,矮个子的人比高个子的人寿命要长一些.下面给出美国31个自然死亡的总统的寿命,将他们分为矮个子与高个子2类,列表如下:矮个子总统8579679080高个子总统6853637088746466606078716790737177725778675663648365假设2个寿命总体均服从正态分布且方差相等,试问这些数据是否符合上述推陈出推测(α=0.05)?解答:设μ1,μ2分别为矮个子与高个子总统的平均寿命,则检验问题为H0:μ1≤μ2,H1:μ1>μ2,n1=5,x¯=80.2,s1≈8.585,n2=26,y¯≈69.15,s2≈9.315,sw=4×8.5852+9.315229≈9.218,n1n2n1+n2≈2.048,t=(80.2-69.15)9.218×2.048≈2.455,α=0.05,t0.05(29)=1.6991,因t>t0.05(29)=1.6991,故拒绝H0,认为矮个子总统的寿命比高个子总统寿命长.习题4在20世纪70年代后期人们发现,酿造啤酒时,在麦芽干燥过程中形成致癌物质亚硝基二甲胺(NDMA).到了20世纪80年代初期,人们开发了一种新的麦芽干燥过程,下面给出了分别在新、老两种过程中形成的NDMA含量(以10亿份中的份数计):故拒绝H0,认为新、老过程中形成的NDMA平均含量差大于2.习题5有两台车床生产同一种型号的滚珠. 根据过去的经验,可以认为这两台车床生产的滚珠的直径都服从正态分布. 现要比较两台车床所生产滚珠的直径的方差,分别抽出8个和9个样品,测得滚珠的直径如下(单位:mm).甲车床xi:15.014.515.215.514.815.115.214.8乙车床yi:15.215.014.815.215.015.014.815.114.8问乙车床产品的方差是否比甲车床的小(α=0.05)?解答:以X,Y分别表示甲,乙二车床产品直径.X∼N(μ1,σ12),Y∼N(μ2,σ22),X,Y独立. 检验假设H0:σ12=σ22,H1:σ22<σ22.用F检验法, 在H0成立时F=S12S22∼F(n1-1,n2-1).由已知数据算得x¯≈15.01,y¯≈14.99,s12≈0.0955,s22≈0.0261,n1=8,n2=9,α=0.05.拒绝域为Rα={F>Fα(n1-1,n2-1)}.查F分布表得F0.05(8-1,9-1)=3.50.计算F值F=s12/s22=0.0955/0.0261≈3.66.因为3.66>3.50,故应否定H0,即认为乙车床产品的直径的方差比甲车床的小.习题6某灯泡厂采用一项新工艺的前后,分别抽取10个灯泡进行寿命试验. 计算得到:采用新工艺前灯泡寿命的样本均值为2460小时. 样本标准差为56小时;采用新工艺后灯泡寿命的样本均值为2550小时,样本标准差为48小时. 设灯泡的寿命服从正态分布,是否可以认为采用新工艺后灯泡的平均寿命有显著提高(α=0.01)?解答:(1)检验假设H0:σ12=σ22,H1:σ12≠σ22.应选取检验统计量F=S12/S22,若H0真, 则F∼F(m-1,n-1);对于给定的检验水平α=0.01,查自由度为(9,9)的F分布表得F0.005(9,9)=6.54;已知m=n=10,s1=56,s2=48,由此得统计量F的观察值为F=562/482≈1.36;因为F<F0.005(9,9),所以接受原假设H0,即可认为这两个总体的方差无显著差异.(2)检验假设H0′:μ1=μ2,H1′:μ1<μ2.按上述关于双总体方差的假设检验的结论知这两个总体的方差未知但相等,σ12=σ22,所以应选取检验统计量:T=X¯-Y¯(m-1)S12+(n-1)S22m+n-2(1m+1n),若H0′真,则T∼t(m+n-2);对给定的检验水平α=0.01,查自由度为m+n-2=18的t分布表得临界值计算t值t=z¯-0sz/n=-0.1-00.141/5≈-1.59>-2.776,故接受H0:μz=0,即在α=0.05下,认为两种分析方法所得的均值结果相同.7.4 关于一般总体数学期望的假设检验习题1设两总体X,Y分别服从泊松分布P(λ1),P(λ2),给定显著性水平α,试设计一个检验统计量,使之能确定检验H0:λ1=λ2,H1:λ1≠λ2的拒绝域,并说明设计的理论依据.解答:因非正态总体,故宜用大样统计,设X¯=1n1∑i=1n1Xi,S12=1n1-1∑i=1n1(Xi-X¯)2;Y¯=1n2∑i=1n2Yi,S22=1n2-1∑i=1n2(Yi-Y¯)2.\because(X¯-Y¯)-(λ1-λ2)S12n1+S22n2→N(0,1)∴可选用样本函数u=(X¯-Y¯)-(λ1-λ2)S12n1+S22n2作为拒绝域的检验统计量.习题2设某段高速公路上汽车限制速度为104.6km/h,现检验n=85辆汽车的样本,测出平均车速为x¯=106.7km/h,已知总体标准差为σ=13.4km/h,但不知总体是否服从正态分布. 在显著性水平α=0.05下,试检验高速公路上的汽车是否比限制速度104.6km/h显著地快?解答:设高速公路上的车速为随机变量X,近似有X∼N(μ,σ2),σ=13.4km/h,要检验假设H0:μ=μ0=104.6,H1:μ>104.6.α=0.05,n=85,uα=u0.05=1.645.拒绝域W={u=x¯-μ0σ/n>uα.由x¯=106.7,σ=13.4,μ0=104.6,n=85得u=106.7-104.613.4/85≈1.44<1.645.因为1.44<1.645,所以接受H0,即要α=0.05显著性水平下,没有明显的证据说明汽车行驶快于限制速度.习题3某药品广告上声称该药品对某种疾病和治愈率为90%,一家医院对该种药品临床使用120例,治愈85人,问该药品广告是否真实(α=0.02)?解答:设该药品对某种疾病的治愈率为p,随机变量X为X={1,临床者使用该药品治愈0,反之则X∼b(1,p),问题该归结为检验假设:H0:p=0.9,H1:p≠0.9.由于n=120足够大,可以用u检验法,所给样值(x1,x2,⋯,x120)中有85个1,35个0,所以x¯=1120∑i=1120xi=1120∑i=1851=85120≈0.71,又p0=0.9,以之代入统计量U得U的观察值为∣u∣=∣0.71-0.9∣0.9×0.1120=6.94>u0.01=2.33,故拒绝H0,即认为该药品不真实.习题4一位中学校长在报纸上看到这样的报道:“这一城市的初中学生平均每周看8小时电视.”她认为她所领导的学校,学生看电视时间明显小于该数字. 为此,她向她的学校的100名初中学生作了调查,得知平均每周看电视的时间x¯=6.5小时,样本标准差为s=2小时,问是否可以认为这位校长的看法是对的(α=0.05)?解答:检验假设H0:μ=8,H1:μ<8.由于n=100,所以T=X¯-μS/n近似服从N(0,1)分布,α=0.05,u0.05=1.645.又知x¯=6.5,s=2,故计算得t=6.5-82/100=-7.5,否定域W={X¯-8S/n<-u0.05.因为-7.5<-1.645,故否定H0,认为这位校长的看法是对的.习题5已知某种电子元件的使用寿命X(h)服从指数分布e(λ),抽查100个元件,得样本均值x¯=950(h),能否认为参数λ=0.001(α=0.05)?解答:由题意知X∼e(λ),E(X)=1/λ,D(X)=1/λ2,故当n充分大时u=x¯-1/λ1nλ=(x¯-1λ)λn=(λx¯-1)n(0,1).现在检验问题为H0:λ=0.001,H1:λ≠0.001,样本值u=(0.001×950-1)×100=0.5,α=0.05,u0.025=1.96.因∣u∣<u0.025=1.96,故接受H0,即可认为参数λ=0.001(即元件平均合适用寿命为1000h).习题6某产品的次品率为0.17,现对此产品进行新工艺试验,从中抽取400检查,发现次品56件,能否认为这项新工艺显著地影响产品质量(α=0.05)?解答:检验问题为H0:p=0.17,H1:p≠0.17,由题意知⌢p=mn=56400=0.14,u=(⌢p-p0)p0q0n=0.14-0.170.17×0.83×400≈-1.597,α=0.05,u0.025=1.96.因∣u∣<u0.025=1.96,故接受H0,即认为新工艺没有显著地影响产品质量.习题7某厂生产了一大批产品,按规定次品率p≤0.05才能出厂,否则不能出厂,现从产品中随机抽查50件,发现有4件次品,问该批产品能否出厂(α=0.05)?解答:问题归结为在α=0.05下,检验假设H0:p≤0.05,H1:p>0.05.这是一个单侧检验问题,用u检验法,H0的拒绝域为U=X¯-p0p0(1-p0)n>uα.已知n=50,p0=0.05,x¯=450=0.08,代入U的表达式得u=0.08-0.050.05×0.9550≈0.97<uα=u0.05=1.645,故接受H0,即认为这批产品可以出厂.习题8从选区A中抽取300名选民的选票,从选区B中抽取200名选民的选票,在这两组选票中,分别有168票和96票支持所提候选人,试在显著水平α=0.05下,检验两个选区之间对候选人的支持是否存在差异. 解答:这是两个比率的比较问题,待检假设为H0:p1=p2,H1:p1≠p2.由题设知n=300,μn=168,m=200,μm=96,p1=168320=0.56,p2=96200=0.48,p=μn+μmm+n=264500=0.528.U0∼=p1-p2p(1-p)(1n+1m)=0.56-0.480.528×0.472×1120≈1.755,由P{∣U∼∣>1.96}=α=0.05,得拒绝域∣U∼∣>1.96,因为U0∼=1.755<1.96,故接受H0,即两个选区之间无显著差异.7.5 分布拟合检验Ai k概率pi npi频数fi(fi-npi)2(fi-npi)2npiA001/108085250.3125A111/108093169 2.1125A221/108084160.2A331/10807910.0125A441/10807840.05A551/108069121 1.5125A661/108074360.45A771/10807181 1.0125A881/108091121 1.5125A991/108076160.2∑18007.375由于当H0为真时,χ2=∑i=0k(fi-npi)2npi∼χ2(k-1-r),且此检验问题的拒绝域为χ2≥χα2(k-1-r).这里χ2=7.375,查表知χ0.052(10-1-0)=χ0.052(9)=16.9,显然χ2=7.375<16.9=χ0.052(9),即χ2未落在拒绝域中,所以接受H0,即认为这个正20面体是由均匀材料制面的.习题2根据观察到的数据疵点数0 1 2 3 4 5 6频数fi 14 27 26 20 7 3 3检验整批零件上的疵点数是否服从泊松分布(α=0.05).解答:设X表示整批零件上的疵点数,则本问题是在α=0.05下检验假设H0:P{X=i}=λie-λi!,i=0,1,2,⋯.由于在H0中参数λ未具体给出,所以先估计λ的值. 由极大似然估计法得λ=x¯=1100(0×14+1×27+2×26+3×20+4×7+5×3+6×3)=2.将试验的所有可能结果分为7个互不相容的事件A0,A1,⋯,A7, 当H0成立时,P{X=i}有估计值p0=P{X=0}=e-2≈0.135335,p1=P{X=1}=2e-2≈0.27067,p2=P{X=2}=2e2≈0.270671,p3=P{X=3}≈0.180447,p4=P{X=4}=2/3e-2≈0.090224,p5=P{X=5}=4/15e-2≈0.036089, p6=P{X=6}=4/45e-2≈0.0120298. 列表如下:Ai k 概率pi npi 频数fi (fi-npi)2 (fi-npi)2npiA0 A1 A2 A3 A4 A5 A6 0 1 2 3 4 5 6 0.1353350.270671 0.270671 0.180447 0.090224 0.036089 0.0120298 13.5335 27.0671 27.0672 18.0447 9.02243.60891.2029813.83428 14 27 26 2073313 0.2176 0.0045 1.1387 3.8232 0.6960 0.01608 0.000166 0.04207 0.2118740.050310∑1000.3205当H0为真时,χ2=∑i=0k(fi-npi)2npi ∼χ2(k-1-r),且此检验问题的拒绝域为χ2≥χα2(k-1-r), 这里χ2=0.3205, 查表知χ0.052(5-1-1)=χ0.052(3)=7.815. 显然 χ2=0.3205<7.815=χ0.052(3).即χ2未落在拒绝域中,接受H0, 故可认为整批零件上的疵点数服从泊松分布.习题3检查了一本书的100页,记录各页中印刷错误的个数,其结果为错误个数fi0 1 2 3 4 5 6 ≥7含fi 个错误的页数 36 40 19 2 0 2 1 0问能否认为一页的印刷错误个数服从泊松分布(取α=0.05)? 解答:检验假设H0: 一页的印刷错误个数X 服从泊松分布, P{X=i}=λie -λi!,i=0,1,2,⋯.H0 不成立. 先估计未知参数λλ=x¯=1/100(0×36+1×40+2×19+3×2+4×0+5×2+6×1)=1. 在H0成立下pi =P {X=i}=(λ)ie-λi!=e-1i!,i=0,1,2,⋯. 用χ2检验法χ2=∑i =1k(fi-npi )2npi ∼χ2(k -r-1). 本题中r=1, 其中fi 为频数. H0的拒绝域为 Rα={χ2>χα2(k -r-1)}. 列表计算如下:n=100, 对每个{X=i}计算pi ,npi ,fi-npi ,(fi-npi )2/(npi )(i=1,2,⋯,7). 要求每一个npi ≥5.计算χ2值χ2=0.0170+0.2801+0.0202+1.1423=1.4596.习题6下表记录了2880个婴儿的出生时刻:试问婴儿的出生时刻是否服从均匀分布U[0,24](显著性水平α=0.05)?解答:原假设H0:F0(x), 由F0(x)算得pi=F0(i)-F0(i-1)=124,npi=2880×124=120 (i=1,2,⋯,24),于是χ2=∑i=124(fi-npi)2npi≈40.47,对α=0.05, 自由度n-1=23, 查χ2-分布表,得χα2(n-1)=35.17,因为χ2=40.47>35.17, 所以拒绝H0, 即可以认为婴儿出生时刻不服从均匀分布U[0,24].总习题解答习题1下面列出的是某工厂随机选取的20只部件的装配时间(min):9.8,10.4,10.6,9.6,9.7,9.9,10.9,11.1,9.6,10.2,10.3,9.6,9.9,11.2,10.6,9.8,10.5,10.1,10.5,9.7.设装配时间的总体服从正态分布N(μ,σ2),μ,σ2均未知,是否可以认为装配时间的均值显著地大于10(取α=0.05)?解答:检验假设H0:μ≤μ0=10,H1:μ>10.已知n=20,α=0.05,由数据算得x¯=10.2,s≈0.5099.因σ2未知,故用t检验法,拒绝域为W={X¯-μ0S/n>tα(n-1).计算得x¯-μ0s/n=10.2-100.5099/20≈1.7541.查t分布表得t0.05(19)=1.7291.因为1.7541>1.7291,故拒绝H0,可以认为装配时间的均值显著地大于10.习题2某地早稻收割根据长势估计平均亩产为310kg,收割时,随机抽取了10块,测出每块的实际亩产量为x1,x2,⋯,x10,计算得x¯=110∑i=110xi=320.如果已知早稻亩产量X服从正态分布N(μ,144),显著性水平α=0.05,试问所估产量是否正确?解答:这是一个正态分布总体,方差已知,对期望的假设检验问题,如果估计正确,则应有μ=310,因此我们先将问题表示成两个假设:①H0:μ=310,H1:μ≠310.接下来就要分析样本值来确定是接受H0,还是接受H1.当H0为真时,统计量②U=X¯-31012/10∼N(0,1),从而有③P{∣U∣>1.96}=0.05,拒绝域为(-∞,-1.96)∪(1.96,+∞).④计算U0=∣320-310∣12/n≈2.64>1.96,即拒绝H0,也就是有理由不相信H0是真的,故认为估产310kg不正确.习题3设某次考试的考生成绩服从正态分布,从中随机地抽取36位考生的成绩,算得平均成绩为66.5分,样本标准差为15分,问在显著水平0.05下,是否可认为这次考试全体考生的平均成绩为70分?并给出检验过程.(1)设这次考试全体考生的平均成绩X∼N(μ,σ2),则待检验假设H0:μ=70,备择假设H1:μ≠70;(2)在H0成立条件下选择统计量T=X¯-μ0S/n∼t(n-1);(3)在显著性水平0.05下,查t分布表,找出临界值tα/2(n-1)=t0.025(35)=2.0301,则拒绝域为(-∞,-2.0301)∪(2.0301,+∞);(4)计算t=∣66.5-70∣15/36=1.4∈(-2.0301,2.0301),故接受H0,因此可认为这次考试全体考生的平均成绩为70分.习题4设有来自正态总体的容量为100的样本,样本均值x¯=2.7,μ,σ2均未知,而∑i=1n(xi-x¯)2=225,在α=0.05水平下,检验下列假设(1)H0:μ=3,H1:μ≠3;(2)H0:σ2=2.5,H1:σ2≠2.5.解答:(1)由题意知n=100,x¯=2.7,s=199×225≈1.508,t=(2.7-3)1.508×100≈-1.9894,α=0.05,t0.025(99)≈t0.025(100)=1.984.因∣t∣=1.9894>t0.025(99)=1.984,故拒绝H0,即认为μ≠3.(2)由题意知χ2=∑i=1n(x1-x¯)22.5=2252.5=90,α=0.05,χ0.0252(99)≈χ0.0252(100)=129.56,χ0.9752(99)≈χ0.9752(100)=74.22,因χ0.9752(99)<χ2=90<χ0.0252(99),故接受H0,即可以认为σ2=2.5.习题5设某大学的男生体重X为正态总体,X∼N(μ,σ2),欲检验假设:H0:μ=68kg,H1:μ>68kg.已知σ=5,取显著性水平α=0.05,若当真正均值为69kg时,犯第二类错误的概率不超过β=0.05,求所需样本大小.解答:由第一类、第二类错误及分位数的定义,易于证明:对于某个给定的δ>0(∣μ-μ0∣≥δ),样本容量n应满足:n≥(uα+uβ)2σ2δ2.因为α=β=0.05,故uα=uβ=1.645,对其对立假设μ=69而言,取δ=1,则n=(uα+uβ)2σ2δ2=(1.645+1.645)2×251≈270.6,故取n=271.某装置的平均工作温度据制造厂家称不高于190∘C.今从一个由16台装置构成的随机样本测得工作温度的平均值和标准差分别为195∘C和8∘C,根据这些数据能否说明平均工作温度比制造厂所说的要高?(设α=0.05,并假设工作温度近似服从正态分布.)解答:设X为工作温度,则X∼N(μ,σ2).①待检假设H0:μ≤190,备择假设H1:μ>190;②在H0成立条件下,选择统计量T=X¯-μ0S/n≈t(n-1);③在显著性水平0.05下,查t分布表,找出临界值tα(n-1)=t0.05(15)=1.75,拒绝域为(1.75,+∞);④计算t=X¯-μ0S/n=195-1908/16=2.5>1.75,所以否定原假设H0,说明平均工作温度比制造厂所说的要高.习题7电工器材厂生产一批保险丝,抽取10根试验其熔断时间,结果为42657578715957685455假设熔断时间服从正态分布,能否认为整批保险丝的熔断时间的方差不大于80(α=0.05)?解答:①待检假设H0:σ2≤80,备择假设H1:σ2>80;②在H0成立时,选取统计量χ2=(n-1)S2σ02∼χ2(n-1);③由α=0.05,n-1=9,查χ2分布表,χα2(n-1)=χ0.052(9)=16.919;④计算样本值:x¯=110(42+65+75+78+71+59+57+68+54+55)=62.4,s2=19∑i=110(xi-x¯)2≈121.8,χ2=9×121.880≈13.7∈(0,16.919).故接受原假设H0即在α=0.05下,可认为整批保险丝的熔断时间的方差不大于80.习题8某系学生可以被允许选修3学分有实验物理课和4学分无实验物理课,11名学生选3学分的课,考试平均分数为85分,标准差为4.7分;17名学生选4学分的课,考试平均分数为79分,标准差为6.1分. 假定两总体近似服从方差相同的正态分布,试在显著性水平α=0.05下检验实验课程是否能使平均分数增加8分?解答:设有实验的课程考分X1∼N(μ1,σ12),无实验的课程考分X2∼N(μ2-σ22).假定σ12=σ22=σ2未知,检验假设H0:μ1-μ2=8,H1:μ1-μ2≠8.由题意知,选用t检验统计量,则拒绝域为W={∣x1¯-x2¯-(μ1-μ2)sw1n1+1n2∣>tα/2(n1+n2-2),其中sw2=(n1-1)s12+(n2-1)s22n1+n2-2.由x1¯=85,x2¯=79,n1=11,n2=17,s1=4.7,s2=6.1,算出sw=(11-1)×4.72+(17-1)×6.1211+17-2≈5.603.从而算出t值为t=85-79-85.603111+117≈-0.92,由α=0.05,查表得t0.025(11+17-2)=t0.025(25)=2.056,因为∣t∣=0.92<2.056,故接受H0,认为μ1-μ2=8.习题9某校从经常参加体育锻炼的男生中随机地选出50名,测得平均身高174.34厘米;从不经常参加体育锻炼的男生中随机地选50名,测得平均身高172.42厘米. 统计资料表明两种男生的身高都服从正态分布,其标准差分别为5.35厘米和6.11厘米,问该校经常参加锻炼的男生是否比不常参加锻炼的男生平均身高要高些(α=0.05)?解答:设X,Y分别表示常锻炼和不常锻炼男生的身高,由题设X∼N(μ1,5.352),Y∼N(μ2,6.112).①待检假设H0:μ1≤μ2,备择假设H1:μ1>μ2;②选取统计量U=X¯-Y¯σ12n+σ22m∼(H0成立)N(0,1);③对于α=0.05,查标准正态分布表,uα=u0.05=1.64;则拒绝域为(1.64,+∞);④计算u=174.34-172.425.35250+6.11250≈1.67>1.64,故否定原假设H0,即表明经常体育锻炼的男生平均身高比不经常体育锻炼的男生平均身高高些.习题10在漂白工艺中要改变温度对针织品断裂强力的影响,在两种不同温度下分别作了8次试验,测得断裂强力的数据如下(单位:kg):70∘C:20.818.819.820.921.519.521.021.280∘C:17.720.320.018.819.020.120.219.1判断两种温度下的强力有无差别(断裂强力可认为服从正态分布α=0.05)?解答:(1)本问题是在α=0.05下检验假设μ1=μ2,为此需要先检验σ12=σ22是否成立.H01:σ12=σ22,H11:σ12≠σ22.选取统计量F=S12S22,在H01成立的条件下,F∼F(n1-1,n2-1),且此检验问题的拒绝域为F>Fα/2(n1-1,n2-1)或F<F1-α/2(n1-1,n2-1).这里F=s12s22≈0.90550.8286≈1.0928,F0.025(7,7)=4.99,F0.975(7,7)=1F0.025(7,7)=14.99≈0.2004.显然F0.975(7,7)=0.2004<1.0928<4.99=F0.025(7,7).说明F未落在拒绝域中,从而接受H01,即认为两温度下的强力的方差没有显著变化,亦即σ12=σ22. (2)再检验假设H0ʹ:μ1=μ2,H0ʹ:μ1≠μ2,在H0ʹ成立的条件下,T=X1¯-X2¯(n1-1)S12+(n2-1)S22n1+n2-21n1+1n2∼t(n1+n2-2),且此检验问题的拒绝域为∣T∣>tα/2(n1+n2-2),这里T≈20.4-19.47×0.9055+7×0.82868+8-218+18≈2.148,显然∣T∣=2.148>2.145=t0.025(14).说明T落在拒绝域中,从而拒绝H0,即认为两种温度下的断裂强力有显著差别.习题11一出租车公司欲检验装配哪一种轮胎省油,以12部装有Ⅰ型轮胎的车辆进行预定的测试. 在不变换驾驶员的情况下,将这12部车辆换装Ⅱ型轮并重复测试,其汽油耗量如下表所示(单位:km/L).汽车编号i123456789101112Ⅰ型胎(xi)4.24.76.67.06.74.55.76.07.44.96.15.2Ⅱ型胎(yi)4.14.96.26.96.84.45.75.86.94.76.04.9假定两总体均服从正态分布,试在α=0.025的显著性水平下,检验安装Ⅰ型轮胎是否要双安装Ⅱ型轮胎省油?解答:设两种轮胎汽油消耗量之差为随机变量D,则取值为zi=xi-yi=0.1,-0.2,0.4,0.1,-0.1,0.1,0,0.2,0.5,0.2,0.1,0.3.设Z∼N(μz,σz2),σz2未知. 若消耗油相同,则μz=0;若Ⅰ型比Ⅱ型轮胎省油,则μz>0,于是检验假设H0:μz=0,H1:μz>0.由题意知z¯≈0.142,s≈0.198,n-1=12-1=11.α=0.025,查t分布表得t0.025(11)=2.201.所以,拒绝域为W={t>2.201}.由于样本值t=z¯-0s/n=0.142-00.198/12≈2.48>2.201,故拒绝H0:μz=0,即说明Ⅰ型轮胎省油.习题12有两台机器生产金属部件,分别在两台机器所生产的部件中各取一容量n1=60,n2=40的样本,测得部件重量(以kg计)的样本方差分别为s12=15.46,s22=9.66. 设两样本相互独立,两总体分别服从分布N(μ1,σ12),N(μ2,σ22).μi,σi2(i=1,2)均未知,试在α=0.05水平下检验假设H0:σ12≤σ22,H1:σ12>σ22.解答:在α=0.05下,检验假设H0:σ12≤σ22,H1:σ12>σ22,经计算p=1100×10(45+2×17+3×4+4×1+5×1)=1/10,故检验假设为H0:X∼B(10,1/10),即pi=P{X=i}=C10i(1/10)i(9/10)10-i,i=0,1,2,⋯,10.为了使npi≥5,将xi≥3合并,于是k=4,r=1.计算χ2的观察值,计算结果如下表:[200,300) [300,+∞)435843.466.9-0.4-8.90.0041.184∑300300 1.8631其中理论概率pi=p{ti≤T≤ti+1}=∫titi+1f(t)dt(i=1,2,3),p4=1-∑i=13pi,例如p1=P{T<100}=∫01000.005e-0.005tdt=1-e-0.5≈0.393.由k=4,未知参数个数r=0,查表知χα2(k-r-1)=χ0.052(3)=7.815.因χ2=1.8631<χ0.052(3)=7.815.故接受H0,即可认为灯泡的寿命服从该指数分布.习题16关于正态总体X∼N(μ,1)的数学期望有如下二者必居其一的假设,H0:μ=0,H1:μ=1.考虑检验规则:当X¯≥0.98时否定假设H0接受H1,其中X¯=(X1+⋯+X4)/4,而X1,⋯,X4是来自总体X的简单随机样本,试求检验的两类错误概率α和β.解答:易见,在假设“H0:μ=0”成立的条件下,X¯∼N(0,1/4),2X¯∼N(0,1);在假设“H1:μ=1”成立的条件下,X¯∼N(1,1/4),2(X¯-1)∼N(0,1).因此,由定义得α=P{X¯≥0.98∣μ=0}=P{2X¯≥1.96∣μ=0}=0.025,β=P{X¯<0.98∣μ=1}=P{2(X¯-1)<-0.04∣μ=1}=0.4840.习题17考察某城市购买A公司牛奶的比例,作假设H0:p=0.6,H1:p<0.6,随机抽取50个家属,设x为其中购买A公司牛奶的家庭数,拒绝域W={x≤24}.(1)H0成立时,求第一类错误的α;(2)H1成立且p=0.4时,求第二类错误的β(0.4);又当p=0.5时,求第二类错误的β(0.5).解答:由定义知(1)α=P{x≤24∣p=0.6}=Φ(24-50×0.650×0.6×0.4)≈Φ(-1.73)=1-Φ(1.73)=1-0.9528=0.0418.(2)β(0.4)=P{x>24∣p=0.4}=1-Φ(24-50×0.450×0.4×0.6)≈1-Φ(1.15)=1-0.8749=0.1251;。

统计学课后习题答案第七章相关分析与回归分析

统计学课后习题答案第七章相关分析与回归分析

第七章相关分析与回归分析一、单项选择题1.相关分析是研究变量之间的A.数量关系B.变动关系C.因果关系D.相互关系的密切程度2.在相关分析中要求相关的两个变量A.都是随机变量B.自变量是随机变量C.都不是随机变量D.因变量是随机变量3.下列现象之间的关系哪一个属于相关关系A.播种量与粮食收获量之间关系B.圆半径与圆周长之间关系C.圆半径与圆面积之间关系D.单位产品成本与总成本之间关系4.正相关的特点是A.两个变量之间的变化方向相反B.两个变量一增一减C.两个变量之间的变化方向一致D.两个变量一减一增5.相关关系的主要特点是两个变量之间A.存在着确定的依存关系B.存在着不完全确定的关系C.存在着严重的依存关系D.存在着严格的对应关系6.当自变量变化时, 因变量也相应地随之等量变化,则两个变量之间存在着A.直线相关关系B.负相关关系C.曲线相关关系D.正相关关系7.当变量X值增加时,变量Y值都随之下降,则变量X和Y之间存在着A.正相关关系B.直线相关关系C.负相关关系D.曲线相关关系8.当变量X值增加时,变量Y值都随之增加,则变量X和Y之间存在着A.直线相关关系B.负相关关系C.曲线相关关系D.正相关关系9.判定现象之间相关关系密切程度的最主要方法是A.对现象进行定性分析B.计算相关系数C.编制相关表D.绘制相关图10.相关分析对资料的要求是A.自变量不是随机的,因变量是随机的B.两个变量均不是随机的C.自变量是随机的,因变量不是随机的D.两个变量均为随机的11.相关系数A.既适用于直线相关,又适用于曲线相关B.只适用于直线相关C.既不适用于直线相关,又不适用于曲线相关D.只适用于曲线相关12.两个变量之间的相关关系称为A.单相关B.复相关C.不相关D.负相关13.相关系数的取值范围是≤r≤1 ≤r≤0≤r≤1 D. r=014.两变量之间相关程度越强,则相关系数A.愈趋近于1B.愈趋近于0C.愈大于1D.愈小于115.两变量之间相关程度越弱,则相关系数A.愈趋近于1B.愈趋近于0C.愈大于1D.愈小于116.相关系数越接近于-1,表明两变量间A.没有相关关系B.有曲线相关关系C.负相关关系越强D.负相关关系越弱17.当相关系数r=0时,A.现象之间完全无关B.相关程度较小B.现象之间完全相关 D.无直线相关关系18.假设产品产量与产品单位成本之间的相关系数为,则说明这两个变量之间存在A.高度相关B.中度相关C.低度相关D.显着相关19.从变量之间相关的方向看可分为A.正相关与负相关B.直线相关和曲线相关C.单相关与复相关D.完全相关和无相关20.从变量之间相关的表现形式看可分为A.正相关与负相关B.直线相关和曲线相关C.单相关与复相关D.完全相关和无相关21.物价上涨,销售量下降,则物价与销售量之间属于A.无相关B.负相关C.正相关D.无法判断22.配合回归直线最合理的方法是A.随手画线法B.半数平均法C.最小平方法D.指数平滑法23.在回归直线方程y=a+bx中b表示A.当x增加一个单位时,y增加a的数量B.当y增加一个单位时,x增加b的数量C.当x增加一个单位时,y的平均增加量D.当y增加一个单位时, x的平均增加量24.计算估计标准误差的依据是A.因变量的数列B.因变量的总变差C.因变量的回归变差D.因变量的剩余变差25.估计标准误差是反映A.平均数代表性的指标B.相关关系程度的指标C.回归直线的代表性指标D.序时平均数代表性指标26.在回归分析中,要求对应的两个变量A.都是随机变量B.不是对等关系C.是对等关系D.都不是随机变量27.年劳动生产率(千元)和工人工资(元)之间存在回归方程y=10+70x,这意味着年劳动生产率每提高一千元时,工人工资平均A.增加70元B.减少70元C.增加80元D.减少80元28.设某种产品产量为1000件时,其生产成本为30000元,其中固定成本6000元,则总生产成本对产量的一元线性回归方程为:=6+ =6000+24x=24000+6x =24+6000x29.用来反映因变量估计值代表性高低的指标称作A.相关系数B.回归参数C.剩余变差D.估计标准误差二、多项选择题1.下列现象之间属于相关关系的有A.家庭收入与消费支出之间的关系B.农作物收获量与施肥量之间的关系C.圆的面积与圆的半径之间的关系D.身高与体重之间的关系E.年龄与血压之间的关系2.直线相关分析的特点是A.相关系数有正负号B.两个变量是对等关系C.只有一个相关系数D.因变量是随机变量E.两个变量均是随机变量3.从变量之间相互关系的表现形式看,相关关系可分为A.正相关B.负相关C.直线相关D.曲线相关E.单相关和复相关4.如果变量x与y之间没有线性相关关系,则A.相关系数r=0B.相关系数r=1C.估计标准误差等于0D.估计标准误差等于1E.回归系数b=05.设单位产品成本(元)对产量(件)的一元线性回归方程为y=,则A.单位成本与产量之间存在着负相关B.单位成本与产量之间存在着正相关C.产量每增加1千件,单位成本平均增加元D.产量为1千件时,单位成本为元E.产量每增加1千件,单位成本平均减少元6.根据变量之间相关关系的密切程度划分,可分为A.不相关B.完全相关C.不完全相关D.线性相关E.非线性相关7.判断现象之间有无相关关系的方法有A.对现象作定性分析B.编制相关表C.绘制相关图D.计算相关系数E.计算估计标准误差8.当现象之间完全相关的,相关系数为B.-1 E.-9.相关系数r =0说明两个变量之间是A.可能完全不相关B.可能是曲线相关C.肯定不线性相关D.肯定不曲线相关E.高度曲线相关10.下列现象属于正相关的有A.家庭收入愈多,其消费支出也愈多B.流通费用率随商品销售额的增加而减少C.产量随生产用固定资产价值减少而减少D.生产单位产品耗用工时,随劳动生产率的提高而减少E.工人劳动生产率越高,则创造的产值就越多11.直线回归分析的特点有A.存在两个回归方程B.回归系数有正负值C.两个变量不对等关系D.自变量是给定的,因变量是随机的E.利用一个回归方程,两个变量可以相互计算12.直线回归方程中的两个变量A.都是随机变量B.都是给定的变量C.必须确定哪个是自变量,哪个是因变量D.一个是随机变量,另一个是给定变量E.一个是自变量,另一个是因变量13.从现象间相互关系的方向划分,相关关系可以分为A.直线相关B.曲线相关C.正相关D.负相关E.单相关14.估计标准误差是A.说明平均数代表性的指标B.说明回归直线代表性指标C.因变量估计值可靠程度指标D.指标值愈小,表明估计值愈可靠E.指标值愈大,表明估计值愈可靠15.下列公式哪些是计算相关系数的公式16.用最小平方法配合的回归直线,必须满足以下条件A.?(y-y c )=最小值B.?(y-y c )=0C.?(y-y c )2=最小值D.?(y-y c )2=0E.?(y-y c )2=最大值17.方程y c =a+bx222222)()(.)()())((...))((.y y n x x n y x xy n r E y y x x y y x x r D L L L r C L L L r B n y y x x r A xx xy xy yy xx xy yx ∑-∑⋅∑-∑∑⋅∑-∑=-∑⋅-∑--∑===--∑=σσA.这是一个直线回归方程B.这是一个以X为自变量的回归方程C.其中a是估计的初始值D.其中b是回归系数是估计值18.直线回归方程y c=a+bx中的回归系数bA.能表明两变量间的变动程度B.不能表明两变量间的变动程度C.能说明两变量间的变动方向D.其数值大小不受计量单位的影响E. 其数值大小受计量单位的影响19.相关系数与回归系数存在以下关系A.回归系数大于零则相关系数大于零B.回归系数小于零则相关系数小于零C.回归系数等于零则相关系数等于零D.回归系数大于零则相关系数小于零E.回归系数小于零则相关系数大于零20.配合直线回归方程的目的是为了A.确定两个变量之间的变动关系B.用因变量推算自变量C.用自变量推算因变量D.两个变量相互推算E.确定两个变量之间的相关程度21.若两个变量x和y之间的相关系数r=1,则A.观察值和理论值的离差不存在的所有理论值同它的平均值一致和y是函数关系与y不相关与y是完全正相关22.直线相关分析与直线回归分析的区别在于A.相关分析中两个变量都是随机的;而回归分析中自变量是给定的数值,因变量是随机的B.回归分析中两个变量都是随机的;而相关分析中自变量是给定的数值,因变量是随机的C.相关系数有正负号;而回归系数只能取正值D.相关分析中的两个变量是对等关系;而回归分析中的两个变量不是对等关系E.相关分析中根据两个变量只能计算出一个相关系数;而回归分析中根据两个变量只能计算出一个回归系数三、填空题1.研究现象之间相关关系称作相关分析。

统计学第七章、第八章课后题答案

统计学第七章、第八章课后题答案

统计学第七章、第⼋章课后题答案统计学复习笔记第七章参数估计⼀、思考题1.解释估计量和估计值在参数估计中,⽤来估计总体参数的统计量称为估计量。

估计量也是随机变量。

如样本均值,样本⽐例、样本⽅差等。

根据⼀个具体的样本计算出来的估计量的数值称为估计值。

2.简述评价估计量好坏的标准(1)⽆偏性:是指估计量抽样分布的期望值等于被估计的总体参数。

(2)有效性:是指估计量的⽅差尽可能⼩。

对同⼀总体参数的两个⽆偏估计量,有更⼩⽅差的估计量更有效。

(3)⼀致性:是指随着样本量的增⼤,点估计量的值越来越接近被估总体的参数。

3.怎样理解置信区间在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。

置信区间的论述是由区间和置信度两部分组成。

有些新闻媒体报道⼀些调查结果只给出百分⽐和误差(即置信区间),并不说明置信度,也不给出被调查的⼈数,这是不负责的表现。

因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。

在公布调查结果时给出被调查⼈数是负责任的表现。

这样则可以由此推算出置信度(由后⾯给出的公式),反之亦然。

4.解释95%的置信区间的含义是什么置信区间95%仅仅描述⽤来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。

也就是说,⽆穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。

不要认为由某⼀样本数据得到总体参数的某⼀个95%置信区间,就以为该区间以的概率覆盖总体参数。

5.简述样本量与置信⽔平、总体⽅差、估计误差的关系。

1. 估计总体均值时样本量n 为2. 样本量n 与置信⽔平1-α、总体⽅差、估计误差E 之间的关系为与置信⽔平成正⽐,在其他条件不变的情况下,置信⽔平越⼤,所其中: 2222α2222)(E z n σα=n z E σα2=需要的样本量越⼤;与总体⽅差成正⽐,总体的差异越⼤,所要求的样本量也越⼤;与与总体⽅差成正⽐,样本量与估计误差的平⽅成反⽐,即可以接受的估计误差的平⽅越⼤,所需的样本量越⼩。

第四版统计学课后习题答案

第四版统计学课后习题答案
3.5绘制线图应注意问题
时间在横轴,观测值绘在纵轴。一般是长宽比例10:7的长方形,纵轴下端一般从0开始,数据与0距离过大的话用折断符号折断。
3.6饼图和环形图的不同
饼图只能显示一个样本或总体各部分所占比例,环形图可以同时绘制多个样本或总体的数据系列,其图形中间有个“空洞”,每个样本或总体的数据系类为一个环。
4.6简述异众比率、四分位差、方差或标准差的适用场合
对于分类数据,主要用异众比率来测量其离散程度;对于顺序数据,虽然也可以计算异众比率,但主要使用四分位差来测量其离散程度;对于数值型数据,虽然可以计算异众比率和四分位差,但主要使用方差或标准差来测量其离散程度。
4.7标准分数有哪些用途?
4.9测度数据分布形状的统计量有哪些?
对分布形状的测度有偏态和峰态,测度偏态的统计量是偏态系数,测度峰态的统计量是峰态系数。
第五章 概率与概率分布
5.1频率与概率有什么关系?
在相同条件下随机试验n次,某事件A出现m次,则比值m/n称为事件A发生的频率。随着n的增大,该频率围绕某一常数p波动,且波动幅度逐渐减小,趋于稳定,这个频率的稳定值即为该事件的概率。
1.4解释分类数据,顺序数据和数值型数据
答案同1.3
1.5举例说明总体,样本,参数,统计量,变量这几个概念
对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
《统计学》第四版
统计课后思考题答案
第一章思考题

《统计学》-第7章-习题答案

《统计学》-第7章-习题答案

第七章思考与练习参考答案1 •答:函数关系是两变量之间的确定性关系,即当一个变量取一定数值时,另一个变量有确定值与之相对应;而相关关系表示的是两变量之间的一种不确定性关系,具体表示为当一个变量取一定数值时,与之相对应的另一变量的数值虽然不确定,但它仍按某种规律在定的范围内变化。

2•答:相关和回归都是研究现象及变量之间相互关系的方法。

相关分析研究变量之间相关的方向和相关的程度,但不能确定变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况;回归分析则可以找到研究变量之间相互关系的具体形式,并可变量之间的数量联系进行测定,确定一个回归方程,并根据这个回归方程从已知量推测未知量。

3•答:单相关系数是度量两个变量之间线性相关程度的指标,其计算公式为:总体相关系数二样本相关系数,「一】。

复相关系数是多元线性回归分析中度量因变量与其它多个自变量之间的线性相关程度的指标,它是方程的判定系数R2的正的平方根。

偏相关系数是多元线性回归分析中度量在其它变量不变的情况下两个变量之间真实相关程度的指标,它反映了在消除其他变量影响的条件下两个变量之间的线性相关程度。

4.答:回归模型假定总体上因变量Y与自变量X之间存在着近似的线性函数关系,可表示为Y^ 11X t u t,这就是总体回归函数,其中u t是随机误差项,可以反映未考虑的其他各种因素对Y的影响。

根据样本数据拟合的方程,就是样本回归函数,以一元线性回归模型的样本回归函数为例可表示为:Y?=耳+弭x t。

总体回归函数事实上是未知的,需要利用样本的信息对其进行估计,样本回归函数是对总体回归函数的近似反映。

两者的区别主要包括:第一,总体回归直线是未知的,它只有一条;而样本回归直线则是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回归直线。

第二,总体回归函数中的-0和-1是未知的参数,表现为常数;而样本回归直线中的'?Q和?i是随机变量,其具体数值随所抽取的样本观测值不同而变动。

统计学第四版第七章答案

统计学第四版第七章答案

第四章抽样分布与参数估计7.2某快餐店想要估计每位顾客午餐的平均花费金额。

在为期3周的时间里选取49名顾客组成了一个简单随机样本。

(1)假定总体标准差为15元,求样本均值的抽样标准误差。

15=2.143xn49(2)在95%的置信水平下,求边际误差。

xt x,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=z2 因此,x txz2xz0.025x=1.96×2.143=4.2(3)如果样本均值为120元,求总体均值的95%的置信区间。

置信区间为:x,x=1204.2,1204.2=(115.8,124.2)xx7.4从总体中抽取一个n=100的简单随机样本,得到x=81,s=12。

要求:大样本,样本均值服从正态分布:xN,2n或xN,2sn置信区间为:ssxz2,xz2nn,sn=12100=1.2(1)构建的90%的置信区间。

z=2 z=1.645,置信区间为:811.6451.2,811.6451.2=(79.03,82.97)0.5(2)构建的95%的置信区间。

z=z0.025=1.96,置信区间为:811.961.2,811.961.2=(78.65,83.35)2(3)构建的99%的置信区间。

z=z0.005=2.576,置信区间为:812.5761.2,812.5761.2=(77.91,84.09)27.7某大学为了解学生每天上网的时间,在全校7500名学生中采取重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时):3.33.16.25.82.34.15.44.53.24.42.05.42.66.41.83.55.72.32.11.91.25.14.34.23.60.81.54.71.41.22.93.52.40.53.62.5求该校大学生平均上网时间的置信区间,置信水平分别为90%,95%和99%。

解:(1)样本均值x=3.32,样本标准差s=1.61;(2)抽样平均误差:s重复抽样:x==1.61/6=0.268nn不重复抽样:x=NnsNnn1nN1N=7.37500363675001=0.268×0.995=0.268×0.998=0.267 (3)置信水平下的概率度:1=0.9,t= z=2 z=1.645 7.51=0.95,t= z=2 z=1.96 0.61=0.99,t= z=2 z=2.576 7.8(4)边际误差(极限误差):xtxzx21=0.9,x txz x=2 z3.4x重复抽样:x zx=z0.05x=1.645×0.268=0.4412不重复抽样:x zx= 2 z=1.645×0.267=0.4394.5x1=0.95,xtxz2x= z2.2x重复抽样:x zx= 2 z=1.96×0.268=0.5254.8x不重复抽样:x zx=z0.025x=1.96×0.267=0.52321=0.99,x txz x=z0.005x2重复抽样:x zx= 2 z=2.576×0.268=0.690.5x不重复抽样:xz2x= z=2.576×0.267=0.6880.5x(5)置信区间:x,xxx1=0.9,重复抽样:x,x=3.320.441,3.320.441=(2.88,3.76)xx不重复抽样:x,x=3.320.439,3.320.439=(2.88,3.76)xx 1=0.95,重复抽样:x,x=3.320.525,3.320.525=(2.79,3.85)xx 不重复抽样:x,x=3.320.441,3.320.441=(2.80,3.84)xx 1=0.99,重复抽样:x,x=3.320.69,3.320.69=(2.63,4.01)xx 不重复抽样:x,x=3.320.688,3.320.688=(2.63,4.01)xx7.4某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离(单位:km)分别是: 103148691211751015916132假定总体服从正态分布,求职工上班从家里到单位平均距离的95%的置信区间。

统计学答案第七章

统计学答案第七章

1 估量量的含义是指()。

A.用来估量整体参数的统计量的名称B.用来估量整体参数的统计量的具体数值C.整体参数的名称D.整体参数的具体数值2 在参数估量中,要求通过样本的统计量来估量整体参数,评判统计量的标准之一是使它与整体参数的离差越小越好。

这种评判标准称为()。

A.无偏性B.有效性C.一致性D.充分性3 依照一个具体的样本求出的整体均值的95%的置信区间()。

A.以95%的概率包括整体均值B.有5%的可能性包括整体均值C.必然包括整体均值D.要么包括整体均值,要么不包括整体均值4 无偏估量是指()。

A.样本统计量的值恰好等于待估的整体参数B.所有可能样本估量值的数学期望等于待估整体参数C.样本估量值围绕待估整体参数使其误差最小D.样本量扩大到和整体单元相等时与整体参数一致5 整体均值的置信区间等于样本均值加减边际误差,其中的边际误差等于所要求置信水平的临界值乘以()。

A.样本均值的抽样标准差B.样本标准差C.样本方差D.整体标准差6 当样本量一按时,置信区间的宽度()。

A.随着置信系数的增大而减小B.随着置信系数的增大而增大C.与置信系数的大小无关D.与置信系数的平方成反比7 当置信水平一按时,置信区间的宽度()。

A.随着样本量的增大而减小B.随着样本量的增大而增大C.与样本量的大小无关D.与样本量的平方根成正比8 一个95%的置信区间是指()。

A.整体参数有95%的概率落在这一区间内B.整体参数有5%的概率未落在这一区间内C.在用一样方式构造的整体参数的多个区间中,有95%的区间包括该整体参数D.在用一样方式构造的整体参数的多个区间中,有95%的区间不包括该整体参数9 95%的置信水平是指()。

A.整体参数落在一个特定的样本所构造的区间内的概率为95%B.在用一样方式构造的整体参数的多个区间中,包括整体参数的区间比例为95%C.整体参数落在一个特定的样本所构造的区间内的概率为5%D.在用一样方式构造的整体参数的多个区间中,包括整体参数的区间比例为5%10 一个估量量的有效性是指()。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第四章 抽样分布与参数估计7.2 某快餐店想要估计每位顾客午餐的平均花费金额。

在为期3 周的时间里选取 49 名顾客组成了一个简单随机样本。

(1) 假定总体标准差为 15 元,求样本均值的抽样标准误差。

15x=2.143n 49(2) 在 95%的置信水平下,求边际误差。

xt x ,由于是大样本抽样, 因此样本均值服从正态分布,因此概率度 t= z2因此,xtxz2 xz 0.025x =1.96 × 2.143=4.2(3) 如果样本均值为 120 元,求总体均值的 95%的置信区间。

置信区间为:xx , xx= 120 4.2,120 4.2 =( 115.8, 124.2)7.4 从总体中抽取一个n=100 的简单随机样本 ,得到 x =81 , s=12。

要求:22大样本,样本均值服从正态分布:xN,或 xNsn,n置信区间为: xz 2s z 2s ,s=12 =1.2 , xnnn100(1) 构建 的 90%的置信区间。

z 2=z0.05=1.645 ,置信区间为: 81 1.6451.2, 811.6451.2 =( 79.03, 82.97)(2) 构建的 95%的置信区间。

z 2 = z 0.025 =1.96 ,置信区间为: 81 1.961.2, 81 1.96 1.2 =( 78.65,83.35)(3) 构建 的 99%的置信区间。

z 2 = z 0.005 =2.576 ,置信区间为: 81 2.576 1.2, 81 2.576 1.2 =( 77.91, 84.09)7.7 某大学为了解学生每天上网的时间,在全校7 500 名学生中采取重复抽样方法随机抽取36 人,调查他们每天上网的时间,得到下面的数据(单位:小时 ):3.3 3.1 6.2 5.8 2.34.15.4 4.5 3.2 4.4 2.0 5.4 2.66.4 1.8 3.5 5.7 2.3 2.1 1.9 1.2 5.1 4.3 4.2 3.6 0.81.54.71.41.22.93.52.40.53.6 2.5求该校大学生平均上网时间的置信区间,置信水平分别为90%, 95%和 99%。

解:(1)样本均值x =3.32 ,样本标准差 s=1.61 ;(2)抽样平均误差:x =s重复抽样:=1.61/6=0.268n nx =N n s N n 1.61750036不重复抽样:N1n N1=75001n36=0.268 ×0.995=0.268 × 0.998=0.267( 3)置信水平下的概率度:1=0.9, t= z2 = z0.05 =1.6451=0.95 , t= z 2 =z0.025=1.961=0.99 , t= z 2 =z0.005=2.576( 4)边际误差(极限误差):x txz2x1=0.9,x t x z 2x =z0.05x重复抽样:xz2x = z0.05x =1.645 × 0.268=0.441不重复抽样:x z2x=z0.05x =1.645 ×0.267=0.4391=0.95 ,x t x z2x=z0.025x重复抽样:x z2x=z0.025x =1.96 ×0.268=0.525不重复抽样:x z2x=z0.025x=1.96 × 0.267=0.5231=0.99 ,x t x z2x =z0.005x重复抽样:x z2x=z0.005x =2.576 ×0.268=0.69不重复抽样:x z2x=z 0.005x=2.576 × 0.267=0.688( 5)置信区间:x x , x x1=0.9,重复抽样: x x , x x = 3.32 0.441, 3.32 0.441 =( 2.88, 3.76)不重复抽样:x x, x x= 3.320.439, 3.320.439 =( 2.88, 3.76 )1=0.95 ,重复抽样:x x , x x= 3.320.525, 3.320.525 =( 2.79, 3.85)不重复抽样:x x, x x= 3.320.441, 3.320.441 =(2.80 ,3.84 )1=0.99 ,重复抽样:x x , x x= 3.320.69, 3.320.69=( 2.63, 4.01)不重复抽样:x x, x x= 3.320.688, 3.320.688 =( 2.63, 4.01 )7.9 某居民小区为研究职工上班从家里到单位的距离,抽取了由16 个人组成的一个随机样本,他们到单位的距离(单位: km) 分别是:103148691211751015916132假定总体服从正态分布,求职工上班从家里到单位平均距离的95%的置信区间。

解:小样本,总体方差未知,用t 统计量t xt n1 sn均值 =9.375 ,样本标准差 s=4.11置信区间:x t 2 n 1st 2 n 1s , xn n1=0.95 , n=16, t2n 1= t0.02515=2.13t 2 n 1st 2 n 1sx, xnn=9.375 2.134.11, 9.375 2.134.1116=( 7.18, 11.57)167.11某企业生产的袋装食品采用自动打包机包装,每袋标准重量为l00g。

现从某天生产的一批产品中按重复抽样随机抽取50 包进行检查,测得每包重量(单位: g) 如下:每包重量( g)包数96~98298~1003100~10234102~1047104~1064合计50已知食品包重量服从正态分布,要求:(1)确定该种食品平均重量的 95%的置信区间。

解:大样本,总体方差未知,用z 统计量z xN 0,1 sn样本均值 =101.4 ,样本标准差s=1.829置信区间:z 2s sx, x z2nn1=0.95 ,z2=z0.025=1.96x z 2szs , x2n n= 101.4 1.961.829,101.41.961.829,101.91 )=( 100.895050(2) 如果规定食品重量低于l00g 属于不合格,确定该批食品合格率的95%的置信区间。

解:总体比率的估计大样本,总体方差未知,用z 统计量zpN0,1 p 1 pn样本比率 =( 50-5 ) /50=0.9置信区间:p zp1p, p zp1p2n2n1=0.95 ,z2=z0.025=1.96p zp1p, p zp1p2n2n= 0.9 1.960.910.9, 0.9 1.960.910.9=( 0.8168, 0.9832)50507.13一家研究机构想估计在网络公司工作的员工每周加班的平均时间,为此随机抽取了18 个员工。

得到他们每周加班的时间数据如下(单位:小时 ):62117207081629 381211921251516假定员工每周加班的时间服从正态分布。

估计网络公司员工平均每周加班时间的90%的置信区间。

解:小样本,总体方差未知,用t 统计量t x1t nsn均值 =13.56 ,样本标准差 s=7.801置信区间:t 2 n 1s sx, x t 2 n 1n n1=0.90 , n=18, t 2n 1 = t 0.05 17=1.7369x t 2 n 1s s , x t 2 n 1n n= 13.56 1.73697.801,13.56 1.73697.801)=( 10.36,16.75 18187.15在一项家电市场调查中.随机抽取了电视机。

其中拥有该品牌电视机的家庭占为 90%和 95%。

解:总体比率的估计200 个居民户,调查他们是否拥有某一品牌的23%。

求总体比例的置信区间,置信水平分别大样本,总体方差未知,用z 统计量pN 0,1zp 1pn样本比率 =0.23置信区间:p1p p 1pp z2n , p z2n1=0.90 ,z2=z0.025=1.645p zp1 p, pp1p2nz 2n=0.23 1.6450.2310.230.2310.23, 0.23 1.645200 200=(0.1811, 0.2789)1=0.95 ,z2=z0.025=1.96p 1pp 1ppz2, pz 2nn= 0.231.960.23 10.23,0.230.23 10.232001.96200 = ( 0.1717 ,0.2883 )7.20顾客到银行办理业务时往往需要等待一段时间,而等待时间的长短与许多因素有关,比如,银行业务员办理业务的速度,顾客等待排队的方式等。

为此,某银行准备采取两 种排队方式进行试验,第一种排队方式是:所有顾客都进入一个等待队列;第二种排队 方式是:顾客在三个业务窗口处列队三排等待。

为比较哪种排队方式使顾客等待的时间 更短,银行各随机抽取10 名顾客,他们在办理业务时所等待的时间 ( 单位:分钟 )如下:方式 16.5 6.6 6.7 6.87.1 7.3 7.4 7.7 7.7 7.7方式 24.25.45.86.26.77.77.78.59.310要求:(1) 构建第一种排队方式等待时间标准差的 95%的置信区间。

解:估计统计量n 1 S2~22n 1经计算得样本标准差 s 22 =3.318置信区间:n 1 S 2n221 S2 n 12 2n1211=0.95 , n=10,2 n 1 = 2 9 =19.02 ,2 2 n 1 =2 9 =2.72 0.02510.975n1S 2n1 S 29 0.22729 0.2272 =(0.1075, 0.7574 )22n, 2 n 1=19.02,1122.7因此,标准差的置信区间为( 0.3279, 0.8703)(2) 构建第二种排队方式等待时间标准差的 95%的置信区间。

解:估计统计量n 1 2S22~ n 1经计算得样本标准差 s 12 =0.2272置信区间:n2n 21 S 21 S2n 12 2 n 1211=0.95 , n=10,2 n 1 = 2 =19.02 ,2 n2=2.720.0259121 =0.9759n1 2n 29 3.318 9 3.318S1 S =( 1.57 , 11.06)22n ,2 n1=,2.71 1219.02因此,标准差的置信区间为( 1.25, 3.33)(3) 根据 (1) 和(2) 的结果,你认为哪种排队方式更好?第一种方式好,标准差小!7.23 下表是由 4 对观察值组成的随机样本。

配对号 来自总体 A 的样本 来自总体 B 的样本1 2 0 2 5 7 3 10 6 485(1) 计算 A 与 B 各对观察值之差,再利用得出的差值计算d 和 s d 。

相关文档
最新文档