人大版 贾俊平_统计学_第三版 课后习题答案

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

17.下图给出了2000年美国人口年龄的金字塔,其绘制方法及其数字说明与【例2.10】相同,试对该图反映的人口、政治、社会、经济状况进行分析。

第3章概率与概率分布——练习题(全免)
1 .某技术小组有12人,他们的性别和职称如下,现要产生一名幸运者。

试求这位幸运者分别是以下几种可能的概率:(1)女性;(2)工程师;(3)女工程师,(4)女性或工程师。

并说明几个计算结果之间有何关系?
解:设A=女性,B=工程师,AB=女工程师,A+B=女性或工程师
(1)P(A)=4/12=1/3
(2)P(B)=4/12=1/3
(3)P(AB)=2/12=1/6
(4)P(A+B)=P(A)+P(B)-P(AB)=1/3+1/3-1/6=1/2
2. 某种零件加工必须依次经过三道工序,从已往大量的生产记录得知,第一、二、三道工序的次品率分别为0.2,0.1,0.1,并且每道工序是否产生次品与其它工序无关。

试求这种零件的次品率。

P A。

解:求这种零件的次品率,等于计算“任取一个零件为次品”(记为A)的概率()
考虑逆事件A “任取一个零件为正品”,表示通过三道工序都合格。

据题意,有:
()(10.2)(10.1)(10.1)0.648P A =---=
于是 ()1()10.6480.352P A P A =-=-=
3. 已知参加某项考试的全部人员合格的占80%,在合格人员中成绩优秀只占15%。

试求任一参考人员成绩优秀的概率。

解:设A 表示“合格”,B 表示“优秀”。

由于B =AB ,于是
)|()()(A B P A P B P ==0.8×0.15=0.12
4. 某项飞碟射击比赛规定一个碟靶有两次命中机会(即允许在第一次脱靶后进行第二次射击)。

某射击选手第一发命中的可能性是80%,第二发命中的可能性为50%。

求该选手两发都脱靶的概率。

解:设A =第1发命中。

B =命中碟靶。

求命中概率是一个全概率的计算问题。

再利用对立事件的概率即可求得脱靶的概率。

)|()()|()()(A B P A P A B P A P B P +=
=0.8×1+0.2×0.5=0.9
脱靶的概率=1-0.9=0.1
或(解法二):P (脱靶)=P (第1次脱靶)×P(第2次脱靶)=0.2×0.5=0.1
5.已知某地区男子寿命超过55岁的概率为84%,超过70岁以上的概率为63%。

试求任一刚过55岁生日的男子将会活到70岁以上的概率为多少?
解: 设A =活到55岁,B =活到70岁。

所求概率为:
()()0.63(|)0.75()()0.84
P AB P B P B A P A P A ==== 6.某企业决策人考虑是否采用一种新的生产管理流程。

据对同行的调查得知,采用新生产管理流程后产品优质率达95%的占四成,优质率维持在原来水平(即80%)的占六成。

该企业利用新的生产管理流程进行一次试验,所生产5件产品全部达到优质。

问该企业决策者会倾向于如何决策?
解:这是一个计算后验概率的问题。

设A =优质率达95%,A =优质率为80%,B =试验所生产的5件全部优质。

P(A)=0.4,P (A )=0.6,P (B|A )=0.955, P(B |A )=0.85,所求概率为:
6115.050612
.030951.0)|()()|()()|()()|(===A B P A P A B P A P A B P A P B A P + 决策者会倾向于采用新的生产管理流程。

7. 某公司从甲、乙、丙三个企业采购了同一种产品,采购数量分别占总采购量的25%、30%和45%。

这三个企业产品的次品率分别为4%、5%、3%。

如果从这些产品中随机抽出一件,试问:(1)抽出次品的概率是多少?(2)若发现抽出的产品是次品,问该产品来自丙厂的概率是多少?
解:令A 1、A 2、A 3分别代表从甲、乙、丙企业采购产品,B 表示次品。

由题意得:P (A 1)=0.25,P (A 2)=0.30, P (A 3)=0.45;P (B |A 1)=0.04,P (B |A 2)=0.05,P (B |A 3)=0.03;因此,所求概率分别为:
(1))|()()|()()|()()(332211A B P A P A B P A P A B P A P B P ++=
=0.25×0.04+0.30×0.05+0.45×0.03=0.0385
(2)3506.00385
.00135.00.030.450.050.300.040.2503.045.0)|(3==++=⨯⨯⨯⨯B A P 8.某人在每天上班途中要经过3个设有红绿灯的十字路口。

设每个路口遇到红灯的事件是相互独立的,且红灯持续24秒而绿灯持续36秒。

试求他途中遇到红灯的次数的概率分布及其期望值和方差、标准差。

解:据题意,在每个路口遇到红灯的概率是p =24/(24+36)=0.4。

设途中遇到红灯的次数=X ,因此,X ~B(3,0.4)。

其概率分布如下表:
9. 一家人寿保险公司某险种的投保人数有20000人,据测算被保险人一年中的死亡率为万分之5。

保险费每人50元。

若一年中死亡,则保险公司赔付保险金额50000元。

试求未来一年该保险公司将在该项保险中(这里不考虑保险公司的其它费用):
(1)至少获利50万元的概率;
(2)亏本的概率;
(3)支付保险金额的均值和标准差。

解:设被保险人死亡数=X ,X ~B (20000,0.0005)。

(1)收入=20000×50(元)=100万元。

要获利至少50万元,则赔付保险金额应该不超过50万元,等价于被保险人死亡数不超过10人。

所求概率为:P(X ≤10)=0.58304。

(2)当被保险人死亡数超过20人时,保险公司就要亏本。

所求概率为:
P(X >20)=1-P(X ≤20)=1-0.99842=0.00158
(3)支付保险金额的均值=50000×E (X )
=50000×20000×0.0005(元)=50(万元)
支付保险金额的标准差=50000×σ(X )
=50000×(20000×0.0005×0.9995)1/2=158074(元)
10.对上述练习题3.09的资料,试问:
(1)可否利用泊松分布来近似计算?
(2)可否利用正态分布来近似计算?
(3)假如投保人只有5000人,可利用哪种分布来近似计算?
解: (1)可以。

当n 很大而p 很小时,二项分布可以利用泊松分布来近似计算。

本例中,λ= np =20000×0.0005=10,即有X ~P (10)。

计算结果与二项分布所得结果几乎完全一致。

(2)也可以。

尽管p 很小,但由于n 非常大,np 和np(1-p)都大于5,二项分布也可以利用正态分布来近似计算。

本例中,np=20000×0.0005=10,np(1-p)=20000×0.0005×(1-0.0005)=9.995,
即有X ~N (10,9.995)。

相应的概率为:
P (X ≤10.5)=0.51995,P(X ≤20.5)=0.853262。

可见误差比较大(这是由于P 太小,二项分布偏斜太严重)。

【注】由于二项分布是离散型分布,而正态分布是连续性分布,所以,用正态分布来近似计算二项分布的概率时,通常在二项分布的变量值基础上加减0.5作为正态分布对应的区间点,这就是所谓的“连续性校正”。

(3)由于p =0.0005,假如n =5000,则np =2.5<5,二项分布呈明显的偏态,用正态分
布来计算就会出现非常大的误差。

此时宜用泊松分布去近似。

11.某企业生产的某种电池寿命近似服从正态分布,且均值为200小时,标准差为30小时。

若规定寿命低于150小时为不合格品。

试求该企业生产的电池的:(1)合格率是多少?(2)电池寿命在200左右多大的范围内的概率不小于0.9。

解:(1))6667.1()30
200150()150(-<-<=<Z P Z P X P ==0.04779 合格率为1-0.04779=0.95221或95.221%。

(2) 设所求值为K ,满足电池寿命在200±K 小时范围内的概率不小于0.9,即有:
|200|(|200|){||}0.93030X K P X K P Z --<=<≥=
即:{}0.9530
K P Z <≥,K /30≥1.64485,故K ≥49.3456。

12.某商场某销售区域有6种商品。

假如每1小时内每种商品需要12分钟时间的咨询服务,而且每种商品是否需要咨询服务是相互独立的。

求:(1)在同一时刻需用咨询的商品种数的最可能值是多少?(2)若该销售区域仅配有2名服务员,则因服务员不足而不能提供咨询服务的概率是多少?
解:设X =同一时刻需用咨询服务的商品种数,由题意有X ~B(6,0.2)
(1)X 的最可能值为:X 0=[(n+1)p]=[7×0.2]=1 (取整数)
(2)∑=--
=≤-=>20668.02.01)2(1)2(k k k k C X P X P
=1-0.9011=0.0989 第4章 抽样与抽样分布——练习题(全免)
1. 一个具有64=n 个观察值的随机样本抽自于均值等于20、标准差等于16的总体。

⑴ 给出x 的抽样分布(重复抽样)的均值和标准差
⑵ 描述x 的抽样分布的形状。

你的回答依赖于样本容量吗?
⑶ 计算标准正态z 统计量对应于5.15=x 的值。

⑷ 计算标准正态z 统计量对应于23=x 的值。

解: 已知 n=64,为大样本,μ=20,σ=16,
⑴在重复抽样情况下,x 的抽样分布的均值为
a. 20, 2
b. 近似正态
c. -2.25
d. 1.50
2 . 参考练习4.1求概率。

⑴x <16; ⑵x >23; ⑶x >25; ⑷.x 落在16和22之间; ⑸x <14。

解: a. 0.0228 b. 0.0668 c. 0.0062 d. 0.8185 e. 0.0013
3. 一个具有100=n 个观察值的随机样本选自于30=μ、16=σ的总体。

试求下列概率的近似值:
解: a. 0.8944 b. 0.0228 c. 0.1292 d. 0.9699
4. 一个具有900=n 个观察值的随机样本选自于100=μ和10=σ的总体。

⑴ 你预计x 的最大值和最小值是什么?
⑵ 你认为x 至多偏离μ多么远?
⑶ 为了回答b 你必须要知道μ吗?请解释。

解:a. 101, 99 b. 1 c. 不必
5. 考虑一个包含x 的值等于0,1,2,…,97,98,99的总体。

假设x 的取值的可能性是相同的。

则运用计算机对下面的每一个n 值产生500个随机样本,并对于每一个样本计算x 。

对于每一个样本容量,构造x 的500个值的相对频率直方图。

当n 值增加时在直方图上会发生什么变化?存在什么相似性?这里30,10,5,2====n n n n 和50=n 。

解:趋向正态
6. 美国汽车联合会(AAA )是一个拥有90个俱乐部的非营利联盟,它对其成员提供旅行、
金融、保险以及与汽车相关的各项服务。

1999年5月,AAA 通过对会员调查得知一个4口之家出游中平均每日餐饮和住宿费用大约是213美元(《旅行新闻》Travel News ,1999年5月11日)。

假设这个花费的标准差是15美元,并且AAA 所报道的平均每日消费是总体均值。

又假设选取49个4口之家,并对其在1999年6月期间的旅行费用进行记录。

⑴ 描述x (样本家庭平均每日餐饮和住宿的消费)的抽样分布。

特别说明x 服从怎样的分布以及x 的均值和方差是什么?证明你的回答;
⑵ 对于样本家庭来说平均每日消费大于213美元的概率是什么?大于217美元的概率
呢?在209美元和217美元之间的概率呢?
解: a. 正态分布, 213, 4.5918 b. 0.5, 0.031, 0.938
7. 技术人员对奶粉装袋过程进行了质量检验。

每袋的平均重量标准为406=μ克、标准差
为1.10=σ克。

监控这一过程的技术人者每天随机地抽取36袋,并对每袋重量进行测量。

现考虑这36袋奶粉所组成样本的平均重量x 。

(1)描述x 的抽样分布,并给出x μ和x σ的值,以及概率分布的形状;
(3) 假设某一天技术人员观察到8.400=x ,这是否意味着装袋过程出
现问题了呢,为什么?
解: a. 406, 1.68, 正态分布 b. 0.001 c. 是,因为小概率出现了
8. 在本章的统计实践中,某投资者考虑将1000美元投资于5=n 种不同的股票。

每一种股
票月收益率的均值为%10=μ,标准差%4=σ。

对于这五种股票的投资组合,投资者每月的收益率是∑=5i r r 。

投资者的每月收益率的方差是2.32
2==n r σσ,它是
投资者所面临风险的一个度量。

⑴ 假如投资者将1000美元仅投资于这5种股票的其中3种,则这个投资者所面对的
风险将会增加还是减少?请解释;
⑵ 假设将1000美元投资在另外10种收益率与上述的完全一样的股票,试度量其风险,
并与只投资5种股票的情形进行比较。

解:a. 增加 b. 减少
9. 某制造商为击剑运动员生产安全夹克,这些夹克是以剑锋刺入其中时所需的最小力量(以
牛顿为单位)来定级的。

如果生产工艺操作正确,则他生产的夹克级别应平均840牛顿,标准差15牛顿。

国际击剑管理组织(FIE )希望这些夹克的最低级别不小于800牛顿。

为了检查其生产过程是否正常,某检验人员从生产过程中抽取了50个夹克作为一个随机样本进行定级,并计算x ,即该样本中夹克级别的均值。

她假设这个过程的标准差是固定的,但是担心级别均值可能已经发生变化。

⑴ 如果该生产过程仍旧正常,则x 的样本分布为何?
⑵ 假设这个检验人员所抽取样本的级别均值为830牛顿,则如果生产过程正常的话,
样本均值x ≤830牛顿的概率是多少? ⑶ 在检验人员假定生产过程的标准差固定不变时,你对b 部分有关当前生产过程的现
状有何看法(即夹克级别均值是否仍为840牛顿)?
⑷ 现在假设该生产过程的均值没有变化,但是过程的标准差从15牛顿增加到了45牛
顿。

在这种情况下x 的抽样分布是什么?当x 具有这种分布时,则x ≤830牛顿的概率是多少?
解: a. 正态 b. 约等于0 c. 不正常 d. 正态, 0.06
10. 在任何生产过程中,产品质量的波动都是不可避免的。

产品质量的变化可被分成两类:由于特殊原因所引起的变化(例如,某一特定的机器),以及由于共同的原因所引起的变化(例如,产品的设计很差)。

一个去除了质量变化的所有特殊原因的生产过程被称为是稳定的或者是在统计控
制中的。

剩余的变化只是简单的随机变化。

假如随机变化太大,则管理部门不能接受,但只要消除变化的共同原因,便可减少变化(Deming,1982,1986;De V or, Chang,和Sutherland,1992)。

通常的做法是将产品质量的特征绘制到控制图上,然后观察这些数值随时间如何变
动。

例如,为了控制肥皂中碱的数量,可以每小时从生产线中随机地抽选5=n 块试验肥皂作为样本,并测量其碱的数量,不同时间的样本含碱量的均值x 描绘在下图中。

假设这个过程是在统计控制中的,则x 的分布将具有过程的均值μ,标准差具有过程的标准差除以样本容量的平方根,n x σσ=。

下面的控制图中水平线表示过程均值,两条线称为控制极限度,位于μ的上下3x σ的位置。

假如x 落在界限的外面,则有充分的理由说明目前存在变化的特殊原因,这个过程一定是失控的。

当生产过程是在统计控制中时,肥皂试验样本中碱的百分比将服从%2=μ和
%1=σ的近似的正态分布。

⑴ 假设,4=n 则上下控制极限应距离μ多么远?
⑵ 假如这个过程是在控制中,则x 落在控制极限之外的概率是多少?
⑶ 假设抽取样本之前,过程均值移动到%3=μ,则由样本得出这个过程失控的(正
确的)结论的概率是多少?
解:a. 0.015 b. 0.0026 c. 0.1587
4.11. 参考练习4.10。

肥皂公司决定设置比练习4.10中所述的x σ3这一限度更为严格的控制
极限。

特别地,当加工过程在控制中时,公司愿意接受x 落在控制极限外面的概率是0.10。

⑴ 若公司仍想将控制极限度设在与均值的上下距离相等之处,并且仍计划在每小时的
样本中使用4=n 个观察值,则控制极限应该设定在哪里?
⑵ 假设a 部分中的控制极限已付诸实施,但是公司不知道,μ现在是3%
(而不是2%)。

若4=n ,则x 落在控制极限外面的概率是多少?若9=n 呢?
解: a. (0.012, 0.028) b. 0.6553, 0.7278
4.12. 参考练习4.11。

为了改进控制图的敏感性,有时将警戒线与控制极限一起画在图上。

警戒限一般被设定为x σμ96.1±。

假如有两个连续的数据点落在警戒限之外,则这个过程一定是失控的(蒙哥马利,1991年)。

⑴ 假设肥皂加工过程是在控制中(即,它遵循%2=μ和%1=σ的正态分布),则x
的下一个值落在警戒限之外的概率是什么?
⑵ 假设肥皂加工过程是在控制中,则你预料到画在控制图上的x 的这40个值中有多
少个点落在上控制极限以上?
⑶ 假设肥皂加工过程是在控制中,则x 的两个未来数值落在下警戒线以下的概率是多
少?
解: a. 0.05 b. 1 c. 0.000625
第5章 参数估计
●1. 从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。

(1) 样本均值的抽样标准差σ等于多少?
(2) 在95%的置信水平下,允许误差是多少?
解:已知总体标准差σ=5,样本容量n =40,为大样本,样本均值x =25,
(1)样本均值的抽样标准差
x σ5=0.7906 (2)已知置信水平1-α=95%,得 α/2Z =1.96,
于是,允许误差是E =
α/2Z =1.96×0.7906=1.5496。

●2.某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。

(3) 假定总体标准差为15元,求样本均值的抽样标准误差;
(4) 在95%的置信水平下,求允许误差;
(5) 如果样本均值为120元,求总体均值95%的置信区间。

解:(1)已假定总体标准差为σ=15元,
则样本均值的抽样标准误差为
σ15=2.1429 (2)已知置信水平1-α=95%,得 α/2Z =1.96,
于是,允许误差是E =
α/2Z =1.96×2.1429=4.2000。

(3)已知样本均值为x =120元,置信水平1-α=95%,得 α/2Z =1.96,
这时总体均值的置信区间为
±α/2x Z =120±4.2=124.2115.8 可知,如果样本均值为120元,总体均值95%的置信区间为(115.8,124.2)元。

●3.某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时):
3.3 3.1 6.2 5.8 2.3
4.1
5.4 4.5 3.2
4.4 2.0
5.4 2.6
6.4 1.8 3.5 5.7 2.3
2.1 1.9 1.2 5.1 4.3 4.2
3.6 0.8 1.5
4.7 1.4 1.2 2.9 3.5 2.4 0.5 3.6 2.5
求该校大学生平均上网时间的置信区间,置信水平分别为90%、95%和99%。

解:⑴计算样本均值x :将上表数据复制到Excel 表中,并整理成一列,点击最后数据下面空格,选择自动求平均值,回车,得到x =3.316667,
⑵计算样本方差s :删除Excel 表中的平均值,点击自动求值→其它函数→STDEV →选定计算数据列→确定→确定,得到s=1.6093
也可以利用Excel 进行列表计算:选定整理成一列的第一行数据的邻列的单元格,输入“=(a7-3.316667)^2”,回车,即得到各数据的离差平方,在最下行求总和,得到:
∑2
i
(x -x )=90.65 再对总和除以n-1=35后,求平方根,即为样本方差的值。

⑶计算样本均值的抽样标准误差:
已知样本容量 n =36,为大样本,
得样本均值的抽样标准误差为 x σ
s
1.6093=0.2682 ⑷分别按三个置信水平计算总体均值的置信区间:
① 置信水平为90%时:
由双侧正态分布的置信水平1-α=90%,通过2β-1=0.9换算为单侧正态分
布的置信水平β=0.95,查单侧正态分布表得 α/2Z =1.64,
计算得此时总体均值的置信区间为
±α/2s x Z 7±1.64×0.2682= 3.75652.8769 可知,当置信水平为90%时,该校大学生平均上网时间的置信区间为(2.87,3.76)小时;
② 置信水平为95%时:
由双侧正态分布的置信水平1-α=95%,得 α/2Z =1.96,
计算得此时总体均值的置信区间为
±α/2
s x Z 7±1.96×0.2682= 3.84232.7910
可知,当置信水平为95%时,该校大学生平均上网时间的置信区间为(2.79,3.84)小时;
③ 置信水平为99%时:
若双侧正态分布的置信水平1-α=99%,通过2β-1=0.99换算为单侧正态
分布的置信水平β=0.995,查单侧正态分布表得 α/2Z =2.58,
计算得此时总体均值的置信区间为
±α/2s x Z 7±2.58×0.2682= 4.00872.6247 可知,当置信水平为99%时,该校大学生平均上网时间的置信区间为(2.62,4.01)小时。

4. 从一个正态总体中随机抽取容量为8 的样本,各样本值分别为:10,8,12,15,6,13,5,11。

求总体均值95%的置信区间。

解:(7.1,12.9)。

5.某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离(公里)分别是:
10 3 14 8 6 9 12 11 7 5 10 15 9 16 13 2
求职工上班从家里到单位平均距离95%的置信区间。

解:(7.18,11.57)。

●6. 在一项家电市场调查中,随机抽取了200个居民户,调查他们是否拥有某一品牌的电视机。

其中拥有该品牌电视机的家庭占23%。

求总体比率的置信区间,置信水平分别为90%和95%。

解:已知样本容量n =200,为大样本,拥有该品牌电视机的家庭比率p =23%,
拥有该品牌电视机的家庭比率的抽样标准误差为
p σ⑴双侧置信水平为90%时,通过2β-1=0.90换算为单侧正态分布的置信水平β=0.95,查单侧正态分布表得 α/2Z =1.64,
此时的置信区间为 p ±αZ %±1.64×2.98%=27.89%18.11% 可知,当置信水平为90%时,拥有该品牌电视机的家庭总体比率的置信区间为(18.11%,27.89%)。

⑵双侧置信水平为95%时,得 α/2Z =1.96,
此时的置信区间为 p ±αZ %±1.96×2.98%=28.8408%17.1592% 可知,当置信水平为95%时,拥有该品牌电视机的家庭总体比率的置信区间为
;(17.16%,28.84%)。

●7.某居民小区共有居民500户,小区管理者准备采取一项新的供水设施,想了解居民是否赞成。

采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。

(1)求总体中赞成该项改革的户数比率的置信区间,置信水平为95%;
(2)如果小区管理者预计赞成的比率能达到80%,应抽取多少户进行调查?
解: 已知总体单位数N =500,重复抽样,样本容量n =50,为大样本, 样本中,赞成的人数为n 1=32,得到赞成的比率为 p = n 1n =3250
=64%
(1)赞成比率的抽样标准误差为 =6.788% 由双侧正态分布的置信水平1-α=95%,得 α/2Z =1.96,
计算得此时总体户数中赞成该项改革的户数比率的置信区间为
p ±αZ 64%±1.96×6.788%=77.304%50.696% 可知,置信水平为95%时,总体中赞成该项改革的户数比率的置信区间为
(50.70%,77.30%)。

(2)如预计赞成的比率能达到80%,即 p =80%,
由 得样本容量为 n =2
0.80.2(6.788%)⨯= 34.72 取整为35, 即可得,如果小区管理者预计赞成的比率能达到80%,应抽取35户进行调查。

8.从两个正态总体中分别抽取两个独立的随机样本,它们的均值和标准差如下表:
来自总体1的样本 来自总体2的样本
141=n
72=n 2.531=x
4.432=x 8.9621=s
0.10222=s
(1) 求21μμ-90%的置信区间; (2) 求21μμ-95%的置信区间。

解:(1.86,17.74);(0.19,19.41)。

9.从两个正态总体中分别抽取两个独立的随机样本,它们的均值和标准差如下表:
来自总体1的样本 来自总体2的样本
251=x
232=x 1621=s 2022=s
(1)设10021==n n ,求21μμ-95%的置信区间;
(2)设1021==n n ,2
221σσ=,求21μμ-95%的置信区间; (3)设1021==n n ,2
22
1σσ≠,求21μμ-95%的置信区间; (4)设20,1021==n n ,2
22
1σσ=,求21μμ-95%的置信区间;
(5)设20,1021==n n ,2
22
1σσ≠,求21μμ-95%的置信区间。

解:(1)2±1.176;(2)2±3.986;(3)2±3.986;(4)2±3.587;(5)2±3.364。

10.下表是由4对观察值组成的随机样本:
配对号 来自总体A 的样本 来自总体B 的样本
1 2 0 2 5 7 3 10 6 4
8
5
(1)计算A 与B 各对观察值之差,再利用得出的差值计算d 和d s ;
(2)设1μ和2μ分别为总体A 和总体B 的均值,构造)(21μμμ-d 95%的置信区间。

解:(1)75.1=d ,63.2=d s ;(2)1.75±4.27。

11.从两个总体中各抽取一个25021==n n 的独立随机样本,来自总体1的样本比率为
%401=p ,来自总体2的样本比率为%302=p 。

(1)构造21ππ-90%的置信区间;
(2)构造21ππ-95%的置信区间。

解:(1)10%±6.98%;(2)10%±8.32%。

12.生产工序的方差是共需质量的一个重要度量。

当方差较大时,需要对共需进行改进以减
构造两个总体方差比2221σσ95%的置信区间。

解:(4.06,14.35)。

●13.根据以往的生产数据,某种产品的废品率为2%。

如果要求95%的置信区间,若要求允许误差不超过4%,应抽取多大的样本?
解:已知总体比率π=2%=0.02,由置信水平1-α=95%,得置信度α/2Z =1.96,允许误差E ≤ 4%
即由允许误差公式 E=
/2
Z ασn 的计算公式:
n=2
(
)E
α/2P
Z σ=2
=
2E 2α/2Z π(1-π)
≥2
0.020.980.04
⨯⨯21.96=47.0596 由于计算结果大于47,故为保证使“≥”成立,至少应取48个单位的样本。

●14.某超市想要估计每个顾客平均每次购物花费的金额。

根据过去的经验,标准差大约为120元,现要求以95%的置信水平估计每个购物金额的置信区间,并要求允许误差不超过20元,应抽取多少个顾客作为样本?
解:已知总体标准差σ=120,由置信水平1-α=95%,得置信度α/2Z =1.96,允许误差E ≤ 20
即由允许误差公式 E=/2
Z x ασn 的计算公式:
n=2(
)E
α/2x
Z σ≥2
(
)20
⨯1.96120=138.2976 由于计算结果大于47,故为保证使“≥”成立,至少应取139个顾客作为样本。

15.假定两个总体的标准差分别为:121=σ,152=σ,若要求误差范围不超过5,相应的置信水平为95%,假定21n n =,估计两个总体均值之差21μμ-时所需的样本容量为多大? 解: 57。

16.假定21n n =,允许误差05.0=E ,相应的置信水平为95%,估计两个总体比率之差
21ππ-时所需的样本容量为多大?
解: 769。

第6章 假设检验——练习题(全免)
6.1 研究者想要寻找证据予以支持的假设是“新型弦线的平均抗拉强度相对于以前提高了”,
所以原假设与备择假设应为:1035:0≤μH ,1035:1>μH 。

6.2
π=
“某一品种的小鸡因为同类相残而导致的死亡率”,04.0:0≥πH ,04.0:1<πH 。

6.3 65:0=μH ,65:1≠μH 。

6.4 (1)第一类错误是该供应商提供的这批炸土豆片的平均重量的确大于等于60克,但
检验结果却提供证据支持店方倾向于认为其重量少于60克;
(2)第二类错误是该供应商提供的这批炸土豆片的平均重量其实少于60克,但检验结果却没有提供足够的证据支持店方发现这一点,从而拒收这批产品; (3)连锁店的顾客们自然看重第二类错误,而供应商更看重第一类错误。

6.5 (1)检验统计量n
s x z /μ-=
,在大样本情形下近似服从标准正态分布;
(2)如果05.0z z >,就拒绝0H ;
(3)检验统计量z =2.94>1.645,所以应该拒绝0H 。

6.6 z =3.11,拒绝0H 。

6.7 z =1.93,不拒绝0H 。

6.8 z =
7.48,拒绝0H 。

6.9 2
=206.22,拒绝0H 。

6.10 z =-5.145,拒绝0H 。

6.11 t =1.36,不拒绝0H 。

6.12 z =-4.05,拒绝0H 。

6.13 F =8.28,拒绝0H 。

6.14 (1)检验结果如下:
t-检验: 双样本等方差假设
变量 1
变量 2
平均 100.7
109.9
方差 24.11578947
33.35789474
观测值 20
20
合并方差 28.73684211
假设平均差 0 df 38
t Stat -5.427106029 P(T<=t) 单尾 1.73712E-06 t 单尾临界 1.685953066 P(T<=t) 双尾 3.47424E-06 t 双尾临界
2.024394234
t-检验: 双样本异方差假设
变量 1
变量 2
平均 100.7
109.9
方差 24.11578947
33.35789474
观测值 20 20
假设平均差 0 df 37
t Stat -5.427106029 P(T<=t) 单尾 1.87355E-06 t 单尾临界 1.687094482 P(T<=t) 双尾 3.74709E-06 t 双尾临界
2.026190487
(2)方差检验结果如下:
F-检验 双样本方差分析
变量 1
变量 2
平均 100.7
109.9
方差 24.11578947
33.35789474
观测值 20 20 df 19
19
F
0.722940991 P(F<=f) 单尾 0.243109655 F 单尾临界
0.395811384
第7章 方差分析与试验设计——练习题(全免)
7.1 0215.86574.401.0=<=F F (或01.00409.0=>=-αvalue P ),不能拒绝原假设。

7.2 8853.30684.1705.0=>=F F (或05.00003.0=<=-αvalue P ),拒绝原假设。

85.54.14304.44=>=-=-LSD x x B A ,拒绝原假设; 85.58.16.424.44=<=-=-LSD x x C A ,不能拒绝原假设; 85.56.126.4230=>=-=-LSD x x C B ,拒绝原假设。

7.3
554131.3478.105.0=<=F F (或05.0245946.0=>=-αvalue P ),不能拒绝原假
设。

7.4 有5种不同品种的种子和4种不同的施肥方案,在20快同样面积的土地上,分别采用
5种种子和4种施肥方案搭配进行试验,取得的收获量数据如下表:
2592.32397.705.0=>=F F 种子(或05.00033.0=<=-αvalue P ),拒绝原假设。

4903.32047.905.0=<=F F 施肥方案(或05.00019.0=<=-αvalue P ),拒绝原假设。

7.5 9443.60727.005.0=<=F F 地区(或05.09311.0=>=-αvalue P ),不能拒绝原假
设。

9443.61273.305.0=<=F F 包装方法(或05.01522.0=>=-αvalue P ),不能拒绝原假设。

7.6 1432.575.1005.0=>=F F 广告方案(或05.00104.0=<=-αvalue P ),拒绝原假设。

9874.5305.0=<=F F 广告媒体(或05.01340.0=>=-αvalue P ),不能拒绝原假设。

1432.575.105.0=<=F F 交互作用(或05.02519.0=>=-αvalue P ),不能拒绝原假
设。

第8章 相关与回归分析——练习题
●1. 表中是道琼斯工业指数(DJIA )和标准普尔500种股票指数(S&P500)1988年至1997年对应股票的收益率资料:
计算两种指数收益率的相关系数,分析其相关程度,以0.05的显著性水平检验相关系数的显著性。

解:(1)解法一:利用Excel 进行表格计算相关系数
设DJIA 收益率为x ,S&P500收益率为y ,将已知表格复制到Excel 中, 列出计算x 2、xy 、y 2及其合计数的栏目并进行计算,得结果如下:
代入相关系数计算公式得: r =
n xy x y -
= 0.948138
解法二:利用Excel 函数“CORREL ”计算相关系数 (Correlation coefficient, 相关系数)
①将已知数据表复制到Excel 中,同类数据置于同一列;
②在表格外选择某一单元格后,点选菜单栏中“∑”右边的“▼”后,选择
“其它函数”,在“插入函数”窗口中,点击“或选择类别(C)”输入栏右边的“∨”,选择“统计”,再在“选择函数(N)”中选择函数“CORREL ”,然后点击“确定”;
③在“函数参数”窗口中,点击“Array1”输入栏后,在Excel 表中刷取“DJIA
收益率”数据,再点击“Array2”输入栏后,在Excel 表中刷取“S&P500收益率
”数据,然后点击“确定”。

(由于相关系数中,两变量是对等的,故两列数据的选择顺序可以对换,而
计算结果是相同的。


这时即在第②步骤中所选择的单元格中出现相关系数的计算结果。

可知,相关系数为
0.948138XY r =,
以上相关系数的计算结果说明,DJIA 收益率与S&P500收益率的相关程度属于高度正相关。

(2)计算t 统计量(免)
2.681739
8.4368510.317859
t =
=
=
=
给定显著性水平=0.05,查t 分布表得自由度n-2=10-2=8的临界值t α为2.306, 显然t t α>,表明相关系数 r 在统计上是显著的。

● 2.利用【例8-3】的表8.3中提供的各省市人均GDP 和第一产业中就业比例的数据,试
分析各省市人均GDP 与第一产业就业比例的相关性,并对其显著性作统计检验。

解: 表8.3中提供的各省市人均GDP 和第一产业中就业比例的数据为:
序号 地区 GDP 就业比例%
17 湖北 4662.28 48.4 18 湖南 3983.00 60.5 19
广东
10647.70
40.0。

相关文档
最新文档