(完整版)统计学习题答案_第4章__抽样与抽样分布
抽样分布习题及答案
抽样分布习题及答案抽样分布习题及答案抽样分布是统计学中一个重要的概念,它描述了从总体中抽取样本后,样本统计量的分布情况。
在实际应用中,我们经常需要利用抽样分布来进行统计推断,因此对于抽样分布的理解和掌握是十分必要的。
本文将介绍一些常见的抽样分布习题,并提供相应的答案。
1. 问题:某公司有1000名员工,其中400人是女性。
现从中随机抽取100人,求抽取样本中女性人数的抽样分布。
解答:在这个问题中,我们可以将女性的出现看作是一个二项分布的实验,成功的概率为0.4。
因此,抽取样本中女性人数的抽样分布是一个二项分布。
根据二项分布的性质,我们可以计算出不同女性人数的概率。
2. 问题:某电商平台有1000个用户,他们的购买金额服从均值为100元,标准差为20元的正态分布。
现从中随机抽取50个用户,求抽取样本的平均购买金额的抽样分布。
解答:在这个问题中,样本的平均购买金额的抽样分布是一个服从均值为100元,标准差为20/√50元的正态分布。
根据正态分布的性质,我们可以计算出不同平均购买金额的概率。
3. 问题:某城市的居民年收入服从均值为50000元,标准差为10000元的正态分布。
现从中随机抽取200个居民,求抽取样本的平均年收入的抽样分布。
解答:在这个问题中,样本的平均年收入的抽样分布是一个服从均值为50000元,标准差为10000/√200元的正态分布。
根据正态分布的性质,我们可以计算出不同平均年收入的概率。
4. 问题:某医院每天接诊的患者数服从均值为50人,标准差为10人的泊松分布。
现从中随机抽取30天,求抽取样本的平均每天接诊的患者数的抽样分布。
解答:在这个问题中,样本的平均每天接诊的患者数的抽样分布是一个服从均值为50人,标准差为10/√30人的正态分布。
根据正态分布的性质,我们可以计算出不同平均每天接诊的患者数的概率。
通过以上几个习题的解答,我们可以看到不同问题中抽样分布的情况是不同的,需要根据具体的问题来确定抽样分布的类型和参数。
统计学习题_第四章_数据分布特征的描述习题答案
统计学习题_第四章_数据分布特征的描述习题答案第四章静态指标分析法(⼀)⼀、填空题1、数据分布集中趋势的测度值(指标)主要有、和。
其中和⽤于测度品质数据集中趋势的分布特征,⽤于测度数值型数据集中趋势的分布特征。
2、标准差是反映的最主要指标(测度值)。
3、⼏何平均数是计算和的⽐较适⽤的⼀种⽅法。
4、当两组数据的平均数不等时,要⽐较其数据的差异程度⼤⼩,需要计算。
5、在测定数据分布特征时,如果M M e X 0==,则认为数据呈分布。
6、当⼀组⼯⼈的⽉平均⼯资悬殊较⼤时,⽤他们⼯资的⽐其算术平均数更能代表全部⼯⼈⼯资的总体⽔平。
⼆.选择题单选题:1.反映的时间状况不同,总量指标可分为()A 总量指标和时点总量指标B 时点总量指标和时期总量指标C 时期总量指标和时间指标D 实物量指标和价值量指标2、某⼚1999年完成产值200万元,2000年计划增长10%,实际完成了231万元,超额完成( )A 5.5%B 5%C 115.5%D 15.5%3、在同⼀变量数列中,当标志值(变量值)⽐较⼤的次数较多时,计算出来的平均数()A 接近标志值⼩的⼀⽅B 接近标志值⼤的⼀⽅C 接近次数少的⼀⽅D 接近哪⼀⽅⽆法判断4、在计算平均数时,权数的意义和作⽤是不变的,⽽权数的具体表现()A 可变的B 总是各组单位数C 总是各组标志总量D 总是各组标志值 5、1998年某⼚甲车间⼯⼈的⽉平均⼯资为520元,⼄车间⼯⼈的⽉平均⼯资为540元,1999年各车间的⼯资⽔平不变,但甲车间的⼯⼈占全部⼯⼈的⽐重由原来的40%提⾼到了60%,则1999年两车间⼯⼈的总平均⼯资⽐1998年()A 提⾼D 不能做结论 6、在变异指标(离散程度测度值)中,其数值越⼩,则()A 说明变量值越分散,平均数代表性越低B 说明变量值越集中,平均数代表性越⾼C 说明变量值越分散,平均数代表性越⾼D 说明变量值越集中,平均数代表性越低7、有甲、⼄两数列,已知甲数列:07.7,70==甲甲σX ;⼄数列:41.3,7==⼄⼄σX 根据以上资料可直接判断( )A 甲数列的平均数代表性⼤B ⼄数列的平均数代表性⼤C 两数列的平均数代表性相同D 不能直接判别8、杭州地区每百⼈⼿机拥有量为90部,这个指标是()A 、⽐例相对指标B 、⽐较相对指标C 、结构相对指标D 、强度相对指标9、某组数据呈正态分布,计算出算术平均数为5,中位数为7,则该数据分布为() A 、左偏分布 B 、右偏分布 C 、对称分布 D 、⽆法判断10、加权算术平均数的⼤⼩() A 主要受各组标志值⼤⼩的影响,与各组次数多少⽆关; B 主要受各组次数多少的影响,与各组标志值⼤⼩⽆关; C 既与各组标志值⼤⼩⽆关,也与各组次数多少⽆关; D 既与各组标志值⼤⼩有关,也受各组次数多少的影响11、已知⼀分配数列,最⼩组限为30元,最⼤组限为200元,不可能是平均数的为() A 、50元 B 、80元 C 、120元 D 、210元12、⽐较两个单位的资料,甲的标准差⼩于⼄的标准差,则()A 两个单位的平均数代表性相同B 甲单位平均数代表性⼤于⼄单位C ⼄单位平均数代表性⼤于甲单位D 不能确定哪个单位的平均数代表性⼤ 13、若单项数列的所有标志值都增加常数9,⽽次数都减少三分之⼀,则其算术平均数() A 、增加9 B 、增加6 C 、减少三分之⼀ D 、增加三分之⼆ 14、如果数据分布很不均匀,则应编制 ( )A 开⼝组B 闭⼝组C 等距数列D 异距数列 15、计算总量指标的基本原则是:( )A 总体性B 全⾯性16、某企业的职⼯⼯资分为四组:800元以下;800-1000元;1000—1500元;1500以上,则1500元以上这组组中值应近似为 ( )A1500元 B 1600元 C 1750元 D 2000元 17、统计分组的⾸要问题是 ( )A 选择分组变量和确定组限B 按品质标志分组C 运⽤多个标志进⾏分组,形成⼀个分组体系D 善于运⽤复合分组18、某连续变量数列,其末组为开⼝组,下限为200,⼜知其邻组的组中值为170,则末组组中值为 ( )A 230B 260C 185D 215 19、分配数列中,靠近中间的变量值分布的次数少,靠近两端的变量值分布的次数多,这种分布的类型是 ( )A 钟型分布B U 型分布C J 型分布D 倒J 型分布 20、要了解上海市居民家庭的开⽀情况,最合适的调查⽅式是:() A 普查 B 抽样调查 C 典型调查 D 重点调查21、已知两个同类企业的职⼯平均⼯资的标准差分别为5元和6元,⽽平均⼯资分别为3000元,3500元则两企业的⼯资离散程度为 ( )A 甲⼤于⼄B ⼄⼤于甲C ⼀样的D ⽆法判断 22、加权算术平均数的⼤⼩取决于 ( )A 变量值B 频数C 变量值和频数D 频率23、如果所有标志值的频数都减少为原来的1/5,⽽标志值仍然不变.那么算术平均数 ( ) A 不变 B 扩⼤到5倍 C 减少为原来的1/5D 不能预测其变化 24、计算平均⽐率最好⽤ ( )A 算术平均数B 调和平均数C ⼏何平均数D 中位数25、若两数列的标准差相等⽽平均数不同,在⽐较两数列的离散程度⼤⼩时,应采⽤ ( ) A 全距 B 平均差 C 标准差 D 标准差系数26、若n=20,∑∑==2080,2002x x ,标准差为 ( )A 2B 4C 1.5D 327、已知某总体3215,3256==eMM,则数据的分布形态为( )A左偏分布 B 正态分布 C 右偏分布 D U型分布28、⼀次⼩型出⼝商品洽谈会,所有⼚商的平均成交额的⽅差为156.25万元,标准差系数为14.2%,则平均成交额为( )万元A11 B 177.5 C 22.19 D 8826、欲粗略了解我国钢铁⽣产的基本情况,调查了上钢、鞍钢等⼗⼏个⼤型的钢铁企业,这是()A普查B重点调查C典型调查D抽样调查多选题:1.某企业计划2000年成本降低率为8%,实际降低了10%。
统计学 第四版 第七章答案
第四章 抽样分布与参数估计7。
2 某快餐店想要估计每位顾客午餐的平均花费金额。
在为期3周的时间里选取49名顾客组成了一个简单随机样本。
(1)假定总体标准差为15元,求样本均值的抽样标准误差.x σ===2。
143 (2)在95%的置信水平下,求边际误差.x x t σ∆=⋅,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=2z α 因此,x x t σ∆=⋅x z ασ=⋅0.025x z σ=⋅=1.96×2.143=4。
2 (3)如果样本均值为120元,求总体均值 的95%的置信区间. 置信区间为:(),x x x x -∆+∆=()120 4.2,120 4.2-+=(115。
8,124.2)7。
4 从总体中抽取一个n=100的简单随机样本,得到x =81,s=12.要求:大样本,样本均值服从正态分布:2,xN n σμ⎛⎫ ⎪⎝⎭或2,s xN n μ⎛⎫⎪⎝⎭置信区间为:22x z x z αα⎛-+ ⎝。
2 (1)构建μ的90%的置信区间.2z α=0.05z =1.645,置信区间为:()81 1.645 1.2,81 1.645 1.2-⨯+⨯=(79。
03,82.97)(2)构建μ的95%的置信区间。
2z α=0.025z =1.96,置信区间为:()81 1.96 1.2,81 1.96 1.2-⨯+⨯=(78.65,83.35)(3)构建μ的99%的置信区间.2z α=0.005z =2.576,置信区间为:()81 2.576 1.2,81 2.576 1.2-⨯+⨯=(77。
91,84。
09)7.7 某大学为了解学生每天上网的时间,在全校7 500名学生中采取重复抽样方法随机抽取36解:(1)样本均值x =3.32,样本标准差s=1.61; (2)抽样平均误差: 重复抽样:x σ≈不重复抽样:x σ≈=0。
268×0.998=0。
267(3)置信水平下的概率度:1α-=0.9,t=2z α=0.05z =1。
统计学习题(抽样分布、参数估计)
统计学习题(抽样分布、参数估计)练习题第1章绪论(略)第2章统计数据的描述2.1某家商场为了解前来该商场购物的顾客的学历分布情况,随机抽取了100名顾客。
其学历表示为:1.初中;2.高中/中专;3.大专;4.本科及以上学历。
调查结果如下:4222434414 2244432422 3121441424 2332134344 3312424324 2322212244 2123333334 2343313232 4313434214 2242334121(1)制作一张频数分布表。
(2)绘制一张条形图,反映学历分布。
2.2为了解某电信客户对该电信公司的服务的满意度情况,某调查公司分别对两个地区的电信用户在以下五个方面对受访用户的满意情况进行了问卷调查得到的数据如下(表中数据为平均满意度打分,从1分到10分满意度依次递增):地区企业形象客户期望质量感知价值感知客户总体满意度A 8.269504 7.51773 9.2624117.9148948.411348B 7.447368 8.3684218.9736848.1052637.394737试用条形图反映将两地区的满意度情况。
2.3下面是一个班50个学生的经济学考试成绩:88569179699088718279 988534744810075956092 83646569996445766369 6874948167818453912484628183698429667594(1)对这50名学生的经济学考试成绩进行分组并将其整理成频数分布表,绘制直方图。
(2)用茎叶图将原始数据表现出来。
2.4如下数据反映的是某大学近视度数的情况,共120名受访同学,男女同学各60名。
男149 161761821310 80 951081414 0 144145151515161681882121 0 21211052121211116817521 0 356462121212121312121 0 2121212121375375383838 8 45566065120 30120 7521女120 3334537437538700 90700 60141516212121211517170 0 0 0 0 0 0 0 5 521 0 1752121214043451217517 8 181818518519195196202021 0 21212121212121333335 0 3636363840474865055(1)按近视度数分别对男女学生进行分组。
抽样分布习题 答案
抽样分布习题答案抽样分布习题答案随着统计学的发展,抽样分布成为了统计推断的重要基础。
在统计学中,我们经常需要从总体中抽取一部分样本,然后通过对样本的分析来推断总体的特征。
而抽样分布则是描述样本统计量的分布情况的概率分布。
在这篇文章中,我们将回答一些关于抽样分布的习题,帮助读者更好地理解和应用这一概念。
1. 假设某个总体的均值为μ,标准差为σ,从该总体中抽取样本容量为n的简单随机样本。
则样本均值的抽样分布的均值为多少?标准差为多少?答案:样本均值的抽样分布的均值为总体均值μ,标准差为总体标准差σ除以样本容量n的平方根,即σ/√n。
这意味着随着样本容量的增加,样本均值的抽样分布的标准差将减小,从而更加接近总体均值。
2. 假设某个总体服从正态分布,均值为μ,标准差为σ。
从该总体中抽取样本容量为n的简单随机样本,计算样本均值。
当n足够大时,样本均值的抽样分布将近似服从什么分布?答案:当样本容量n足够大时,样本均值的抽样分布将近似服从正态分布。
这是由于中心极限定理的适用,即当样本容量足够大时,样本均值的抽样分布将趋于正态分布,无论总体的分布形态如何。
3. 假设某个总体服从正态分布,均值为μ,标准差为σ。
从该总体中抽取样本容量为n的简单随机样本,计算样本标准差。
当n足够大时,样本标准差的抽样分布将近似服从什么分布?答案:当样本容量n足够大时,样本标准差的抽样分布将近似服从正态分布。
这是由于当样本容量足够大时,样本标准差的抽样分布可以通过中心极限定理近似为正态分布。
4. 假设某个总体的比例为p,从该总体中抽取样本容量为n的简单随机样本,计算样本比例。
样本比例的抽样分布的均值和标准差分别为多少?答案:样本比例的抽样分布的均值为总体比例p,标准差为√(p(1-p)/n)。
这意味着当样本容量足够大时,样本比例的抽样分布将近似服从正态分布,均值为总体比例p,标准差为√(p(1-p)/n)。
通过以上习题的解答,我们可以看到抽样分布在统计推断中的重要性。
(完整版)抽样调查习题及答案
第四章习题抽样调查一、填空题1.抽样调查是遵循随机的原则抽选样本,通过对样本单位的调查来对研究对象的总体数量特征作出推断的。
2.采用不重复抽样方法,从总体为N的单位中,抽取样本容量为n的可能样本个数为N(N-1)(N-2)……(N-N+1)。
3.只要使用非全面调查的方法,即使遵守随机原则,抽样误差也不可避免会产生。
4.参数估计有两种形式:一是点估计,二是区间估计。
5.判别估计量优良性的三个准则是:无偏性、一致性和有效性。
6.我们采用“抽样指标的标准差”,即所有抽样估计值的标准差,作为衡量抽样估计的抽样误差大小的尺度。
7.常用的抽样方法有简单随机抽样、类型(分组)抽样、等距抽样、整群抽样和分阶段抽样。
8.对于简单随机重复抽样,若其他条件不变,则当极限误差范围Δ缩小一半,抽样单位数必须为原来的4倍。
若Δ扩大一倍,则抽样单位数为原来的1/4。
9.如果总体平均数落在区间960~1040内的概率是95%,则抽样平均数是1000,极限抽样误差是40.82,抽样平均误差是20.41。
10.在同样的精度要求下,不重复抽样比重复抽样需要的样本容量少,整群抽样比个体抽样需要的样本容量多。
二、判断题1.抽样误差是抽样调查中无法避免的误差。
(√)2.抽样误差的产生是由于破坏了随机原则所造成的。
(×)3.重复抽样条件下的抽样平均误差总是大于不重复抽样条件下的抽样平均误差。
(√)4.在其他条件不变的情况下,抽样平均误差要减少为原来的1/3,则样本容量必须增大到9倍。
(√)5.抽样调查所遵循的基本原则是可靠性原则。
(×)6.样本指标是一个客观存在的常数。
(×)7.全面调查只有登记性误差而没有代表性误差,抽样调查只有代表性误差而没有登记性误差。
(×)8.抽样平均误差就是抽样平均数的标准差。
(×)三、单项选择题1.用简单随机抽样(重复)方法抽取样本单位,如果要使抽样平均误差降低50%,则样本容量需扩大为原来的(C)A.2倍B.3倍C.4倍D.5倍2.事先将全及总体各单位按某一标志排列,然后依固定顺序和间隔来抽选调查单位的抽样组织方式叫做(D)A.分层抽样B.简单随机抽样C.整群抽样D.等距抽样3.计算抽样平均误差时,若有多个样本标准差的资料,应选哪个来计算(B)A.最小一个B.最大一个C.中间一个D.平均值4.抽样误差是指(D)A.计算过程中产生的误差B.调查中产生的登记性误差C.调查中产生的系统性误差D.随机性的代表性误差5.抽样成数是一个(A)A.结构相对数B.比例相对数C.比较相对数D.强度相对数6.成数和成数方差的关系是(C)A.成数越接近于0,成数方差越大B.成数越接近于1,成数方差越大C.成数越接近于0.5,成数方差越大D.成数越接近于0.25,成数方差越大7.整群抽样是对被抽中的群作全面调查,所以整群抽样是(B)A.全面调查B.非全面调查C.一次性调查D.经常性调查8.对400名大学生抽取19%进行不重复抽样调查,其中优等生比重为20%,概率保证程度为95.45%,则优等生比重的极限抽样误差为(40%)A. 4%B. 4.13%C. 9.18%D. 8.26%9.根据5%抽样资料表明,甲产品合格率为60%,乙产品合格率为80%,在抽样产品数相等的条件下,合格率的抽样误差是(B)A.甲产品大B.乙产品大C.相等D.无法判断10.抽样调查结果表明,甲企业职工平均工资方差为25,乙企业为100,又知乙企业工人数比甲企业工人数多3倍,则随机抽样误差(B)A.甲企业较大B.乙企业较大C.不能作出结论D.相同四、多项选择题抽样调查中的抽样误差是(ABCDE)A.是不可避免要产生的B.是可以通过改进调查方法来避免的C.是可以计算出来的D.只能在调查结果之后才能计算E.其大小是可以控制的2.重复抽样的特点是(AC)A.各次抽选相互影响B.各次抽选互不影响C.每次抽选时,总体单位数始终不变D每次抽选时,总体单位数逐渐减少E.各单位被抽中的机会在各次抽选中相等3.抽样调查所需的样本容量取决于(ABE)A.总体中各单位标志间的变异程度B.允许误差C.样本个数D.置信度E.抽样方法4.分层抽样误差的大小取决于(BCD)A.各组样本容量占总体比重的分配状况B.各组间的标志变异程度C.样本容量的大小D.各组内标志值的变异程度E.总体标志值的变异程度5.在抽样调查中(ACD)A.全及指标是唯一确定的B.样本指标是唯一确定的C.全及总体是唯一确定的D.样本指标是随机变量E.全及指标是随机变量五、名词解释1.抽样推断2.抽样误差3.重复抽样与不重复抽样4.区间估计六、计算题1.某公司有职工3000人,现从中随机抽取60人调查其工资收入情况,得到有关资料如下:(1)试以0.95的置信度估计该公司工人的月平均工资所在范围。
统计学人大第四版课后答案
3.1 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。
服务质量的等级分别表示为:A.好;B.较好;C一般;D.较差;E.差。
调查结果如下:B EC C AD C B A ED A C B C DE C E EA DBC C A ED C BB ACDE A B D D CC B C ED B C C B CD A C B C DE C E BB EC C AD C B A EB AC E E A BD D CA DBC C A ED C BC B C ED B C C B C要求:(1)指出上面的数据属于什么类型。
顺序数据(2)用Excel制作一张频数分布表。
用数据分析——直方图制作:接收频率E16D17C32B21A14(3)绘制一张条形图,反映评价等级的分布。
用数据分析——直方图制作:(4)绘制评价等级的帕累托图。
逆序排序后,制作累计频数分布表:接收频数频率(%)累计频率(%)C 32 32 32B 21 21 53D 17 17 70E 16 16 86A 14 14 1005101520253035CDBAE204060801001203.2 某行业管理局所属40个企业2002年的产品销售收入数据如下: 152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 9788123115119138112146113126要求:(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。
1、确定组数:()l g 40l g () 1.60206111 6.32l g (2)l g 20.30103n K =+=+=+=,取k=6 2、确定组距:组距=( 最大值 - 最小值)÷ 组数=(152-87)÷6=10.83,取10 3(2)按规定,销售收入在125万元以上为先进企业,115~125万元为良好企业,105~115 万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。
生物统计学答案 第四章 抽样分布
第四章 抽样分布4.1 第四章的习题读者可以照常练习。
在这里,利用SAS 软件包中的“正态分布随机数函数”做一抽样试验,进行一个类似的演示。
假定总体平均数 μ =8,标准差 σ =2,用下式:Y =8+2×正态分布随机数,获得一个服从N (8,22)分布的正态总体。
从该正态总体中随机抽取含量为100的样本,共抽取10 000个样本。
计算每一样本的s s y 和2,,然后计算样本平均数、样本方差和样本标准差的平均数(s s y ,,2)以及它们的标准差(s s y s s s ,,2)。
用上述结果与s s y 和2,分布的特征数[分别见(4.1),(4.2)式;(4.14),(4.15)式以及(4.18),(4.19)式] 比较。
看一看抽样的结果是否能够很好地估计总体参数。
抽样试验还可以进一步深入,计算每一样本的t 。
然后计算t 的平均数和标准差,用计算的结果与t 分布的特征数比较,[见(4.8),(4.9) 式]。
看一看抽样的结果与总体参数的一致性是否很好。
为了与问题的要求一致,抽样分两部分进行,下面先讨论样本平均数、样本方差和样本标准差的分布。
SAS 程序如下:options nodate;data value;n=100;m=10000;df=n-1;do i=1 to m;retain seed 3053177;do j=1 to n;y=8+2*normal(seed);output;end;end;data disv;set value;sqy=y*y;by i;if first.i then sumy=0;sumy+y;if first.i then sumsqy=0;sumsqy+sqy;my=sumy/n;vacey=(sumsqy-my*sumy)/df;stdy=sqrt(vacey);if last.i then output;run;proc means mean var std;var my stdy vacey;title 'Sampling Distribution: Mu=8 sigma=2';run;程序运行的结果见下表:Sampling Distribution: Mu=8 sigma=2Variable Mean Variance Std Dev-------------------------------------------------- MY 8.0005218 0.0394867 0.1987126STDY 1.9949780 0.0204989 0.1431743VACEY 4.0004341 0.3294953 0.5740169--------------------------------------------------下面将相应的参数值,列成一个对应的表格,以便能够在抽样的结果与总体参数间做一个很清楚地比较。
统计学课后习题答案_(第四版)4.5.7.8章
《统计学》第四版 第四章练习题答案4.1 (1)众数:M 0=10; 中位数:中位数位置=n+1/2=5.5,M e =10;平均数:6.91096===∑nxx i(2)Q L 位置=n/4=2.5, Q L =4+7/2=5.5;Q U 位置=3n/4=7.5,Q U =12 (3)2.494.1561)(2==-=∑-n i s x x (4)由于平均数小于中位数和众数,所以汽车销售量为左偏分布。
4.2 (1)从表中数据可以看出,年龄出现频数最多的是19和23,故有个众数,即M 0=19和M 0=23。
将原始数据排序后,计算中位数的位置为:中位数位置= n+1/2=13,第13个位置上的数值为23,所以中位数为M e =23(2)Q L 位置=n/4=6.25, Q L ==19;Q U 位置=3n/4=18.75,Q U =26.5(3)平均数==∑nx x i600/25=24,标准差65.612510621)(2=-=-=∑-n i s x x(4)偏态系数SK=1.08,峰态系数K=0.77(5)分析:从众数、中位数和平均数来看,网民年龄在23-24岁的人数占多数。
由于标准差较大,说明网民年龄之间有较大差异。
从偏态系数来看,年龄分布为右偏,由于偏态系数大于1,所以,偏斜程度很大。
由于峰态系数为正值,所以为尖峰分布。
4.3 (1(2)==∑nx x i63/9=7,714.0808.41)(2==-=∑-n i s x x (3)由于两种排队方式的平均数不同,所以用离散系数进行比较。
第一种排队方式:v 1=1.97/7.2=0.274;v 2=0.714/7=0.102.由于v 1>v 2,表明第一种排队方式的离散程度大于第二种排队方式。
(4)选方法二,因为第二种排队方式的平均等待时间较短,且离散程度小于第一种排队方式。
4.4 (1)==∑nx x i8223/30=274.1中位数位置=n+1/2=15.5,M e =272+273/2=272.5(2)Q L 位置=n/4=7.5, Q L ==(258+261)/2=259.5;Q U 位置=3n/4=22.5,Q U =(284+291)/2=287.5(3) 17.211307.130021)(2=-=-=∑-n i s x x4.5 (1)甲企业的平均成本=总成本/总产量=41.193406600301500203000152100150030002100==++++乙企业的平均成本=总成本/总产量=29.183426255301500201500153255150015003255==++++原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
统计学(第五版)贾俊平_课后思考题和练习题答案(最终完整版)
第一部分 思考题
第一章思考题 1.1 什么是统计学 统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得 出结论。 1.2 解释描述统计和推断统计 描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。 推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。 1.3 统计学的类型和不同类型的特点 统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果, 数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这 些类别是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。 统计数据;按统计数据都收集方法分; 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件 下得到的。 实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分; 截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。 时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。 1.4 解释分类数据,顺序数据和数值型数据 答案同 1.3 1.5 举例说明总体,样本,参数,统计量,变量这几个概念 对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百 个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的 数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是 统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。 1.6 变量的分类 变量可以分为分类变量,顺序变量,数值型变量。 变量也可以分为随机变量和非随机变量。经验变量和理论变量。 1.7 举例说明离散型变量和连续性变量 离散型变量,只能取有限个值,取值以整数位断开,比如“企业数” 连续型变量,取之连续不断,不能一一列举,比如“温度” 。 1.8 统计应用实例 人口普查,商场的名意调查等。 1.9 统计应用的领域 经济分析和政府分析还有物理,生物等等各个领域。
第4章 抽样分布与参数估计课后习题解答
C.在做成数估计时,用成数方差最大值 0.25 来代替
二、计算题
1.某市居民家庭人均年收入是服从 μ=4000 元, σ=1200 元的正态分布, 求该市居民家庭人均年收入: (1)在 5000~7000 元之间的概率; (2)超过 8000 元的概率。 (1) μ = 4000 , σ = 1200 解:
。 (2)在其他条件不变的情况下,如果允许误差缩小为原来的 1/2,则样本容量( A ) A.扩大为原来的 4 倍 C.缩小为原来的 1/2 B.扩大为原来的 2 倍 D.缩小为原来的 1/4
(3)类型抽样影响抽样平均误差的方差是( B ) 。 A.组间方差 B.组内方差 C.总方差 D.允许误差
( B ) 。 (4) 当样本单位数充分大时, 样本估计量充分地靠近总体指标的可能性趋于 1, 称为抽样估计的 A.无偏性 2.多项选择题 。 (1)影响抽样平均误差的因素有( ABCD ) A.总体标志变异程度 D.抽样的组织形式 B.样本容量 C.抽样方式 B.一致性 C.有效性 D.充分性
σ2(X )⎛
n
n⎞ ⎜1 − ⎟ = ⎝ N⎠
( 28.284 )
2
2
2⎞ ⎛ 接近平均工资的标 ⎜1 − ⎟ = 17.88837 , ⎝ 10 ⎠
莫名
编辑
作为样本。
解: (1) X =
∑X
i
i
n
=
105 = 3.5 , S = 30
∑( X − X )
I
2
n
= 1.1963 , δ x =
= 2。
p (1 − p ) = 0.015 。 n
2
= Z 0.02275 = 2 , P ± Zα 2δ ( p ) = 95% ± 2 × 0.015 ×100% = 95% ± 3% 。
《统计学》-第4章-习题答案
思考与练习1. 怎样确定假设检验问题的零假设和备择假设?一般根据以下几个原则设置零假设和备择假设:把研究者要证明的假设作为备择假设;将所作出的声明作为零假设;把现状作为零假设;把不能轻易否定的假设作为零假设。
2. 什么是抽样分布?常用的抽样分布有哪些?抽样分布是指统计量的概率分布。
从总体中抽取一个样本量为n的随机样本,我们可以计算出统计量的一个值;如果从总体中重复抽取样本量为n的样本,就可以得到统计量的多个值。
统计量的抽样分布就是这一统计量所有可能值的概率分布。
常用的抽样分布有正态分布、t分布、F分布、2χ分布。
3. 假设检验有哪些步骤?假设检验一般可以分为以下几个步骤:1)根据实际问题提出一对假设(零假设和备择假设);2)构造某个适当的检验统计量,并确定其在零假设成立时的分布;3)根据观测的样本计算检验统计量的值;4)根据指定的显著性水平确定检验统计量的临界值并进而给出拒绝域;5)根据决策规则得出拒绝或不能拒绝零假设的结论。
4. 单侧和双侧假设检验问题的拒绝域有何区别?单侧检验的拒绝域为检验统计量取值的单侧区间,双侧检验问题的拒绝域为检验统计量取值的双侧区间5. 怎样理解假设检验问题的p值?如何根据p值和显著性水平的关系得出检验结论?p值是在零假设成立的条件下,出现检验统计量的样本观测结果或更极端结果的概率,是能拒绝H0的α的最小值。
将p值与显著性水平α比较,当p值小于α时拒绝零假设。
当p值大于等于α时接受零假设。
6. 根据表4-3对100名儿童随机调查的结果(数据文件:看电视时间.sav),能否认为(1)该地区儿童平均看电视的时间等于25.5小时?解:在SPSS中打开相应的数据文件,选择“分析”→“比较均值”→“单样本t检验”,在弹出的对话框中将体重变量作为检验变量,检验值框中填入25.5,其余使用系统默认值,输出结果如表1。
表1 单样本t检验根据题目的要求,这里应采用双侧检验,零假设和备择假设为:25.5:25.5:10≠↔=μμH H 。
统计学第四章课后题及答案解析
第四章一、单项选择题1.由反映总体单位某一数量特征的标志值汇总得到的指标是()A.总体单位总量B.质量指标C.总体标志总量D.相对指标2.各部分所占比重之和等于1或100%的相对数()A.比例相对数 B.比较相对数 C.结构相对数 D.动态相对数3.某企业工人劳动生产率计划提高5%,实际提高了10%,则提高劳动生产率的计划完成程度为()A.104.76%B.95.45%C.200%D.4.76%4.某企业计划规定产品成本比上年度降低10%实际产品成本比上年降低了14.5%,则产品成本计划完成程度()A.14.5%B.95%C.5%D.114.5%5.在一个特定总体内,下列说法正确的是( )A.只存在一个单位总量,但可以同时存在多个标志总量B.可以存在多个单位总量,但必须只有一个标志总量C.只能存在一个单位总量和一个标志总量D.可以存在多个单位总量和多个标志总量6.计算平均指标的基本要求是所要计算的平均指标的总体单位应是()A.大量的B.同质的C.有差异的D.不同总体的7.几何平均数的计算适用于求()A.平均速度和平均比率B.平均增长水平C.平均发展水平D.序时平均数8.一组样本数据为3、3、1、5、13、12、11、9、7这组数据的中位数是()A.3B.13C.7.1D.79.某班学生的统计学平均成绩是70分,最高分是96分,最低分是62分,根据这些信息,可以计算的测度离散程度的统计量是()A.方差B.极差C.标准差D.变异系数10.用标准差比较分析两个同类总体平均指标的代表性大小时,其基本的前提条件是( )A.两个总体的标准差应相等B.两个总体的平均数应相等C.两个总体的单位数应相等D.两个总体的离差之和应相等11.已知4个水果商店苹果的单价和销售额,要求计算4个商店苹果的平均单价,应采用()A.简单算术平均数B.加权算术平均数C.加权调和平均数D.几何平均数12.算术平均数、众数和中位数之间的数量关系决定于总体次数的分布状况。
统计学习题答案 第4章 抽样与抽样分布
第4章 抽样与抽样分布——练习题(全免)1.一个具有64=n 个观察值的随机样本抽自于均值等于20、标准差等于16的总体。
⑴给出x 的抽样分布(重复抽样)的均值和标准差⑵描述x 的抽样分布的形状。
你的回答依赖于样本容量吗?⑶计算标准正态z 统计量对应于5.15=x 的值。
⑷计算标准正态z 统计量对应于23=x 的值。
解:已知 n=64,为大样本,μ=20,σ=16,⑴在重复抽样情况下,x 的抽样分布的均值为a. 20, 2b. 近似正态c. -2.25d. 1.502 .参考练习4.1求概率。
⑴x <16;⑵x >23;⑶x >25;⑷.x 落在16和22之间;⑸x <14。
解: a. 0.0228 b. 0.0668 c. 0.0062 d. 0.8185 e. 0.00133.一个具有100=n 个观察值的随机样本选自于30=μ、16=σ的总体。
试求下列概率的近似值:解: a. 0.8944 b. 0.0228 c. 0.1292 d. 0.96994.一个具有900=n 个观察值的随机样本选自于100=μ和10=σ的总体。
⑴你预计x 的最大值和最小值是什么? ⑵你认为x 至多偏离μ多么远?⑶为了回答b 你必须要知道μ吗?请解释。
解:a. 101, 99 b. 1 c. 不必5.考虑一个包含x 的值等于0,1,2,…,97,98,99的总体。
假设x 的取值的可能性是相同的。
则运用计算机对下面的每一个n 值产生500个随机样本,并对于每一个样本计算x 。
对于每一个样本容量,构造x 的500个值的相对频率直方图。
当n 值增加时在直方图上会发生什么变化?存在什么相似性?这里30,10,5,2====n n n n 和50=n 。
解:趋向正态6.美国汽车联合会(AAA )是一个拥有90个俱乐部的非营利联盟,它对其成员提供旅行、金融、保险以与与汽车相关的各项服务。
1999年5月,AAA 通过对会员调查得知一个4口之家出游中平均每日餐饮和住宿费用大约是213美元(《旅行新闻》Travel News ,1999年5月11日)。
大学 统计学 选择判断题(修改)
第一章绪论一、单项选择1、要了解某班50个学生的学习情况,则总体单位是( 3 )。
A、全体学生B、 50个学生的学习情况C、每一个学生D、每一个学生的学习情况2、某班4名学生统计学考试成绩分别为:65分、78分、85分、91分,这4个数字是( 4 )。
A、数量指标B、质量指标C、变量D、变量值3、统计学特有的研究方法是( 2 )。
A、统计分组法B、大量观察法C、综合指标法D、统计模型法4、对某市自行车进行普查,调查单位是( 4 )。
A、该市每一个拥有自行车的人B、该市所有拥有自行车的人C、该市所有自行车D、该市每一辆自行车5、统计一词的三种涵义是( A )A、统计活动、统计资料、统计学B、统计活动、统计调查、统计学C、统计调查、统计整理、统计分析D、统计指标、统计资料、统计学6、设某地区有200家独立核算的工业企业,要研究这些企业的产品生产情况,总体是( D )。
A、每一家工业企业B、200家工业企业C、每一件产品D、200家工业企业的全部工业产品7、数量指标和质量指标的根本区别在于( 1 )。
A、说明总体现象的内容不同B、数量大小不同C、计量单位不同D、使用领域不同8、某支行所有分理处是一个总体,每一个分理处是总体单位,则支行所有职工人数是(A)A 、数量指标B 、质量指标C 、连续变量D 、离散变量9、有600家公司每位职工的工资资料,如果要调查这些公司的工资水平情况,则总体单位是( B )。
A、600家公司的全部职工B、600家公司的每一位职工C、600家公司所有职工的全部工资D、600家公司每个职工的工资10、一个统计总体( B )。
A、只能有一个指标B、可以有多个指标C、只能有一个标志D、可以有多个标志11、以产品等级来反映某种产品的质量,则该产品等级是( B )。
A、数量标志B、品质标志C、数量指标D、质量指标12、在调查设计时,学校作为总体,每个班作为总体单位,各班学生人数是( B、)。
统计学第四版(贾俊平著)中国人民大学出版社第四章课后答案PPT课件
(1) 62.75 2 33.9375
(2) 可能的样本个数: 82 64
(3)由题可得所有样本的样本均值如下表:
第(3)小题图表 (4)利用SPSS软件得到Q-Q图:
m
xi
(5)
x
i 1
64
62.75
x
n
33.9375 4.1193 2
样本均值的平均数等于总体平均数,样本均值的标 1
4.3 求标准正态分布的概率:
(1)P ( 0 ≤ Z ≤ 1.2) ; (2)P ( -0.48 ≤ Z ≤ 0); (3)P (Z > 1.33)。
解:
(1)P ( 0 ≤ Z ≤ 1.2) = P ( 1.2) -P ( 0 )= 0.3849 (2)P ( -0.48 ≤ Z ≤ 0 ) = P ( 0) -P (-0.48)= 0.1844 (3)P (Z > 1.33) = P ( -1.33) = 0.0918
不足之处请大家批评指导
Please Criticize And Guide The Shortcomings
讲师:XXXXXX XX年XX月XX日
统计学第四章课后习题
4.1 消费者协会经过调查发现,某品牌空调有重大缺陷产品出现的概率分布 如下:
根据表格数据分别计算: (1)有2~5个(包括2与5个在内)空调出现重大缺陷的 概率 (2)只有不到2个空调出现重大缺陷的概率
(3)有超过5个空调出现重大缺陷的概率
解:
(1) 设有2~5个空调出现重大缺陷的事件为A 则P(A)=P(2)+P(3)+P(4)+P(5)=0.209+0.223+0.178+0.114=0.754 (2) 设不到2个空调出现重大缺陷的事件为B 则P(B)=P(0)+P(1)=0.041+0.130=0.171 (3) 设有超过5个空调出现重大缺陷的事件为C 则 P(C)=P(6)+P(7)+P(8)+P(9)+P(10)=0.061+0.028+0.011+0.004+0.001= 0.105
统计学课后答案
第四章 抽样分布与参数估计3.某地区粮食播种面积5000亩,按不重复抽样方法随机抽取了100亩进行实测,调查结果,平均亩产450公斤,亩产量标准差为52公斤。
试以95%的置信度估计该地区粮食平均亩产量和总产量的置信区间。
解:已知X =450公斤,n =100(大样本),n/N=1/50,11≈-Nn,不考虑抽样方式的影响,用重复抽样计算。
s =52公斤,1-α=95%,α=5%。
这时查标准正态分布表,可得临界值:96.1025.02/==z z α该地区粮食平均亩产量的置信区间是:1005296.14502⨯±=±nsz x α=[439.808,460.192] (公斤) 总产量的置信区间是:[439.808⨯5000,460.192⨯5000] (公斤) =[2199040,2300960](公斤)4.已知某种电子管使用寿命服从正态分布。
从一批电子管中随机抽取16只,检测结果,样本平均寿命为1490小时,标准差为24.77小时。
试以95%的置信度估计这批电子管的平均寿命的置信区间。
解:(1)已知X =1490小时,n =16,s =24.77小时,1-α=95%,α=5%。
这时查t 分布表,可得 2.13145)1(2/=-n t α该批电子管的平均寿命的置信区间是:1677.2413145.214902⨯±=±nst x α=[ 1476.801,1503.199](小时)因此,这批电子管的平均寿命的置信区间在1476.801小时与1503.199小时之间。
6.采用简单随机重复抽样的方法,从2 000件产品中抽查200件,其中合格品190件。
要求:(1)计算合格品率及其抽样平均误差。
(2)以95.45%的置信度,对合格品率和合格品数量进行区间估计。
(3)如果极限误差为2.31%,则其置信度是多少? 解:(1)合格品率:P=190/200⨯100%=95% 抽样平均误差:np p p )1()(-=σ=0.015(2)%3%95%100015.02%95)(22/02275.02/±=⨯⨯±=±==p Z P Z Z σαα]19601840[]2000%982000%92[(%]98%92[,,的置信区为:件合格品数量,:合格品率的置信区间为=⨯⨯)(3)%64.87)(8764.01,54.1%31.2%100015.0%31.2)(2/2/2/==-==⨯⨯==∆z F Z Z p Z ασααα查表得7.从某企业工人中随机抽选部分进行调查,所得工资分布数列如下:试求:(1)以95.45%的置信度估计该企业工人平均工资的置信区间,以及该企业工人中工资不少于800元的工人所占比重的置信区间;(2)如果要求估计平均工资的允许误差范围不超过30元,估计工资不少于800元的工人所占比重的允许误差范围不超过10%,置信度仍为95.45%,试问至少应抽多少工人? 解(1)通过EXCEL 计算可得: X =816元,n =50人,s =113.77元。
抽样分布习题及答案
第4章 抽样分布自测题选择题 1.抽样分布是指A. 一个样本各观测值的分布B. 总体中各观测值的分布C. 样本统计量的分布D. 样本数量的分布2.根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分布,其分布的均值为A. μB. xC. 2σD. n 2σ3. 根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分布,其分布的方差为A. μB. xC. 2σD. n 2σ4. 从均值为μ,方差为2σ的任意一个总体中抽取大小为n 的样本,则A. 当n 充分大时,样本均值x 的分布近似服从正态分布B. 只有当n<30时,样本均值x 的分布近似服从正态分布C. 样本均值x 的分布与n 无关D. 无论n 多大,样本均值x 的分布都是非正态分布5. 假设总体服从均匀分布,从该总体中抽取容量为36的样本,则样本均值的抽样分布A. 服从非正态分布B. 近似正态分布C. 服从均匀分布D. 服从2χ分布6. 从服从正态分布的无限总体中分别抽取容量为4,16,36的样本,则当样本容量增大时,样本均值的标准差A. 保持不变B. 增加C.减小D.无法确定7. 某大学的一家快餐店记录了过去5年每天的营业额,每天营业额的均值为2500元,标准差为400元;由于在某些节日的营业额偏高,所以每日营业额的分布是右偏的,假设从这5年中随机抽取100天,并计算这100天的平均营业额,则样本均值的抽样分布是A. 正态分布,均值为250元,标准差为40元B. 正态分布,均值为2500元,标准差为40元C.右偏,均值为2500元,标准差为400元D. 正态分布,均值为2500元,标准差为400元8. 在一个饭店门口等待出租车的时间是左偏的,均值为12分钟,标准差为3分钟;如果从饭店门口随机抽取81名顾客并记录他们等待出租车的时间,则样本均值的抽样分布是A. 正态分布,均值为12分钟,标准差为分钟B. 正态分布,均值为12分钟,标准差为3分钟C. 左偏分布,均值为12分钟,标准差为3分钟D. 左偏分布,均值为12分钟,标准差为分钟9. 某厂家生产的灯泡寿命的均值为60小时,标准差为4小时,如果从中随机抽取30只灯泡进行检测,则样本均值A. 抽样分布的标准差为4小时B. 抽样分布近似等同于总体分布C. 抽样分布的中位数为64小时D. 抽样分布近似服从正态分布,均值为60小时10. 假设总体比例为,从该总体中抽取容量为100的样本,则样本比例的标准差为A. 0.01B.C. 抽样分布自测答案选择题。
统计学课后习题答案(全章节)
第二章、练习题及解答2.为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:700 716 728 719 685 709 691 684 705 718 706 715 712 722 691 708 690 692 707 701 708 729 694 681 695 685 706 661 735 665 668 710 693 697 674 658 698 666 696 698 706 692 691 747 699 682 698 700 710 722 694 690 736 689 696 651 673 749 708 727 688 689 683 685 702 741 698 713 676 702 701 671 718 707 683 717 733 712 683 692 693 697 664 681 721 720 677 679 695 691 713 699 725 726 704 729 703 696 717 688 要求:(2)以组距为10进行等距分组,生成频数分布表,并绘制直方图。
灯泡的使用寿命频数分布表3.某公司下属40个销售点2012年的商品销售收入数据如下:单位:万元152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。
(2)制作茎叶图,并与直方图进行比较。
解:(1)频数分布表(2)茎叶图第三章、练习题及解答1. 已知下表资料:试根据频数和频率资料,分别计算工人平均日产量。
解:根据频数计算工人平均日产量:687034.35200xf x f===∑∑(件) 根据频率计算工人平均日产量:34.35fx xf==∑∑(件)结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。
抽样分布的考试题及答案
抽样分布的考试题及答案一、单选题1. 抽样分布是指什么?A. 总体中所有样本的分布B. 从总体中抽取的样本的分布C. 总体中所有个体的分布D. 总体中所有样本均值的分布答案:D2. 样本均值的抽样分布具有什么特性?A. 正态分布B. 均匀分布C. 指数分布D. 二项分布答案:A3. 样本量增加时,样本均值的抽样分布会如何变化?A. 标准差增加B. 标准差减少C. 标准差不变D. 无法确定答案:B二、多选题4. 影响抽样分布的因素包括哪些?A. 总体分布B. 样本大小C. 抽样方法D. 样本均值答案:A、B、C5. 以下哪些情况下,样本均值的抽样分布会呈现正态分布?A. 总体分布是正态分布B. 总体分布是均匀分布C. 样本量足够大D. 总体分布是二项分布答案:A、C三、判断题6. 抽样分布的中心趋势由总体分布的中心趋势决定。
答案:错误7. 样本均值的抽样分布的标准差等于总体标准差除以样本量的平方根。
答案:错误8. 抽样分布的形态与总体分布的形态无关。
答案:错误四、简答题9. 描述一下抽样分布的概念及其重要性。
答案:抽样分布是指从同一总体中抽取的多个样本的某个统计量(如均值、方差等)的分布情况。
抽样分布对于推断总体参数具有重要意义,因为它允许我们使用样本数据来估计总体参数,并计算出相应的置信区间和假设检验。
10. 为什么在大样本情况下,样本均值的抽样分布会呈现正态分布?答案:根据中心极限定理,当样本量足够大时,无论总体分布的形状如何,样本均值的抽样分布都会趋近于正态分布。
这是因为样本均值的波动会随着样本量的增加而减小,使得样本均值的分布趋于稳定,从而呈现出正态分布的特征。
结束语:通过以上题目的练习,希望你能对抽样分布的概念、特性以及其在统计学中的应用有一个更加清晰的认识。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第4章 抽样与抽样分布——练习题(全免)
1. 一个具有64=n 个观察值的随机样本抽自于均值等于20、标准差等于16的总体。
⑴ 给出x 的抽样分布(重复抽样)的均值和标准差
⑵ 描述x 的抽样分布的形状。
你的回答依赖于样本容量吗?
⑶ 计算标准正态z 统计量对应于5.15=x 的值。
⑷ 计算标准正态z 统计量对应于23=x 的值。
解: 已知 n=64,为大样本,μ=20,σ=16,
⑴在重复抽样情况下,x 的抽样分布的均值为
a. 20, 2
b. 近似正态
c. -2.25
d. 1.50
2 . 参考练习4.1求概率。
⑴x <16; ⑵x >23; ⑶x >25; ⑷.x 落在16和22之间; ⑸x <14。
解: a. 0.0228 b. 0.0668 c. 0.0062 d. 0.8185 e. 0.0013
3. 一个具有100=n 个观察值的随机样本选自于30=μ、16=σ的总体。
试求下列概率的近似值:
解: a. 0.8944 b. 0.0228 c. 0.1292 d. 0.9699
4. 一个具有900=n 个观察值的随机样本选自于100=μ和10=σ的总体。
⑴ 你预计x 的最大值和最小值是什么?
⑵ 你认为x 至多偏离μ多么远?
⑶ 为了回答b 你必须要知道μ吗?请解释。
解:a. 101, 99 b. 1 c. 不必
5. 考虑一个包含x 的值等于0,1,2,…,97,98,99的总体。
假设x 的取值的可能性是相同的。
则运用计算机对下面的每一个n 值产生500个随机样本,并对于每一个样本计算x 。
对于每一个样本容量,构造x 的500个值的相对频率直方图。
当n 值增加时在直方图上会发生什么变化?存在什么相似性?这里30,10,5,2====n n n n 和50=n 。
解:趋向正态
6. 美国汽车联合会(AAA )是一个拥有90个俱乐部的非营利联盟,它对其成员提供旅行、
金融、保险以及与汽车相关的各项服务。
1999年5月,AAA 通过对会员调查得知一个4口之家出游中平均每日餐饮和住宿费用大约是213美元(《旅行新闻》Travel News ,1999年5月11日)。
假设这个花费的标准差是15美元,并且AAA 所报道的平均每日消费是总体均值。
又假设选取49个4口之家,并对其在1999年6月期间的旅行费用进行记录。
⑴ 描述x (样本家庭平均每日餐饮和住宿的消费)的抽样分布。
特别说明x 服从怎样
的分布以及x 的均值和方差是什么?证明你的回答; ⑵ 对于样本家庭来说平均每日消费大于213美元的概率是什么?大于217美元的概率
呢?在209美元和217美元之间的概率呢?
解: a. 正态分布, 213, 4.5918 b. 0.5, 0.031, 0.938
7. 技术人员对奶粉装袋过程进行了质量检验。
每袋的平均重量标准为406=μ克、标准差
为1.10=σ克。
监控这一过程的技术人者每天随机地抽取36袋,并对每袋重量进行测量。
现考虑这36袋奶粉所组成样本的平均重量x 。
(1)描述x 的抽样分布,并给出x μ和x σ的值,以及概率分布的形状;
(3) 假设某一天技术人员观察到8.400=x ,这是否意味着装袋过程出
现问题了呢,为什么?
解: a. 406, 1.68, 正态分布 b. 0.001 c. 是,因为小概率出现了
8. 在本章的统计实践中,某投资者考虑将1000美元投资于5=n 种不同的股票。
每一种股
票月收益率的均值为%10=μ,标准差%4=σ。
对于这五种股票的投资组合,投资者每月的收益率是∑=5i r r 。
投资者的每月收益率的方差是2.32
2==n r σσ,它是
投资者所面临风险的一个度量。
⑴ 假如投资者将1000美元仅投资于这5种股票的其中3种,则这个投资者所面对的
风险将会增加还是减少?请解释;
⑵ 假设将1000美元投资在另外10种收益率与上述的完全一样的股票,试度量其风险,
并与只投资5种股票的情形进行比较。
解:a. 增加 b. 减少
9. 某制造商为击剑运动员生产安全夹克,这些夹克是以剑锋刺入其中时所需的最小力量(以
牛顿为单位)来定级的。
如果生产工艺操作正确,则他生产的夹克级别应平均840牛顿,标准差15牛顿。
国际击剑管理组织(FIE )希望这些夹克的最低级别不小于800牛顿。
为了检查其生产过程是否正常,某检验人员从生产过程中抽取了50个夹克作为一个随机样本进行定级,并计算x ,即该样本中夹克级别的均值。
她假设这个过程的标准差是固定的,但是担心级别均值可能已经发生变化。
⑴ 如果该生产过程仍旧正常,则x 的样本分布为何?
⑵ 假设这个检验人员所抽取样本的级别均值为830牛顿,则如果生产过程正常的话,
样本均值x ≤830牛顿的概率是多少?
⑶ 在检验人员假定生产过程的标准差固定不变时,你对b 部分有关当前生产过程的现
状有何看法(即夹克级别均值是否仍为840牛顿)?
⑷ 现在假设该生产过程的均值没有变化,但是过程的标准差从15牛顿增加到了45牛
顿。
在这种情况下x 的抽样分布是什么?当x 具有这种分布时,则x ≤830牛顿的概率是多少?
解: a. 正态 b. 约等于0 c. 不正常 d. 正态, 0.06
10. 在任何生产过程中,产品质量的波动都是不可避免的。
产品质量的变化可被分成两类:
由于特殊原因所引起的变化(例如,某一特定的机器),以及由于共同的原因所引起的变化(例如,产品的设计很差)。
一个去除了质量变化的所有特殊原因的生产过程被称为是稳定的或者是在统计控制中的。
剩余的变化只是简单的随机变化。
假如随机变化太大,则管理部门不能接受,
但只要消除变化的共同原因,便可减少变化(Deming,1982,1986;De Vor, Chang,和Sutherland,1992)。
通常的做法是将产品质量的特征绘制到控制图上,然后观察这些数值随时间如何变动。
例如,为了控制肥皂中碱的数量,可以每小时从生产线中随机地抽选5=n 块试验肥皂作为样本,并测量其碱的数量,不同时间的样本含碱量的均值x 描绘在下图中。
假设这个过程是在统计控制中的,则x 的分布将具有过程的均值μ,标准差具有过程的标准差除以样本容量的平方根,n x σσ=。
下面的控制图中水平线表示过程均值,两条线称为控制极限度,位于μ的上下3x σ的位置。
假如x 落在界限的外面,则有充分的理由说明目前存在变化的特殊原因,这个过程一定是失控的。
当生产过程是在统计控制中时,肥皂试验样本中碱的百分比将服从%2=μ和
%1=σ的近似的正态分布。
⑴ 假设,4=n 则上下控制极限应距离μ多么远?
⑵ 假如这个过程是在控制中,则x 落在控制极限之外的概率是多少?
⑶ 假设抽取样本之前,过程均值移动到%3=μ,则由样本得出这个过程失控的(正
确的)结论的概率是多少?
解:a. 0.015 b. 0.0026 c. 0.1587
4.11. 参考练习4.10。
肥皂公司决定设置比练习4.10中所述的x σ3这一限度更为严格的控制
极限。
特别地,当加工过程在控制中时,公司愿意接受x 落在控制极限外面的概率是0.10。
⑴ 若公司仍想将控制极限度设在与均值的上下距离相等之处,并且仍计划在每小时的
样本中使用4=n 个观察值,则控制极限应该设定在哪里?
⑵ 假设a 部分中的控制极限已付诸实施,但是公司不知道,μ现在是3%
(而不是2%)。
若4=n ,则x 落在控制极限外面的概率是多少?若9=n 呢?
解: a. (0.012, 0.028) b. 0.6553, 0.7278
4.12. 参考练习4.11。
为了改进控制图的敏感性,有时将警戒线与控制极限一起画在图上。
警戒限一般被设定为x σμ96.1±。
假如有两个连续的数据点落在警戒限之外,则这个过程一定是失控的(蒙哥马利,1991年)。
⑴ 假设肥皂加工过程是在控制中(即,它遵循%2=μ和%1=σ的正态分布),则x
的下一个值落在警戒限之外的概率是什么?
⑵ 假设肥皂加工过程是在控制中,则你预料到画在控制图上的x 的这40个值中有多
少个点落在上控制极限以上?
⑶ 假设肥皂加工过程是在控制中,则x 的两个未来数值落在下警戒线以下的概率是多
少?
解:a. 0.05 b. 1 c. 0.000625。