统计学习题答案_第4章__抽样与抽样分布

合集下载

统计学 练习题

统计学 练习题

注:关于运用EXCEL进行统计分析的练习,参考上机材料“统计实训指导-EXCLE2010版本.doc”。

第1章引论一、判断题(在前后面括弧内,正确的画√,错误的划×)【V】1、所谓统计学规律性,就是大量现象的数量规律性。

【V】2、《政治算术》的作者是威廉·配第。

【V】3、统计指标一定能够用数量表达。

【V】4、统计学是一门如何搜集、整理、分析数据的方法论科学。

【X】5、统计研究所关注的是个体的数量特征,而不是总体的数量特征。

【X】6、统计调查过程中采用的大量观察法,是指观察的个体越多越好。

【X】7、样本中包含的个体个数称为样本个数。

【X】8、电话号码是定量数据。

第2章数据的收集一、单选题(下列每小题备选答案中,只有一个最佳答案)【D】1、构成统计总体的个别事物称为A、调查单位B、标志值C、样本D、总体单位【B】2、对某城市工业企业未安装设备进行普查,总体单位是A、工业企业全部未安装设备B、工业企业每一台未安装设备C、每个工业企业的未安装设备D、每一个工业企业【A】3、下列数据属于定类数据的是A.专业:工商管理、工程管理 B.出生年:1986年、1987年C.统计学成绩:优、良 D.年龄:20岁、21岁【B】4、下列数据属于定序数据的是A.专业:工商管理、工程管理 B.出生年:甲子年、乙丑年C.学生人数:20人、30人 D.年龄:20岁、21岁【D】5、在各种类型的数据中,有绝对零点的数据是A.定类数据 B.定序数据 C.定距数据 D.定比数据【D】6、抽样调查的主要目的是A、随机抽取样本单位B、对调查单位作深入研究C、计算和控制抽样误差D、用样本指标来推算或估计总体指标【A】7、下列调查中,哪个一定属于全面调查A、普查B、重点调查C、典型调查D、抽样调查【A】8、普查是为了某种特定的目的而A、专门组织的一次性的全面调查B、专门组织的非全面调查C、非专门组织的一次性的全面调查D、非专门组织的经常性的全面调查【D】9、要了解上海市居民家庭的收支情况,最适合的调查方式是A、普查B、重点调查C、统计报表制度D、抽样调查【A】10、下例调查中,最适合采用重点调查的是A、了解全国钢铁生产的总量情况B、了解全国经济增长速度C、了解上海市居民家庭的收支情况D、了解某校学生的学习情况【B】11、为了了解某产品的市场销售情况,而到销量最大的10家商场搜集其销售记录,这种数据搜集方式属于A.抽样调查 B.重点调查 C.普查 D.统计报表制度【D】12、中秋节对某商场的月饼质量进行调查,最宜使用的调查方式是A.普查 B.重点调查 C.典型调查 D.随机抽样调查【B】13、对某地区工业企业职工进行调查,调查对象是A、各工业企业B、各工业企业的全体职工C、一个工业企业D、每一位职工【D】14、为了了解新生的外语成绩,从全校新生110个班中随机抽出20个班,计算这20个班的每个学生平均分,这种抽样组织形式属于A.机械抽样 B.多阶段抽样 C.分层抽样 D.整群抽样【D】15、从N个元素组成的总体中抽取n个元素作为样本,并且总体中每一个元素被抽到的机会相同,这样的抽样组织形式称为A.整群抽样 B.分层抽样 C.分层抽样 D.纯随机抽样【C】16、农业调查中,把耕地按地形分为山区、丘陵、平原,然后分别从各种地形中抽取一部分地块组成样本,这种抽样组织形式属于A.整群抽样 B.多阶段抽样 C.分层抽样 D.机械抽样二、判断题(在前后面括弧内,正确的画√,错误的划×)【X】1、全面调查和非全面调查的划分依据就是调查结果是否包括被调查单位各方面的数据。

统计学习题_第四章_数据分布特征的描述习题答案

统计学习题_第四章_数据分布特征的描述习题答案

统计学习题_第四章_数据分布特征的描述习题答案第四章静态指标分析法(⼀)⼀、填空题1、数据分布集中趋势的测度值(指标)主要有、和。

其中和⽤于测度品质数据集中趋势的分布特征,⽤于测度数值型数据集中趋势的分布特征。

2、标准差是反映的最主要指标(测度值)。

3、⼏何平均数是计算和的⽐较适⽤的⼀种⽅法。

4、当两组数据的平均数不等时,要⽐较其数据的差异程度⼤⼩,需要计算。

5、在测定数据分布特征时,如果M M e X 0==,则认为数据呈分布。

6、当⼀组⼯⼈的⽉平均⼯资悬殊较⼤时,⽤他们⼯资的⽐其算术平均数更能代表全部⼯⼈⼯资的总体⽔平。

⼆.选择题单选题:1.反映的时间状况不同,总量指标可分为()A 总量指标和时点总量指标B 时点总量指标和时期总量指标C 时期总量指标和时间指标D 实物量指标和价值量指标2、某⼚1999年完成产值200万元,2000年计划增长10%,实际完成了231万元,超额完成( )A 5.5%B 5%C 115.5%D 15.5%3、在同⼀变量数列中,当标志值(变量值)⽐较⼤的次数较多时,计算出来的平均数()A 接近标志值⼩的⼀⽅B 接近标志值⼤的⼀⽅C 接近次数少的⼀⽅D 接近哪⼀⽅⽆法判断4、在计算平均数时,权数的意义和作⽤是不变的,⽽权数的具体表现()A 可变的B 总是各组单位数C 总是各组标志总量D 总是各组标志值 5、1998年某⼚甲车间⼯⼈的⽉平均⼯资为520元,⼄车间⼯⼈的⽉平均⼯资为540元,1999年各车间的⼯资⽔平不变,但甲车间的⼯⼈占全部⼯⼈的⽐重由原来的40%提⾼到了60%,则1999年两车间⼯⼈的总平均⼯资⽐1998年()A 提⾼D 不能做结论 6、在变异指标(离散程度测度值)中,其数值越⼩,则()A 说明变量值越分散,平均数代表性越低B 说明变量值越集中,平均数代表性越⾼C 说明变量值越分散,平均数代表性越⾼D 说明变量值越集中,平均数代表性越低7、有甲、⼄两数列,已知甲数列:07.7,70==甲甲σX ;⼄数列:41.3,7==⼄⼄σX 根据以上资料可直接判断( )A 甲数列的平均数代表性⼤B ⼄数列的平均数代表性⼤C 两数列的平均数代表性相同D 不能直接判别8、杭州地区每百⼈⼿机拥有量为90部,这个指标是()A 、⽐例相对指标B 、⽐较相对指标C 、结构相对指标D 、强度相对指标9、某组数据呈正态分布,计算出算术平均数为5,中位数为7,则该数据分布为() A 、左偏分布 B 、右偏分布 C 、对称分布 D 、⽆法判断10、加权算术平均数的⼤⼩() A 主要受各组标志值⼤⼩的影响,与各组次数多少⽆关; B 主要受各组次数多少的影响,与各组标志值⼤⼩⽆关; C 既与各组标志值⼤⼩⽆关,也与各组次数多少⽆关; D 既与各组标志值⼤⼩有关,也受各组次数多少的影响11、已知⼀分配数列,最⼩组限为30元,最⼤组限为200元,不可能是平均数的为() A 、50元 B 、80元 C 、120元 D 、210元12、⽐较两个单位的资料,甲的标准差⼩于⼄的标准差,则()A 两个单位的平均数代表性相同B 甲单位平均数代表性⼤于⼄单位C ⼄单位平均数代表性⼤于甲单位D 不能确定哪个单位的平均数代表性⼤ 13、若单项数列的所有标志值都增加常数9,⽽次数都减少三分之⼀,则其算术平均数() A 、增加9 B 、增加6 C 、减少三分之⼀ D 、增加三分之⼆ 14、如果数据分布很不均匀,则应编制 ( )A 开⼝组B 闭⼝组C 等距数列D 异距数列 15、计算总量指标的基本原则是:( )A 总体性B 全⾯性16、某企业的职⼯⼯资分为四组:800元以下;800-1000元;1000—1500元;1500以上,则1500元以上这组组中值应近似为 ( )A1500元 B 1600元 C 1750元 D 2000元 17、统计分组的⾸要问题是 ( )A 选择分组变量和确定组限B 按品质标志分组C 运⽤多个标志进⾏分组,形成⼀个分组体系D 善于运⽤复合分组18、某连续变量数列,其末组为开⼝组,下限为200,⼜知其邻组的组中值为170,则末组组中值为 ( )A 230B 260C 185D 215 19、分配数列中,靠近中间的变量值分布的次数少,靠近两端的变量值分布的次数多,这种分布的类型是 ( )A 钟型分布B U 型分布C J 型分布D 倒J 型分布 20、要了解上海市居民家庭的开⽀情况,最合适的调查⽅式是:() A 普查 B 抽样调查 C 典型调查 D 重点调查21、已知两个同类企业的职⼯平均⼯资的标准差分别为5元和6元,⽽平均⼯资分别为3000元,3500元则两企业的⼯资离散程度为 ( )A 甲⼤于⼄B ⼄⼤于甲C ⼀样的D ⽆法判断 22、加权算术平均数的⼤⼩取决于 ( )A 变量值B 频数C 变量值和频数D 频率23、如果所有标志值的频数都减少为原来的1/5,⽽标志值仍然不变.那么算术平均数 ( ) A 不变 B 扩⼤到5倍 C 减少为原来的1/5D 不能预测其变化 24、计算平均⽐率最好⽤ ( )A 算术平均数B 调和平均数C ⼏何平均数D 中位数25、若两数列的标准差相等⽽平均数不同,在⽐较两数列的离散程度⼤⼩时,应采⽤ ( ) A 全距 B 平均差 C 标准差 D 标准差系数26、若n=20,∑∑==2080,2002x x ,标准差为 ( )A 2B 4C 1.5D 327、已知某总体3215,3256==eMM,则数据的分布形态为( )A左偏分布 B 正态分布 C 右偏分布 D U型分布28、⼀次⼩型出⼝商品洽谈会,所有⼚商的平均成交额的⽅差为156.25万元,标准差系数为14.2%,则平均成交额为( )万元A11 B 177.5 C 22.19 D 8826、欲粗略了解我国钢铁⽣产的基本情况,调查了上钢、鞍钢等⼗⼏个⼤型的钢铁企业,这是()A普查B重点调查C典型调查D抽样调查多选题:1.某企业计划2000年成本降低率为8%,实际降低了10%。

统计学第四版__习题集及答案[1]

统计学第四版__习题集及答案[1]

答案附在后面有一些(在题目上若要打印先把答案去掉)每单元后面都有答案第一章导论【重点】了解统计的科学涵义,明确统计学的学科性质及基本研究方法,掌握统计数据的特点及其不同类型,牢固掌握统计学的基本概念。

【难点】准确掌把数据不同类型,牢固掌握统计学的基本概念并结合实例分析。

思考题1.1什么是描述统计学、推断统计学?怎样理解描述统计学和推断统计学在探索事物数量规律性中的地位和作用?1.2统计学发展史上有哪几个主要学派?1.3“统计学”一词有哪几种含义?1.4什么是统计学?怎样理解统计学与统计数据的关系?1.5统计数据可分为哪几种类型?不同类型的数据各有什么特点?1.6举例说明总体、样本、参数、统计量、变量这几个概念。

练习题一、单项选择题1、指出下面的数据哪一个属于分类数据()A、年龄B、工资C、汽车产量D、购买商品的支付方式(现金、信用卡、支票)2、指出下面的数据哪一个属于顺序数据()A、年龄B、工资C、汽车产量D、员工对企业某项制度改革措施的态度(赞成、中立、反对)3、某研究部门准备在全市200万个家庭中抽取2000个家庭,据此推断该城市所有职工家庭的年人均收入,这项研究的统计量是()A、2000个家庭B、200万个家庭C、2000个家庭的人均收入D、200万个家庭的人均收入4、了解居民的消费支出情况,则()A、居民的消费支出情况是总体B、所有居民是总体C、居民的消费支出情况是总体单位D、所有居民是总体单位5、统计学研究的基本特点是()A、从数量上认识总体单位的特征和规律B、从数量上认识总体的特征和规律C、从性质上认识总体单位的特征和规律D、从性质上认识总体的特征和规律6、一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%的人回答他们的月收入在5000元以上,50%的回答他们的消费支付方式是使用信用卡。

这里的“月收入”是()A、分类变量B、顺序变量C、数值型变量D、离散变量7、要反映我国工业企业的整体业绩水平,总体单位是()A、我国每一家工业企业B、我国所有工业企业C、我国工业企业总数D、我国工业企业的利润总额8、一项调查表明,在所抽取的1000个消费者中,他们每月在网上购物的平均消费是200元,他们选择在网上购物的主要原因是“价格便宜”。

统计学课后题答案_吴风庆_王艳明

统计学课后题答案_吴风庆_王艳明

《统计学》课后题答案第一章导论一、选择题1.C2.A3.C4.C5.C6.B7.A8.D9.C 10.D 11.A 12.C 13.C 14.A 15.B 16.A 17.C 18.B 19.D 20.A 21.D 22. D23.B 24.C 25.A 26.A 27.A 28.B 29.A 30.D 31.C 32.A 33.B第二章数据的收集一、选择题1.A2.B3.A4.D5.B6.C7.D8.D9.D 10.C 11.C 12.A 13.D 14.D 15.C 16.A 17.D 18.C 19.B 20.B 21.A 22.B 23.C 24.A 25.B 26.B 27.A 28.B 29.C 30.C (A)二、判断题1.∨2.∨3.×4. ∨5. ×6. ×7. ∨8. ×9. ×10. ×第三章数据整理与显示一、选择题CABCD CBBAB BACBD DDBC第四章数据分布特征的测度一、选择题1.A2.C3.B4.C5.D6.D7.A8.B9.A 10.B 11.A 12.D 13.C 14.C 15.D 16.A 17.A 18.B 19.A 20.B 21.A 22.A 23.B 24.C 25.C 26.D 27.D 28.A 29.D 30.C 31.C 32.D二、判断题1. ×2. ∨3. ×4. ×5. ×6. ×7. ∨8. ×9. × 10. ∨ 11. ∨ 12. ×四、计算题1. 11399073.8954ki ii kii x fx f=====∑∑甲11.96σ===甲73.89100%100% 6.18%11.96x σν=⨯=⨯=甲73.8100%100%7.43%9.93x σν=⨯=⨯=乙甲的代表性强2. 10.2510.966ki ii kii x fx f====∑∑0.250.056σ==0.250.056100%100% 5.834%0.966xσν=⨯=⨯= 1114.534ki ii kii x fx f====∑∑10.1295σ==10.1295100%100% 2.857%4.534xσν=⨯=⨯=该教练的说法不成立。

应用统计硕士(MAS)考试过关必做习题集(含名校考研真题详解)统计学(第4章 统计量及其抽样分布)【

应用统计硕士(MAS)考试过关必做习题集(含名校考研真题详解)统计学(第4章 统计量及其抽样分布)【

C. N(, 2)
N(, 2 )
D.
n
【答案】A
【解析】设样本标准差为 s,则在正态总体下,有
n
Y i1
Xi X 2
n 1 s2
2
~
2 n 1
5.设 X ~ N 0, 2 ,则服从 t n 1 的随机变量为(
nX A.S
n 1X B. S
nX C. S 2
n 1X D. S 2
)。[山东大学 2016 研]
均值的标准误为:
Nn x n N 1
N n 其中 N 1 为修正系数,对于无限总体进行不重置抽样时,可以按照重置抽样计算,当总体
为有限总体,N 比较大而 n / N 5% 时,修正系数可以简化为 1 n N ,当 N 比较大而
n / N 5% 时,修正系数可以近似为 1,即可以按重置抽样计算。
nX ~ N 0,1
A.
n
1
X
2 1
n
~
F 1,n 1
X
2 i
B. i2
Q2 ~ 2 n
C.
nX ~ t n 1
D. Q
【答案】B
【解析】B 项, X12 2 (1)
n
X
2 i
~
2(n
1),
n
X12
(n
1)
X
2 1
n
~
F(1, n 1)
i2
X
2 i
/
(n
1)
X
2 i
i2
i2
9.从同一正态总体中进行抽样,每一份样本的样本量都为 16,分别抽 1000 与 4000 次, 从而分别得到 1000 个样本均数与 4000 个样本均数,则( )。[中山大学 2014 研] A.前 1000 个样本均数的变异(方差)小,大约是后者的 1/2

统计学习题1

统计学习题1

第2章统计数据的描述练习:2.1为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:700 716 728 719 685 709 691 684 705 718706 715 712 722 691 708 690 692 707 701708 729 694 681 695 685 706 661 735 665668 710 693 697 674 658 698 666 696 698706 692 691 747 699 682 698 700 710 722694 690 736 689 696 651 673 749 708 727688 689 683 685 702 741 698 713 676 702701 671 718 707 683 717 733 712 683 692693 697 664 681 721 720 677 679 695 691713 699 725 726 704 729 703 696 717 688(1)利用计算机对上面的数据进行排序;(2)以组距为10进行等距分组,整理成频数分布表,并绘制直方图;(3)绘制茎叶图,并与直方图作比较。

2.2某百货公司6月份各天的销售额数据如下(单位:万元):257 276 297 252 238 310 240 236 265 278271 292 261 281 301 274 267 280 291 258272 284 268 303 273 263 322 249 269 295(1)计算该百货公司日销售额的均值、中位数和四分位数;(2)计算日销售额的标准差。

2.3在某地区抽取的120家企业按利润额进行分组,结果如下:按利润额分组(万元)企业数(个)200~300 19300~400 30400~500 42500~600 18600以上11合计120计算120家企业利润额的均值和标准差。

统计学课后习题答案(全章节)剖析

统计学课后习题答案(全章节)剖析

第二章、练习题及解答2.为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:700 716 728 719 685 709 691 684 705 718 706 715 712 722 691 708 690 692 707 701 708 729 694 681 695 685 706 661 735 665 668 710 693 697 674 658 698 666 696 698 706 692 691 747 699 682 698 700 710 722 694 690 736 689 696 651 673 749 708 727 688 689 683 685 702 741 698 713 676 702 701 671 718 707 683 717 733 712 683 692 693 697 664 681 721 720 677 679 695 691 713 699 725 726 704 729 703 696 717 688 要求:(2)以组距为10进行等距分组,生成频数分布表,并绘制直方图。

灯泡的使用寿命频数分布表3.某公司下属40个销售点2012年的商品销售收入数据如下:单位:万元152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。

(2)制作茎叶图,并与直方图进行比较。

解:(1)频数分布表(2)茎叶图第三章、练习题及解答1. 已知下表资料:试根据频数和频率资料,分别计算工人平均日产量。

解:根据频数计算工人平均日产量:687034.35200xf x f===∑∑(件) 根据频率计算工人平均日产量:34.35fx xf==∑∑(件)结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。

统计学课后习题与答案 郑贵华、颜泳红主编 湘潭大学出版:第四章 数据分布特征的度量

统计学课后习题与答案   郑贵华、颜泳红主编 湘潭大学出版:第四章 数据分布特征的度量

第四章思考与习题一、思考题1.什么是集中趋势?测度集中趋势常用指标有哪些?2.算术均值.众数和中位数有何关系?3.什么是几何平均数?其适用场合是什么?4.什么叫离散趋势?测度离散趋势常用指标有哪些?5.为什么要计算离散系数?二、练习题(一)填空题1.统计数据分布的特征,可以从三个方面进行测度和描述:一是分布的__________,反映所有数据向其中心值靠拢或聚集的程度;二是分布的__________,反映各数据远离其中心值的趋势;三是分布的__________,反映数据分布的形状。

2.在某城市随机抽取13个家庭,调查得到每个家庭的人均月收入数据如下:1080.750.1080.850.960.2000.1050.1080.760.1080.950.1080.660,则其众数为,中位数为。

3.算术均值有两个重要数学性质:各变量值与其算术均值的__________等于零;各变量值与其算术均值的__________等于最小值。

4.简单算术均值是__________的特例。

4.几何均值主要用于计算__________的平均。

5.在一组数据分布中,当算术均值大于中位数大于众数时属于________分布;当算术均值小于中位数小于众数时属于________分布。

6.__________是各变量值与其均值离差平方的平均数,是测度数值型数据__________最主要的方法。

7.为了比较人数不等的两个班级学生的学习成绩的优劣,需要计算__________;而为了说明哪个班级学生的学习成绩比较整齐,则需要计算________。

8.偏态是对数据分布__________或__________的测度;而峰度是对数据分布_________的测度。

(二)判断题1.众数的大小只取决于众数组与相邻组次数的多少。

()2.当总体单位数n为奇数时,中位数=(n+1)/2。

()3.根据组距分组数据计算的均值是一个近似值。

()4.若已知甲企业工资的标准差小于乙企业,则可断言:甲企业平均工资的代表性好于乙企业。

《统计学基础》(专)阶段练习四(第七、八章)

《统计学基础》(专)阶段练习四(第七、八章)

《统计学基础》(专)阶段练习四(第七、八章)一、填空题1.抽样调查中,抽取样本的方法有___重复抽样____和____不重复抽样___。

2。

根据总体各单位的标志值或标志属性计算的、反映总体数量特征的综合指标称为___总体指标____。

样本指标是根据___样本____标志值或标志属性计算的综合指标.3.在纯随机重复抽样的条件下,若其他条件不变,抽样平均误差缩小一半,则样本单位数___增加____;若抽样平均误差增加一倍,则样本单位数___减少____.4.影响抽样误差大小的因素主要有:___样本容量的大小____、___抽样方法____、___总体各单位标志值的变动程度____和抽样调查的组织形式.5.抽样误差是由于抽样的___随机性____而产生的误差,这种误差不可避免,但可以____控制___。

6。

影响样本单位数的因素主要有___总体标志值的变异程度____、___概率保证程度的大小____、___极限误差____及___抽样方法与组织形式____.7。

抽样估计的方法有___点估计____和___区间估计____两种。

8.常用的抽样组织形式有___简单随机抽样____、___分类抽样____、___整群抽样____、___等距抽样____四种。

9。

现象之间的相关关系按相关的程度分有___完全相关____相关、____不相关___相关和____不完全相关___相关;按相关关系的方向分有___正相关____相关和___负相关____相关;按相关关系的表现形式分有____线性相关___相关和___非线性相关____相关;按自变量的多少分有_______相关和_______相关。

10.相关系数等于0,说明两变量之间____无线性相关___;直线相关系数等于1,说明两变量之间____完全正线性相关___;直线相关系数等于-1,说明两变量之间___完全负线性相关____。

二、单项选择题1。

抽样平均误差是( A )。

统计学练习题及答案

统计学练习题及答案

第三章数据分布特征的描述1.下面是我国人口和国土面积资料:────────┬───────────────│根据第四人次人口普查调整数指标├──────┬────────│1982年│1990年────────┼──────┼────────人口总数│101654 │114333男│52352 │58904女│49302 │55429────────┴──────┴────────国土面积960万平方公里。

试计算所能计算的全部相对指标。

2.某企业2014年某产品单位成本520元,2015年计划规定在上年的基础上单位成本降低5%,实际降低6%,试确定2015年单位成本的计划数与实际数,并计算2015年单位成本比计划降低多少3.某市共有50万人,其市区人口占85%,郊区人口占15%,为了解该市居民的收入水平,在市区抽查了1500户居民,每人平均收入为1400元;在郊区抽查了1000户居民,每人年平均收入为1380元,若这两个抽样数字具有代表性,则计算该市居民年平均收入应采用哪一种形式的平均数方法进行计算4根据上表资料计算:(1)哪个班级统计学成绩好(2)哪个班级的成绩分布差异大哪个班级的成绩更稳定5.2014年8月份甲、乙两农贸市场资料如下:────┬──────┬─────────┬─────────品种│价格(元/斤)│甲市场成交额(万元)│乙市场成交量(万斤)────┼──────┼─────────┼─────────甲│││2乙│││1丙│││1────┼──────┼─────────┼─────────合计│──││4────┴──────┴─────────┴─────────试问哪一个市场农产品的平均价格较高并说明原因。

6.某车间有甲、乙两个生产组,甲组平均每个工人的日产量36件,标准差件。

乙组工人资料如下:要求:(1)计算乙组平均每个工人的日产量和标准差。

(2)比较甲、乙两个生产小组哪个组的平均日产量更有代表性比较哪组的产量更稳定比较哪组的产量差异大第四章抽样调查检验结果如下:1.某进出口公司出口茶叶,为检查其每包规格的重量,抽取样本100包,(1)确定每包平均重量的抽样平均误差和极限误差;(2)估计这批茶叶每包平均重量的范围,确定是否达到规格要求。

统计学习题(抽样分布、参数估计)

统计学习题(抽样分布、参数估计)

统计学习题(抽样分布、参数估计)练习题第1章绪论(略)第2章统计数据的描述2.1某家商场为了解前来该商场购物的顾客的学历分布情况,随机抽取了100名顾客。

其学历表示为:1.初中;2.高中/中专;3.大专;4.本科及以上学历。

调查结果如下:4222434414 2244432422 3121441424 2332134344 3312424324 2322212244 2123333334 2343313232 4313434214 2242334121(1)制作一张频数分布表。

(2)绘制一张条形图,反映学历分布。

2.2为了解某电信客户对该电信公司的服务的满意度情况,某调查公司分别对两个地区的电信用户在以下五个方面对受访用户的满意情况进行了问卷调查得到的数据如下(表中数据为平均满意度打分,从1分到10分满意度依次递增):地区企业形象客户期望质量感知价值感知客户总体满意度A 8.269504 7.51773 9.2624117.9148948.411348B 7.447368 8.3684218.9736848.1052637.394737试用条形图反映将两地区的满意度情况。

2.3下面是一个班50个学生的经济学考试成绩:88569179699088718279 988534744810075956092 83646569996445766369 6874948167818453912484628183698429667594(1)对这50名学生的经济学考试成绩进行分组并将其整理成频数分布表,绘制直方图。

(2)用茎叶图将原始数据表现出来。

2.4如下数据反映的是某大学近视度数的情况,共120名受访同学,男女同学各60名。

男149 161761821310 80 951081414 0 144145151515161681882121 0 21211052121211116817521 0 356462121212121312121 0 2121212121375375383838 8 45566065120 30120 7521女120 3334537437538700 90700 60141516212121211517170 0 0 0 0 0 0 0 5 521 0 1752121214043451217517 8 181818518519195196202021 0 21212121212121333335 0 3636363840474865055(1)按近视度数分别对男女学生进行分组。

统计学课后习题答案

统计学课后习题答案

第四章 统计描述【4.1】某企业生产铝合金钢,计划年产量40万吨,实际年产量45万吨;计划降低成本5%,实际降低成本8%;计划劳动生产率提高8%,实际提高10%。

试分别计算产量、成本、劳动生产率的计划完成程度。

【解】产量的计划完成程度=%5.112100%4045100%=⨯=⨯计划产量实际产量即产量超额完成12.5%。

成本的计划完成程=84%.96100%5%-18%-1100%-1-1≈⨯=⨯计划降低百分比实际降低百分比即成本超额完成3.16%。

劳动生产率计划完=85%.101100%8%110%1100%11≈⨯++=⨯++计划提高百分比实际提高百分比即劳动生产率超额完成1.85%。

【4.2】某煤矿可采储量为200亿吨,计划在1991~1995年五年中开采全部储量的0.1%,在五年中,该矿实际开采原煤情况如下(单位:万吨)试计算该煤矿原煤开采量五年计划完成程度及提前完成任务的时间。

【解】本题采用累计法:(1)该煤矿原煤开采量五年计划完成=100%⨯数计划期间计划规定累计数计划期间实际完成累计 =75%.12610210253574=⨯⨯ 即:该煤矿原煤开采量的五年计划超额完成26.75%。

(2)将1991年的实际开采量一直加到1995年上半年的实际开采量,结果为2000万吨,此时恰好等于五年的计划开采量,所以可知,提前半年完成计划。

【4.3】我国1991年和1994年工业总产值资料如下表:要求:(1)计算我国1991年和1994年轻工业总产值占工业总产值的比重,填入表中; (2)1991年、1994年轻工业与重工业之间是什么比例(用系数表示)? (3)假如工业总产值1994年计划比1991年增长45%,实际比计划多增长百分之几? 【解】(1)(2)是比例相对数;1991年轻工业与重工业之间的比例=96.01.144479.13800≈;1994年轻工业与重工业之间的比例=73.04.296826.21670≈(3)%37.251%)451(2824851353≈-+即,94年实际比计划增长25.37%。

统计学第四版第七章答案

统计学第四版第七章答案

第四章 抽样分布与参数估计7.2 某快餐店想要估计每位顾客午餐的平均花费金额。

在为期3周的时间里选取49名顾客组成了一个简单随机样本。

(1)假定总体标准差为15元,求样本均值的抽样标准误差。

x σ===2.143 (2)在95%的置信水平下,求边际误差。

x x t σ∆=⋅,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=2z α 因此,x x t σ∆=⋅x z ασ=⋅0.025x z σ=⋅=1.96×2.143=4.2 (3)如果样本均值为120元,求总体均值 的95%的置信区间。

置信区间为:(),x x x x -∆+∆=()120 4.2,120 4.2-+=(115.8,124.2)7.4 从总体中抽取一个n=100的简单随机样本,得到x =81,s=12。

要求:大样本,样本均值服从正态分布:2,xN n σμ⎛⎫ ⎪⎝⎭或2,s xN n μ⎛⎫⎪⎝⎭置信区间为:22x z x z αα⎛-+ ⎝(1)构建μ的90%的置信区间。

2z α=0.05z =1.645,置信区间为:()81 1.645 1.2,81 1.645 1.2-⨯+⨯=(79.03,82.97)(2)构建μ的95%的置信区间。

2z α=0.025z =1.96,置信区间为:()81 1.96 1.2,81 1.96 1.2-⨯+⨯=(78.65,83.35)(3)构建μ的99%的置信区间。

2z α=0.005z =2.576,置信区间为:()81 2.576 1.2,81 2.576 1.2-⨯+⨯=(77.91,84.09)7.7 某大学为了解学生每天上网的时间,在全校7 500名学生中采取重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时):解:(1)样本均值x =3.32,样本标准差s=1.61; (2)抽样平均误差: 重复抽样:x σ≈不重复抽样:x σ≈=0.268×0.998=0.267(3)置信水平下的概率度: 1α-=0.9,t=2z α=0.05z =1.645 1α-=0.95,t=2z α=0.025z =1.96 1α-=0.99,t=2z α=0.005z =2.576 (4)边际误差(极限误差): 2x x x t z ασσ∆=⋅=⋅1α-=0.9,2x x x t z ασσ∆=⋅=⋅=0.05x z σ⋅重复抽样:2x x z ασ∆=⋅=0.05x z σ⋅=1.645×0.268=0.441 不重复抽样:2x x z ασ∆=⋅=0.05x z σ⋅=1.645×0.267=0.4391α-=0.95,2x x x t z ασσ∆=⋅=⋅=0.025x z σ⋅重复抽样:2x x z ασ∆=⋅=0.025x z σ⋅=1.96×0.268=0.525 不重复抽样:2x x z ασ∆=⋅=0.025x z σ⋅=1.96×0.267=0.5231α-=0.99,2x x x t z ασσ∆=⋅=⋅=0.005x z σ⋅重复抽样:2x x z ασ∆=⋅=0.005x z σ⋅=2.576×0.268=0.69 不重复抽样:2x x z ασ∆=⋅=0.005x z σ⋅=2.576×0.267=0.688(5)置信区间:(),x x x x -∆+∆1α-=0.9,重复抽样:(),x x x x -∆+∆=()3.320.441,3.320.441-+=(2.88,3.76)不重复抽样:(),x x x x -∆+∆=()3.320.439,3.320.439-+=(2.88,3.76)1α-=0.95,重复抽样:(),x x x x -∆+∆=()3.320.525,3.320.525-+=(2.79,3.85) 不重复抽样:(),x x x x -∆+∆=()3.320.441,3.320.441-+=(2.80,3.84)1α-=0.99,重复抽样:(),x x x x -∆+∆=()3.320.69,3.320.69-+=(2.63,4.01) 不重复抽样:(),x x x x -∆+∆=()3.320.688,3.320.688-+=(2.63,4.01)7.9 某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离(单位:km)分别是:10 3 14 8 6 9 12 11 7 5 10 15 9 16 13 2假定总体服从正态分布,求职工上班从家里到单位平均距离的95%的置信区间。

概率论与数理统计 南京大学 4 第四章统计量与抽样分布 (4.1.1) 初识统计学

概率论与数理统计 南京大学 4  第四章统计量与抽样分布 (4.1.1)  初识统计学

统计的任务:
样本
统计推断 估计 假设检验
总体:研究对象的全体,一般用随机变量X来 表示总体。
样本:从总体中随机抽取的一些个体。一般用 一列随机变量(X1,X2,…,Xn)来表示。
简独立单,随且机具样有本相:同若的样分本布(X。1,X2…,Xn)相互初识统计学
2019/1/6
统计学产生于十九世纪末,距今一百多年。
K.Pearson,1857-1936
R.A.Fisher,1890-1962
数理统计:收集,分析带有随机影响的 数据的学科。
注:统计的思想方法与数学不同,数学 是演绎的思想;统计是归纳的思想。
命题:三角形内角之和为180度。 数学家:严格推导。 统计学家: 1.取样; 2.得到数据; 3.由假设检验理论得出结果。

统计学习题 第四章 抽样估计

统计学习题 第四章  抽样估计

第四章抽样估计一、判断题1.抽样估计的目的是用以说明总体特征。

2.抽样分布就是样本分布。

3.既定总体在当抽样方法、抽样组织形式和样本容量确定时,样本均值的分布惟一确定。

4.样本容量就是样本个数。

5.在抽样中,样本容量是越大越好。

6.抽样的目的是判断样本估计值是否处于以总体指标为中心的某规定区域范围内。

7.当估计量有偏时,人们应该弃之不用。

8.对于一个确定的抽样分布,其方差是确定的,因而抽样标准误也是确定的。

9.抽样极限误差越大,用以包含总体参数的区间就越大,估计的把握程度也就越大,因此极限误差越大越好。

10.非抽样误差会随着样本容量的扩大而下降。

二、单项选择题1.想了解学生的眼睛视力状况,准备抽取若干学校、若干班级的学生进行测试,则()。

A.观测单位是学校B.观测单位是班级C.观测单位是学生D.观测单位可以是学校、也可班级或学生2.下列误差中属于非一致性的有()。

A.估计量偏差B.偶然性误差C.抽样标准误D.非抽样误差3.抽样估计中最常用的分布理论是()。

A.t分布理论B.二项分布理论C.正态分布理论D.超几何分布理论4.抽样标准误大小与下列哪个因素无关?()A.样本容量B.抽样方式、方法C.概率保证程度D.估计量5.下列关于抽样标准误的叙述哪个是错误的?()A.抽样标准误是抽样分布的标准差B.抽样标准误的理论值是惟一的,与所抽样本无关C.抽样标准误比抽样极限误差小D.抽样标准误只能衡量抽样中的偶然性误差的大小三、计算分析题1. 某小组5个工人的每周工资分别为520、540、560、580、600元,现从中用简单随机抽样形式(不重复抽样)随机抽取2个工人周工资构成样本。

要求:(1)计算总体平均工资的标准差;(2)列出全部可能的样本平均工资;(3)计算样本平均工资的平均数,并检验其是否等于总体平均工资;(4)计算样本平均工资的标准差;(5)用抽样平均误差的公式计算并验证是否等于(4)的结果。

2.从某大型企业中随机抽取100名职工,调查他们的工资。

医学统计学课后习题答案.

医学统计学课后习题答案.

医学统计学课后习题答案第一章医学统计中的基本概念练习题一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A.收缩压测量值B.脉搏数C.住院天数D.病情程度E.四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差答案: E E D E A二、简答题常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。

要尽量查明其原因,必须克服。

(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。

譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。

对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。

一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。

(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。

统计学答案

统计学答案

统计学课本课后作业题(全) 题目第1 章:P^ 6, 7第2章:P52练习题3、9、10、11第3章:P116思考题12、14 练习题16、25第4章:P114 思考题6,练习题2、4、6、13第5章:P179思考题4、练习题3、4、6、11第6章:P209 思考题4、练习题1、3、6第7章:P246思考题1、练习题1、7第8章:卩287 思考题4、10 练习题2、3第一章6••一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。

因此,他们开始检查供货商的集装箱,有问题的将其退回。

最近的一个集装箱装的是2 440加仑的油漆罐。

这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。

装满的油漆罐应为4.536 kg。

要求:(1)描述总体;最近的一个集装箱内的全部油漆;(2)描述研究变量;装满的油漆罐的质量;(3)描述样本;最近的一个集装箱内的50罐油漆;(4)描述推断。

50罐油漆的质量应为4.536X 50= 226.8 kg。

7•“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。

这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。

假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说岀A品牌或B品牌中哪个口味更好。

要求:答:(1)总体:市场上的“可口可乐"与“百事可乐"(2)研究变量:更好口味的品牌名称;⑶样本:1000名消费者品尝的两个品牌(4)推断:两个品牌中哪个口味更好。

第二章3.某百货公司连续40天的商品销售额如下(单位:万元):41 25 29 47 38 34 30 38 43 4046 36 45 37 37 36 45 43 33 4435 28 46 34 30 37 44 26 38 4442 36 37 37 49 39 42 32 36 35根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图解:采用等距分组全距=49-25=24n=40 取组距为5,则组数为24/5=4.8取5组频数分布表:某百货公司月份各天的销售额数据如下(单位:万元):257 276 297 252 238 310 240 236 265 278271 292 261 281 301 274 267 280 291 258272 284 268 303 273 263 322 249 269 295(1)计算该百货公司日销售额的均值、中位数和四分位数;(2)计算日销售额的标准差。

统计学课后习题答案_(第四版)_贾俊平

统计学课后习题答案_(第四版)_贾俊平

《统计学》第四版 第四章练习题答案4.1 (1)众数:M 0=10; 中位数:中位数位置=n+1/2=5.5,M e =10;平均数:6.91096===∑nxx i(2)Q L 位置=n/4=2.5, Q L =4+7/2=5.5;Q U 位置=3n/4=7.5,Q U =12 (3)2.494.1561)(2==-=∑-n i s x x (4)由于平均数小于中位数和众数,所以汽车销售量为左偏分布。

4.2 (1)从表中数据可以看出,年龄出现频数最多的是19和23,故有个众数,即M 0=19和M 0=23。

将原始数据排序后,计算中位数的位置为:中位数位置= n+1/2=13,第13个位置上的数值为23,所以中位数为M e =23(2)Q L 位置=n/4=6.25, Q L ==19;Q U 位置=3n/4=18.75,Q U =26.5(3)平均数==∑nx x i600/25=24,标准差65.612510621)(2=-=-=∑-n i s x x(4)偏态系数SK=1.08,峰态系数K=0.77(5)分析:从众数、中位数和平均数来看,网民年龄在23-24岁的人数占多数。

由于标准差较大,说明网民年龄之间有较大差异。

从偏态系数来看,年龄分布为右偏,由于偏态系数大于1,所以,偏斜程度很大。

由于峰态系数为正值,所以为尖峰分布。

4.3 (1(2)==∑nx x i63/9=7,714.0808.41)(2==-=∑-n i s x x (3)由于两种排队方式的平均数不同,所以用离散系数进行比较。

第一种排队方式:v 1=1.97/7.2=0.274;v 2=0.714/7=0.102.由于v 1>v 2,表明第一种排队方式的离散程度大于第二种排队方式。

(4)选方法二,因为第二种排队方式的平均等待时间较短,且离散程度小于第一种排队方式。

4.4 (1)==∑nx x i8223/30=274.1中位数位置=n+1/2=15.5,M e =272+273/2=272.5(2)Q L 位置=n/4=7.5, Q L ==(258+261)/2=259.5;Q U 位置=3n/4=22.5,Q U =(284+291)/2=287.5(3) 17.211307.130021)(2=-=-=∑-n i s x x4.5 (1)甲企业的平均成本=总成本/总产量=41.193406600301500203000152100150030002100==++++乙企业的平均成本=总成本/总产量=29.183426255301500201500153255150015003255==++++原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第4章 抽样与抽样分布——练习题(全免)
1. 一个具有64=n 个观察值的随机样本抽自于均值等于20、标准差等于16的总体。

⑴ 给出x 的抽样分布(重复抽样)的均值和标准差
⑵ 描述x 的抽样分布的形状。

你的回答依赖于样本容量吗?
⑶ 计算标准正态z 统计量对应于5.15=x 的值。

⑷ 计算标准正态z 统计量对应于23=x 的值。

解: 已知 n=64,为大样本,μ=20,σ=16,
⑴在重复抽样情况下,x 的抽样分布的均值为
a. 20, 2
b. 近似正态
c. -2.25
d. 1.50
2 . 参考练习4.1求概率。

⑴x <16; ⑵x >23; ⑶x >25; ⑷.x 落在16和22之间; ⑸x <14。

解: a. 0.0228 b. 0.0668 c. 0.0062 d. 0.8185 e. 0.0013
3. 一个具有100=n 个观察值的随机样本选自于30=μ、16=σ的总体。

试求下列概率的近似值:
解: a. 0.8944 b. 0.0228 c. 0.1292 d. 0.9699
4. 一个具有900=n 个观察值的随机样本选自于100=μ和10=σ的总体。

⑴ 你预计x 的最大值和最小值是什么?
⑵ 你认为x 至多偏离μ多么远?
⑶ 为了回答b 你必须要知道μ吗?请解释。

解:a. 101, 99 b. 1 c. 不必
5. 考虑一个包含x 的值等于0,1,2,…,97,98,99的总体。

假设x 的取值的可能性是相同的。

则运用计算机对下面的每一个n 值产生500个随机样本,并对于每一个样本计算x 。

对于每一个样本容量,构造x 的500个值的相对频率直方图。

当n 值增加时在直方图上会发生什么变化?存在什么相似性?这里30,10,5,2====n n n n 和50=n 。

解:趋向正态
6. 美国汽车联合会(AAA )是一个拥有90个俱乐部的非营利联盟,它对其成员提供旅行、
金融、保险以及与汽车相关的各项服务。

1999年5月,AAA 通过对会员调查得知一个4口之家出游中平均每日餐饮和住宿费用大约是213美元(《旅行新闻》Travel News ,1999年5月11日)。

假设这个花费的标准差是15美元,并且AAA 所报道的平均每日消费是总体均值。

又假设选取49个4口之家,并对其在1999年6月期间的旅行费用进行记录。

⑴ 描述x (样本家庭平均每日餐饮和住宿的消费)的抽样分布。

特别说明x 服从怎样
的分布以及x 的均值和方差是什么?证明你的回答; ⑵ 对于样本家庭来说平均每日消费大于213美元的概率是什么?大于217美元的概率
呢?在209美元和217美元之间的概率呢?
解: a. 正态分布, 213, 4.5918 b. 0.5, 0.031, 0.938
7. 技术人员对奶粉装袋过程进行了质量检验。

每袋的平均重量标准为406=μ克、标准差
为1.10=σ克。

监控这一过程的技术人者每天随机地抽取36袋,并对每袋重量进行测量。

现考虑这36袋奶粉所组成样本的平均重量x 。

(1)描述x 的抽样分布,并给出x μ和x σ的值,以及概率分布的形状;
(3) 假设某一天技术人员观察到8.400=x ,这是否意味着装袋过程出
现问题了呢,为什么?
解: a. 406, 1.68, 正态分布 b. 0.001 c. 是,因为小概率出现了
8. 在本章的统计实践中,某投资者考虑将1000美元投资于5=n 种不同的股票。

每一种股
票月收益率的均值为%10=μ,标准差%4=σ。

对于这五种股票的投资组合,投资者每月的收益率是∑=5i r r 。

投资者的每月收益率的方差是2.32
2==n r σσ,
它是投资者所面临风险的一个度量。

⑴ 假如投资者将1000美元仅投资于这5种股票的其中3种,则这个投资者所面对的
风险将会增加还是减少?请解释;
⑵ 假设将1000美元投资在另外10种收益率与上述的完全一样的股票,试度量其风险,
并与只投资5种股票的情形进行比较。

解:a. 增加 b. 减少
9. 某制造商为击剑运动员生产安全夹克,这些夹克是以剑锋刺入其中时所需的最小力量(以
牛顿为单位)来定级的。

如果生产工艺操作正确,则他生产的夹克级别应平均840牛顿,标准差15牛顿。

国际击剑管理组织(FIE )希望这些夹克的最低级别不小于800牛顿。

为了检查其生产过程是否正常,某检验人员从生产过程中抽取了50个夹克作为一个随机样本进行定级,并计算x ,即该样本中夹克级别的均值。

她假设这个过程的标准差是固定的,但是担心级别均值可能已经发生变化。

⑴ 如果该生产过程仍旧正常,则x 的样本分布为何?
⑵ 假设这个检验人员所抽取样本的级别均值为830牛顿,则如果生产过程正常的话,
样本均值x ≤830牛顿的概率是多少?
⑶ 在检验人员假定生产过程的标准差固定不变时,你对b 部分有关当前生产过程的现
状有何看法(即夹克级别均值是否仍为840牛顿)?
⑷ 现在假设该生产过程的均值没有变化,但是过程的标准差从15牛顿增加到了45牛
顿。

在这种情况下x 的抽样分布是什么?当x 具有这种分布时,则x ≤830牛顿的概率是多少?
解: a. 正态 b. 约等于0 c. 不正常 d. 正态, 0.06
10. 在任何生产过程中,产品质量的波动都是不可避免的。

产品质量的变化可被分成两类:
由于特殊原因所引起的变化(例如,某一特定的机器),以及由于共同的原因所引起的变化(例如,产品的设计很差)。

一个去除了质量变化的所有特殊原因的生产过程被称为是稳定的或者是在统计控制中的。

剩余的变化只是简单的随机变化。

假如随机变化太大,则管理部门不能接受,
但只要消除变化的共同原因,便可减少变化(Deming,1982,1986;De Vor, Chang,和Sutherland,1992)。

通常的做法是将产品质量的特征绘制到控制图上,然后观察这些数值随时间如何变动。

例如,为了控制肥皂中碱的数量,可以每小时从生产线中随机地抽选5=n 块试验肥皂作为样本,并测量其碱的数量,不同时间的样本含碱量的均值x 描绘在下图中。

假设这个过程是在统计控制中的,则x 的分布将具有过程的均值μ,标准差具有过程的标准差除以样本容量的平方根,n x σσ=。

下面的控制图中水平线表示过程均值,两条线称为控制极限度,位于μ的上下3x σ的位置。

假如x 落在界限的外面,则有充分的理由说明目前存在变化的特殊原因,这个过程一定是失控的。

当生产过程是在统计控制中时,肥皂试验样本中碱的百分比将服从%2=μ和
%1=σ的近似的正态分布。

⑴ 假设,4=n 则上下控制极限应距离μ多么远?
⑵ 假如这个过程是在控制中,则x 落在控制极限之外的概率是多少?
⑶ 假设抽取样本之前,过程均值移动到%3=μ,则由样本得出这个过程失控的(正
确的)结论的概率是多少?
解:a. 0.015 b. 0.0026 c. 0.1587
4.11. 参考练习4.10。

肥皂公司决定设置比练习4.10中所述的x σ3这一限度更为严格的控制极限。

特别地,当加工过程在控制中时,公司愿意接受x 落在控制极限外面的概率是0.10。

⑴ 若公司仍想将控制极限度设在与均值的上下距离相等之处,并且仍计划在每小时的
样本中使用4=n 个观察值,则控制极限应该设定在哪里?
⑵ 假设a 部分中的控制极限已付诸实施,但是公司不知道,μ现在是3%(而不是2%)。

若4=n ,则x 落在控制极限外面的概率是多少?若9=n 呢?
解: a. (0.012, 0.028) b. 0.6553, 0.7278
4.12. 参考练习4.11。

为了改进控制图的敏感性,有时将警戒线与控制极限一起画在图上。

警戒限一般被设定为x σμ96.1±。

假如有两个连续的数据点落在警戒限之外,则这个过程一定是失控的(蒙哥马利,1991年)。

⑴ 假设肥皂加工过程是在控制中(即,它遵循%2=μ和%1=σ的正态分布),则x
的下一个值落在警戒限之外的概率是什么?
⑵ 假设肥皂加工过程是在控制中,则你预料到画在控制图上的x 的这40个值中有多
少个点落在上控制极限以上?
⑶ 假设肥皂加工过程是在控制中,则x 的两个未来数值落在下警戒线以下的概率是多
少?
解:a. 0.05 b. 1 c. 0.000625。

相关文档
最新文档