统计学课后题答案(袁卫_庞皓_曾五一_贾俊平_)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
版权归wagxjysys所有违者必究
第1章绪论
1.什么是统计学?怎样理解统计学与统计数据的关系?
2.试举出日常生活或工作中统计数据及其规律性的例子。
3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。
因此,他们开始检查供货商的集装箱,有问题的将其退回。
最近的一个集装箱装的是2 440加仑的油漆罐。
这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。
装满的油漆罐应为4.536 kg。
要求:
(1)描述总体;
(2)描述研究变量;
(3)描述样本;
(4)描述推断。
答:(1)总体:最近的一个集装箱内的全部油漆;
(2)研究变量:装满的油漆罐的质量;
(3)样本:最近的一个集装箱内的50罐油漆;
(4)推断:50罐油漆的质量应为4.536×50=226.8 kg。
4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。
这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。
假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。
要求:
(1)描述总体;
(2)描述研究变量;
(3)描述样本;
(4)一描述推断。
答:(1)总体:市场上的“可口可乐”与“百事可乐”
(2)研究变量:更好口味的品牌名称;
(3)样本:1000名消费者品尝的两个品牌
(4)推断:两个品牌中哪个口味更好。
第2章统计数据的描述——练习题
●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。
服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。
调查结果如下:
B E
C C A
D C B A E
D A C B C D
E C E E
A D
B
C C A E
D C B
B A
C
D
E A B D D C
C B C E
D B C C B C
D A C B C D
E C E B
B E
C C A
D C B A E
B A
C
D
E A B D D C
A D
B
C C A E
D C B
C B C E
D B C C B C
(1) 指出上面的数据属于什么类型;
(2)用Excel制作一张频数分布表;
(3) 绘制一张条形图,反映评价等级的分布。
解:(1)由于表2.21中的数据为服务质量的等级,可以进行优劣等级比较,但不能计算差异大小,属于顺序数据。
(2)频数分布表如下:
服务质量等级评价的频数分布
服务质量等级家庭数(频数)频率%
A1414
B2121
C3232
D1818
E1515
合计100100
(3)条形图的制作:将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:图表向导→条形图→选择子图表类型→完成(见Excel练习题2.1)。
即得到如下的条形图:
:
105 119 114 115 87 103 118 142 135 125
117 108 105 110 107 137 120 136 117 108
97 88 123 115 119 138 112 146 113 126
(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率;
(2)如果按规定:销售收入在125万元以上为先进企业,115万~125万元为良好企业,
105万~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。
解:(1)要求对销售收入的数据进行分组,
全部数据中,最大的为152,最小的为87,知数据全距为152-87=65;
为便于计算和分析,确定将数据分为6组,各组组距为10,组限以整10划分;
为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值87可能落在最小组之下,最大值152可能落在最大组之上,将最小组和最大组设计成开口形式;
按照“上限不在组内”的原则,用划记法统计各组内数据的个数——企业数,也可以用Excel进行排序统计(见Excel练习题2.2),将结果填入表内,得到频数分布表如下表中的左两列;
将各组企业数除以企业总数40,得到各组频率,填入表中第三列;
在向上的数轴中标出频数的分布,由下至上逐组计算企业数的向上累积及频率的向上累积,由上至下逐组计算企业数的向下累积及频率的向下累积。
整理得到频数分布表如下:
(2)按题目要求分组并进行统计,得到分组表如下:
某管理局下属40个企分组表
按销售收入分组(万元)企业数(个)频率(%)
先进企业良好企业一般企业落后企业11
11
9
9
27.5
27.5
22.5
22.5
合计40 100.0
● 3.某百货公司连续40天的商品销售额如下(单位:万元):
41 25 29 47 38 34 30 38 43 40
46 36 45 37 37 36 45 43 33 44
35 28 46 34 30 37 44 26 38 44
42 36 37 37 49 39 42 32 36 35
根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。
解:全部数据中,最大的为49,最小的为25,知数据全距为49-25=24;
为便于计算和分析,确定将数据分为5组,各组组距为5,组限以整5的倍数划分;
为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值24已落在最小组之中,最大值49已落在最大组之中,故将各组均设计成闭口形式;
按照“上限不在组内”的原则,用划记法或用Excel统计各组内数据的个数——天数,(见Excel练习题2.3)并填入表内,得到频数分布表如下表中的左两列;
将各组天数除以总天数40,得到各组频率,填入表中第三列;
得到频数分布表如下:
某百货公司日商品销售额分组表
按销售额分组(万元)频数(天)频率(%)
25~30 30~35 35~40 40~45 45~50
4
6
15
9
6
10.0
15.0
37.5
22.5
15.0
合计40 100.0
直方图:将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:图表向导→柱形图→选择子图表类型→完成。
即得到如下的直方图:(见Excel练习题2.3)
●4.为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:
700 716 728 719 685 709 691 684 705 718
706 715 712 722 691 708 690 692 707 701
708 729 694 681 695 685 706 661 735 665
668 710 693 697 674 658 698 666 696 698
706 692 691 747 699 682 698 700 710 722
694 690 736 689 696 651 673 749 708 727
688 689 683 685 702 741 698 713 676 702
701 671 718 707 683 717 733 712 683 692
693 697 664 681 721 720 677 679 695 691
713 699 725 726 704 729 703 696 717 688
(1)利用计算机对上面的数据进行排序;
(2)以组距为10进行等距分组,整理成频数分布表,并绘制直方图;
(3)绘制茎叶图,并与直方图作比较。
解:(1)排序:将全部数据复制到Excel中,并移动到同一列,点击:数据→排序→确定,即完成数据排序的工作。
(见Excel练习题2.4)
(2)按题目要求,利用已排序的Excel表数据进行分组及统计,得到频数分布表如下:(见Excel练习题2.4)
100只灯泡使用寿命非频数分布
按使用寿命分组(小时)灯泡个数(只)频率(%)
650~660 2 2
660~670 5 5
670~680 6 6
680~690 14 14
690~700 26 26
700~710 18 18
710~720 13 13
720~730 10 10
730~740 3 3
740~750 3 3
合计100 100
制作直方图:将上表(包含总标题,去掉合计栏)复制到Excel表中,选择全表后,点击:图表向导→柱形图→选择子图表类型→完成。
即得到如下的直方图:
(见Excel练习题2.4)
(3)制作茎叶图:以十位以上数作为茎,填入表格的首列,将百、十位数相同的数据的个位数按由小到大的顺序填入相应行中,即成为叶,
将直方图与茎叶图对比,可见两图十分相似。
●5.下面是北方某城市1~2月份各天气温的记录数据:
-3 2 -4 -7 -11 -1 7 8 9 -6 -7
-14 -18 -15 -9 -6 -1 0 5 -4 -9 -3
-6 -8 -12 -16 -19 -15 -22 -25 -24 -19 -21
-8 -6 -15 -11 -12 -19 -25 -24 -18 -17 -24
-14 -22 -13 -9 -6 0 -1 5 -4 -9 -3
-3 2 -4 -4 -16 -1 7 5 -6 -5
(1)指出上面的数据属于什么类型;
(2)对上面的数据进行适当的分组;
(3)绘制直方图,说明该城市气温分布的特点。
解:(1)由于各天气温的记录数据属于数值型数据,它们可以比较高低,且0不表示没有,因此是定距数据。
(2)分组如下:
由于全部数据中,最大的为9,最小的为-25,知数据全距为9-(-25)=34;
为便于计算和分析,确定将数据分为7组,各组组距为5,组限以整5的倍数划分;
为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值-25已落在最小组之中,最大值9已落在最大组之中,故将各组均设计成闭口形式;
按照“上限不在组内”的原则,用划记法(或Excel排序法,见Excel练习题2.5)统计各组内数据的个数——天数,并填入表内,得到频数分布表如下表;
北方某城市1~2月份各天气温
分组天数(天)
-25~-20 8
-20~-15 8
-15~-10 10
-10~-5 14
-5~0 14
0~5 4
5~10 7
合计65
(3)制作直方图:将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:图表向导→柱形图→选择子图表类型→完成。
即得到如下的直方图:(见Excel练习题2.5)
●6
(1)对这个年龄分布作直方图;
(2)从直方图分析成人自学考试人员年龄分布的特点。
解:(1)制作直方图:将上表复制到Excel表中,点击:图表向导→柱形图→选择子图表类型→完成。
即得到如下的直方图:(见Excel练习题2.6)
(2)年龄分布的特点:自学考试人员年龄的分布为右偏。
7.下面是A、B两个班学生的数学考试成绩数据:
A班:
44 57 59 60 61 61 62 63 63 65
66 66 67 69 70 70 71 72 73 73
73 74 74 74 75 75 75 75 75 76
76 77 77 77 78 78 79 80 80 82
85 85 86 86 90 92 92 92 93 96
B班:
35 39 40 44 44 48 51 52 52 54
55 56 56 57 57 57 58 59 60 61
61 62 63 64 66 68 68 70 70 71
71 73 74 74 79 81 82 83 83 84
85 90 91 91 94 95 96 100 100 100
(1)将两个班的考试成绩用一个公共的茎制成茎叶图;
(2)比较两个班考试成绩分布的特点。
解:(1)将树茎放置中间,A班树叶向左生长,B班树叶向右生长,得茎叶图如下:
(2)比较可知:A班考试成绩的分布比较集中,且平均分数较高;B班考试成绩的分布比A班分散,且平均成绩较A班低。
8.1997年我国几个主要城市各月份的平均相对湿度数据如下表,试绘制箱线图,并分析各
解:箱线图如下:(特征请读者自己分析)
●9.某百货公司6月份各天的销售额数据如下(单位:万元):
257 276 297 252 238 310 240 236 265 278
271 292 261 281 301 274 267 280 291 258
272 284 268 303 273 263 322 249 269 295
(1)计算该百货公司日销售额的均值、中位数和四分位数;
(2)计算日销售额的标准差。
解:(1)将全部30个数据输入Excel表中同列,点击列标,得到30个数据的总和为8223,于是得该百货公司日销售额的均值:(见Excel练习题2.9)
x=
x
n
∑
=
8223
30
=274.1(万元)
或点选单元格后,点击“自动求和”→“平均值”,在函数EVERAGE()的空格中输入“A1:A30”,回车,得到均值也为274.1。
在Excel表中将30个数据重新排序,则中位数位于30个数据的中间位置,即靠中的第15、第16两个数272和273的平均数:
M e=272273
2
+
=272.5(万元)
由于中位数位于第15个数靠上半位的位置上,所以前四分位数位于第1~第15个数据的中间位置(第8位)靠上四分之一的位置上,
由重新排序后的Excel表中第8位是261,第15位是272,从而:
Q L=261+273272
4
-
=261.25(万元)
同理,后四分位数位于第16~第30个数据的中间位置(第23位)靠下四分之一的位置上,由重新排序后的Excel表中第23位是291,第16位是273,从而:
Q U=291-273272
4
-
=290.75(万元)。
(2)未分组数据的标准差计算公式为:
s
利用上公式代入数据计算是个较为复杂的工作。
手工计算时,须计算30个数据的离差平方,并将其求和,()再代入公式计算其结果:得s=21.1742。
(见Excel练习题2.9)我们可以利用Excel表直接计算标准差:
点选数据列(A列)的最末空格,再点击菜单栏中“∑”符号右边的小三角“▼”,选择“其它函数”→选择函数“STDEV”→“确定”,在出现的函数参数窗口中的Number1右边的空栏中输入:A1:A30,→“确定”,即在A列最末空格中出现数值:21.17412,即为这30个数据的标准差。
于是:
17
.
21
=
s(万元)。
(见Excel练习题2.9)
●10.
解:设产品单位成本为x,产量为f,则总成本为xf,
由于:平均成本x=
xf
f
∑
∑=
总成本
总产量
,而已知数据中缺产量f的数据,
又因个别产品产量f =
该产品成本
该产品单位成本
=
xf
x
从而x=
xf
xf
x
∑
∑
,于是得:
甲企业平均成本=
xf
xf
x
∑
∑
=
210030001500
210030001500
152030
++
++
=19.41(元),
乙企业平均成本=
xf
xf
x
∑
∑
=
325515001500
325515001500
152030
++
++
=18.29(元),
对比可见,甲企业的总平均成本较高。
原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
●11.在某地区抽取的120家企业按利润额进行分组,结果如下:
按利润额分组(万元)企业数(个)
200~300 19
300~400 30
400~500 42
500~600 18
600以上11
合计120
计算120家企业利润额的均值和标准差。
解:设各组平均利润为x,企业数为f,则组总利润为xf,
由于数据按组距式分组,须计算组中值作为各组平均利润,列表计算得:
按利润额分组(万元)组中值企业数(个)总利润x f xf
200~300 250 19 4750
300~400 350 30 10500
400~500 450 42 18900
500~600 550 18 9900
600以上650 11 7150
合计—120 51200 于是,120家企业平均利润为:
x=
xf
f
∑
∑=
51200
120
= 426.67(万元);
分组数据的标准差计算公式为:
s
手动计算须列表计算各组数据离差平方和(x-426.67)2f,并求和,再代入计算公式:列表计算如下
组中值企业数(个)
(x-426.67)2f
x f
250 19 593033.4891
350 30 176348.667
450 42 22860.1338
550 18 273785.2002
650 11 548639.1779
合计120 1614666.668
表格中(x-426.67)2f的计算方法:
方法一:将表格复制到Excel表中,点击第三列的顶行单元格后,在输入栏中输入:=(a3-426.67)* (a3-426.67)*b3,回车,得到该行的计算结果;
点选结果所在单元格,并将鼠标移动到该单元格的右下方,当鼠标变成黑“+”字时,压下左键并拉动鼠标到该列最后一组数据对应的单元格处放开,则各组数据的(x-426.67)2f 计算完毕;
于是得标准差:(见Excel练习题2.11)
(万元)。
点击第三列的合计单元格后,点击菜单栏中的“∑”号,回车,即获得第三列数据的和。
方法二:将各组组中值x复制到Excel的A列中,并按各组次数f在同列中复制,使该列中共有f个x,120个数据生成后,点选A列的最末空格,再点击菜单栏中“∑”符号右边的小三角“▼”,选择“其它函数”→选择函数“STDEV”→“确定”,在出现的函数参数窗口中的Number1右边的空栏中输入:A1:A30,→“确定”,即在A列最末空格中出现数值:116.4845,即为这120个数据的标准差。
(见Excel练习题2.11)
于是得标准差:
s =116.4845(万元)。
●12.为研究少年儿童的成长发育状况,某研究所的一位调查人员在某城市抽取100名7~17岁的少年儿童作为样本,另一位调查人员则抽取了1000名7~17岁的少年儿童作为样本。
请回答下面的问题,并解释其原因。
(1)哪一位调查研究人员在其所抽取的样本中得到的少年儿童的平均身高较大?或者这两组样本的平均身高相同?
(2)哪一位调查研究人员在其所抽取的样本中得到的少年儿童身高的标准差较大?或者这两组样本的标准差相同?
(3)哪一位调查研究人员有可能得到这1100名少年儿童的最高者或最低者?或者对两位调查研究人员来说,这种机会是相同的?
解:(1)(2)两位调查人员所得到的平均身高和标准差应该差不多相同,因为均值和标准差的大小基本上不受样本大小的影响。
(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。
●13.一项关于大学生体重状况的研究发现,男生的平均体重为60公斤,标准差为5公斤;女生的平均体重为50公斤,标准差为5公斤。
请回答下面的问题:
(1)是男生的体重差异大还是女生的体重差异大?为什么?
(2)以磅为单位(1公斤=2.2磅),求体重的平均数和标准差。
(3)粗略地估计一下,男生中有百分之几的人体重在55公斤到65公斤之间?
(4)粗略地估计一下,女生中有百分之几的人体重在40公斤到60公斤之间?
解:(1)由于两组的平均体重不相等,应通过比较离散系数确定体重差异较大的组:
因为女生的离散系数为 V=
s x =550
=0.1 男生体重的离散系数为 V=
s x =560
=0.08 对比可知女生的体重差异较大。
(2) 男生:x =
602.2公斤公斤=27.27(磅),s =2.25公斤
公斤=2.27(磅);
女生:x =2.250公斤公斤=22.73(磅),s =2.25公斤
公斤
=2.27(磅);
(3)68%;
(4)95%。
● 14.对10名成年人和10名幼儿的身高(厘米)进行抽样调查,结果如下:
成年组 166 169 172 177 180 170 172 174 168 173 幼儿组 68 69 68 70 71 73 72 73 74 75
(1)要比较成年组和幼儿组的身高差异,你会采用什么样的指标测度值?为什么?
(2)比较分析哪一组的身高差异大? 解:(1)应采用离散系数,因为成年人和幼儿的身高处于不同的水平,采用标准差比较不合适。
离散系数消除了不同组数据水平高低的影响,采用离散系数就较为合理。
(2)利用Excel 进行计算,得成年组身高的平均数为172.1,标准差为4.202,从而得:
成年组身高的离散系数:024.01
.1722
.4==
s v ; 又得幼儿组身高的平均数为71.3,标准差为2.497,从而得:
幼儿组身高的离散系数: 2.497
0.03571.3
s v =
=; 由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。
15.一种产品需要人工组装,现有三种可供选择的组装方法。
为检验哪种方法更好,随机抽取15个工人,让他们分别用三种方法组装。
下面是15个工人分别用三种方法在相同的时间内组装的产品数量(单位:个):
方法A 方法B 方法C
164 129 125 167 130 126 168 129 126 165 130 127 170 131 126 165 130 128 164 129 127 168 127 126 164
128
127
162 128 127
163 127 125
166 128 126
167 128 116
166 125 126
165 132 125
(1)你准备采用什么方法来评价组装方法的优劣?
(2)如果让你选择一种方法,你会作出怎样的选择?试说明理由。
解:(1)下表给计算出这三种组装方法的一些主要描述统计量:
方法A的离散系数V A=
2.13
165.6
=0.0129,
方法B的离散系数V B=
1.75
128.73
=0.0136,
方法C的离散系数V C=
2.77
125.53
=0.0221;
对比可见,方法A的离散系数最低,说明方法A最优。
(2)我会选择方法A,因为方法A的平均产量最高而离散系数最低,说明方法A的产量高且稳定,有推广意义。
16.在金融证券领域,一项投资的的预期收益率的变化通常用该项投资的风险来衡量。
预期收益率的变化越小,投资风险越低,预期收益率的变化越大,投资风险就越高。
下面的两个直方图,分别反映了200种商业类股票和200种高科技类股票的收益率分布。
在股票市场上,高收益率往往伴随着高风险。
但投资于哪类股票,往往与投资者的类型有一定关系。
(1)你认为该用什么样的统计测度值来反映投资的风险?
(2)如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票?
(3)如果你进行股票投资,你会选择商业类股票还是高科技类股票?
-30 0 30 60 -30 0 30 60
收益率收益率
(a)商业类股票(b) 高科技类股票
解:(1)方差或标准差;(2)商业类股票;(3)(略)。
17.下图给出了2000年美国人口年龄的金字塔,其绘制方法及其数字说明与【例2.10】相同,试对该图反映的人口、政治、社会、经济状况进行分析。
第3章 概率与概率分布——练习题(全免)
1 .某技术小组有12人,他们的性别和职称如下,现要产生一名幸运者。
试求这位幸运者分别是以下几种可能的概率:(1)女性;(2)工程师;(3)女工程师,(4)女性或工程师。
并说明几个计算结果之间有何关系?
解:设A =女性,B =工程师,AB =女工程师,A+B =女性或工程师
(1)P(A)=4/12=1/3
(2)P(B)=4/12=1/3
(3)P(AB)=2/12=1/6
(4)P(A+B)=P(A)+P(B)-P(AB)=1/3+1/3-1/6=1/2
2. 某种零件加工必须依次经过三道工序,从已往大量的生产记录得知,第一、二、三道工序的次品率分别为0.2,0.1,0.1,并且每道工序是否产生次品与其它工序无关。
试求这种零件的次品率。
解:求这种零件的次品率,等于计算“任取一个零件为次品”(记为A )的概率()P A 。
考虑逆事件A =“任取一个零件为正品”,表示通过三道工序都合格。
据题意,有:
于是 ()1()10.6480.352P A P A =-=-=
3. 已知参加某项考试的全部人员合格的占80%,在合格人员中成绩优秀只占15%。
试求任一参考人员成绩优秀的概率。
解:设A 表示“合格”,B 表示“优秀”。
由于B =AB ,于是
)|()()(A B P A P B P ==0.8×0.15=0.12
4. 某项飞碟射击比赛规定一个碟靶有两次命中机会(即允许在第一次脱靶后进行第二次射击)。
某射击选手第一发命中的可能性是80%,第二发命中的可能性为50%。
求该选手两发都脱靶的概率。
解:设A =第1发命中。
B =命中碟靶。
求命中概率是一个全概率的计算问题。
再利用对立事件的概率即可求得脱靶的概率。
=0.8×1+0.2×0.5=0.9
脱靶的概率=1-0.9=0.1
或(解法二):P (脱靶)=P (第1次脱靶)×P(第2次脱靶)=0.2×0.5=0.1
5.已知某地区男子寿命超过55岁的概率为84%,超过70岁以上的概率为63%。
试求任一刚过55岁生日的男子将会活到70岁以上的概率为多少?
解: 设A =活到55岁,B =活到70岁。
所求概率为:
6.某企业决策人考虑是否采用一种新的生产管理流程。
据对同行的调查得知,采用新生产管理流程后产品优质率达95%的占四成,优质率维持在原来水平(即80%)的占六成。
该企业利用新的生产管理流程进行一次试验,所生产5件产品全部达到优质。
问该企业决策者会倾向于如何决策?
解:这是一个计算后验概率的问题。
设A =优质率达95%,A =优质率为80%,B =试验所生产的5件全部优质。
P(A)=0.4,P (A )=0.6,P (B|A )=0.955, P(B |A )=0.85,所求概率为:
决策者会倾向于采用新的生产管理流程。
7. 某公司从甲、乙、丙三个企业采购了同一种产品,采购数量分别占总采购量的25%、30%和45%。
这三个企业产品的次品率分别为4%、5%、3%。
如果从这些产品中随机抽出一件,试问:(1)抽出次品的概率是多少?(2)若发现抽出的产品是次品,问该产品来自丙厂的概率是多少?
解:令A 1、A 2、A 3分别代表从甲、乙、丙企业采购产品,B 表示次品。
由题意得:P (A 1)=0.25,P (A 2)=0.30, P (A 3)=0.45;P (B |A 1)=0.04,P (B |A 2)=0.05,P (B |A 3)=0.03;因此,所求概率分别为:
(1))|()()|()()|()()(332211A B P A P A B P A P A B P A P B P ++=
=0.25×0.04+0.30×0.05+0.45×0.03=0.0385
(2)3506.00385
.00135.00.030.450.050.300.040.2503.045.0)|(3==++=⨯⨯⨯⨯B A P 8.某人在每天上班途中要经过3个设有红绿灯的十字路口。
设每个路口遇到红灯的事件是相互独立的,且红灯持续24秒而绿灯持续36秒。
试求他途中遇到红灯的次数的概率分布及其期望值和方差、标准差。
解:据题意,在每个路口遇到红灯的概率是p =24/(24+36)=0.4。
设途中遇到红灯的次数=X ,因此,X ~B(3,0.4)。
其概率分布如下表:
9. 一家人寿保险公司某险种的投保人数有20000人,据测算被保险人一年中的死亡率为万分之5。
保险费每人50元。
若一年中死亡,则保险公司赔付保险金额50000元。
试求未来一年该保险公司将在该项保险中(这里不考虑保险公司的其它费用):
(1)至少获利50万元的概率;
(2)亏本的概率;
(3)支付保险金额的均值和标准差。
解:设被保险人死亡数=X ,X ~B (20000,0.0005)。
(1)收入=20000×50(元)=100万元。
要获利至少50万元,则赔付保险金额应该不超过50万元,等价于被保险人死亡数不超过10人。
所求概率为:P(X ≤10)=0.58304。
(2)当被保险人死亡数超过20人时,保险公司就要亏本。
所求概率为:
P(X >20)=1-P(X ≤20)=1-0.99842=0.00158
(3)支付保险金额的均值=50000×E (X )
=50000×20000×0.0005(元)=50(万元)
支付保险金额的标准差=50000×σ(X )
=50000×(20000×0.0005×0.9995)1/2=158074(元)
10.对上述练习题3.09的资料,试问:
(1)可否利用泊松分布来近似计算?
(2)可否利用正态分布来近似计算?
(3)假如投保人只有5000人,可利用哪种分布来近似计算?
解: (1)可以。
当n 很大而p 很小时,二项分布可以利用泊松分布来近似计算。
本例中,λ= np =20000×0.0005=10,即有X ~P (10)。
计算结果与二项分布所得结果几乎完全一致。
(2)也可以。
尽管p 很小,但由于n 非常大,np 和np(1-p)都大于5,二项分布也可以利用正态分布来近似计算。
本例中,np=20000×0.0005=10,np(1-p)=20000×0.0005×(1-0.0005)=9.995,
即有X ~N (10,9.995)。
相应的概率为:
P (X ≤10.5)=0.51995,P(X ≤20.5)=0.853262。
可见误差比较大(这是由于P 太小,二项分布偏斜太严重)。
【注】由于二项分布是离散型分布,而正态分布是连续性分布,所以,用正态分布来近似计算二项分布的概率时,通常在二项分布的变量值基础上加减0.5作为正态分布对应的区间点,这就是所谓的“连续性校正”。
(3)由于p =0.0005,假如n =5000,则np =2.5<5,二项分布呈明显的偏态,用正态分布来计算就会出现非常大的误差。
此时宜用泊松分布去近似。
11.某企业生产的某种电池寿命近似服从正态分布,且均值为200小时,标准差为30小时。
若规定寿命低于150小时为不合格品。
试求该企业生产的电池的:(1)合格率是多少?(2)电池寿命在200左右多大的范围内的概率不小于0.9。
解:(1))6667.1()30
200150()150(-<-<=<Z P Z P X P ==0.04779 合格率为1-0.04779=0.95221或95.221%。
(2) 设所求值为K ,满足电池寿命在200±K 小时范围内的概率不小于0.9,即有:
即:{}0.9530
K P Z <≥,K /30≥1.64485,故K ≥49.3456。
12.某商场某销售区域有6种商品。
假如每1小时内每种商品需要12分钟时间的咨询服务,而且每种商品是否需要咨询服务是相互独立的。
求:(1)在同一时刻需用咨询的商品种数的最可能值是多少?(2)若该销售区域仅配有2名服务员,则因服务员不足而不能提供咨询服务的概率是多少?
解:设X =同一时刻需用咨询服务的商品种数,由题意有X ~B(6,0.2)
(1)X 的最可能值为:X 0=[(n+1)p]=[7×0.2]=1 (取整数)
(2)∑=--
=≤-=>20668.02.01)2(1)2(k k k k C X P X P
=1-0.9011=0.0989 第4章 抽样与抽样分布——练习题(全免)
1. 一个具有64=n 个观察值的随机样本抽自于均值等于20、标准差等于16的总体。
⑴ 给出x 的抽样分布(重复抽样)的均值和标准差
⑵ 描述x 的抽样分布的形状。
你的回答依赖于样本容量吗?
⑶ 计算标准正态z 统计量对应于5.15=x 的值。
⑷ 计算标准正态z 统计量对应于23=x 的值。
解: 已知 n=64,为大样本,μ=20,σ=16,
⑴在重复抽样情况下,x 的抽样分布的均值为
a. 20, 2
b. 近似正态
c. -2.25
d. 1.50
2 . 参考练习4.1求概率。
⑴x <16; ⑵x >23; ⑶x >25; ⑷.x 落在16和22之间; ⑸x <14。
解: a. 0.0228 b. 0.0668 c. 0.0062 d. 0.8185 e. 0.0013
3. 一个具有100=n 个观察值的随机样本选自于30=μ、16=σ的总体。
试求下列概率的近似值:
解: a. 0.8944 b. 0.0228 c. 0.1292 d. 0.9699
4. 一个具有900=n 个观察值的随机样本选自于100=μ和10=σ的总体。
⑴ 你预计x 的最大值和最小值是什么?
⑵ 你认为x 至多偏离μ多么远?
⑶ 为了回答b 你必须要知道μ吗?请解释。
解:a. 101, 99 b. 1 c. 不必
5. 考虑一个包含x 的值等于0,1,2,…,97,98,99的总体。
假设x 的取值的可能性是相同的。
则运用计算机对下面的每一个n 值产生500个随机样本,并对于每一个样本计算x 。
对于每一个样本容量,构造x 的500个值的相对频率直方图。
当n 值增加时在直方图上会发生什么变化?存在什么相似性?这里30,10,5,2====n n n n 和50=n 。
解:趋向正态
6. 美国汽车联合会(AAA )是一个拥有90个俱乐部的非营利联盟,它对其成员提供旅行、
金融、保险以及与汽车相关的各项服务。
1999年5月,AAA 通过对会员调查得知一个4口之家出游中平均每日餐饮和住宿费用大约是213美元(《旅行新闻》Travel News ,1999年5月11日)。
假设这个花费的标准差是15美元,并且AAA 所报道的平均每日消费是总体均值。
又假设选取49个4口之家,并对其在1999年6月期间的旅行费用进。