统计学第一章作业

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

451
3.77%
东方 之子
181
2875
6.30%
90.89% 本田
16
451
3.55%
55.65% 70.73% 77.38% 84.04% 89.14%
92.90%
96.45%
长安 奥拓
145
2875
5.04%
95.93%
雷克 萨斯
10
451
2.22% 98.67%
爱丽 舍
117
2875
4.07% 100.00% 奥迪
(1)
(2)从上面的图标可以看出,甲班同学的考试成绩主要分布在中,乙 班同学的考试成绩主要分布在良。甲班的不及格人数比乙班的不及格人 数多。 (3)
从上图可知,甲乙两班考试成绩的分布不相似。
4. 随机抽取25个网络用户,得到他们的年龄数据(单位:周岁)如 下:
15 16 17 18 19 19 19 20 20 21 22 22 网民年龄
国产车销售排行 前10名
销售量
进口车销售排行 前10名
销售量
福美来
556
丰田
149
夏利
541
现代
102
捷达
370
日产
68
松花江
298
奔驰
30
富康
277
宝马
30
哈飞路宝
200
大众汽车
23
高尔夫
190
克莱斯勒
17
东方之子
181
本田
16
长安奥拓
145
雷克萨斯
10
爱丽舍
117
奥迪
6
(1) 画出国产汽车和进口汽车销售量的对比条形图和环形图。 (2) 分别画出国产汽车和进口汽车销售量的帕累托图。 (1)
(2)比较分析哪一组的身高差异大? (1)离散系数,因为它消除了不同组数据水平高低的影响。 (2))利用离散系数的公式,得成年组身高的离散系数:0.024 幼儿组 身高的离散系数:0.035。由于幼儿组身高的离散系数大于成年组身高 的离散系数,说明幼儿组身高的离散程度相对较大。
排队时间 5.5 6.6 6.7 6.8 7.1 7.3 7.4 7.8 7.8
(1) 计算第二种排队方式等待时间的平均数和标准差(平均数是 7,标准差是0.71)。 (2) 比较两种排队方式等待时间的离散程度(因为两种排队方式的 平均数不同,所以用离散系数进行比较,利用离散系数的计算公式,得 第一种排队方式的离散系数0.274,第二种排队方式的离散系数是 0.102,所以第一种排队方式等待时间的离散程度大于第二种排队方 式)。
布呈现右偏分布,即年龄较小的网民占绝大多数,峰态系数大于0,说 明网民的年龄分布为尖峰分布,表明年龄较小的网民占较大比重。)
5. 某银行为缩短顾客到银行办理业务等待的时间,准备采用两种排队方 式进行试验:一种是所有顾客都进入一个等待队列;另一种是顾客在三 个业务窗口处列队三排等待。为比较哪种排队方式使顾客等待的时间更 短,两种排队方式各随机抽取的9名顾客,得到第一中排队方式的平均 等待时间为7.2分钟,标准差为,1.97分钟,第二种排队方式的等待时间 (单位:min)如下:
7 0.396 0.329 0.399 0.334 0.173 0.218 0.136 0.034
由原材料供应商的箱线图可知,原材料供应商的数据比较集中,差 距不大,但从工人的箱线图看出,工人的数据起伏波动较大,尤其是工 人2的数据,跟其他工人的数据相比有很大的差异,因此原材料供应商 对加工零部件误差的影响要小于工人对加工零部件的影响。
(1)计算120家企业利润额的均值和标准差; (2)计算分布的偏态系数和峰态系数; (3) 画直方图,阶段企业利润的分布特性。
(1)利用加权均值的公式(ppt77),得均值为427,利用总体组距分组差公
式,得标准差为116。
(2)利用偏态系数公式,得偏态系数为1.34,利用峰度系数公式 得,峰度系数为2.29
(3)
由上图可知,企业的利润大多分布在400-500,偏态系数大于0,说 明企业的利润分布呈现右偏分布,即利润达不到600以上的企业占绝大 多数,峰态系数大于0,说明企业的利润分布为尖峰分布,表明利润较 小的企业占较大比重
7. 2005年4月北京亚运村市场汽车交易市场的汽车销售数据(单位: 辆)如下:
松花 298 2875 10.37% 61.39% 奔驰 30 451 6.65% 江
富康 277 2875 9.63% 71.03% 宝马 30 451 6.65%
哈飞 路宝
200
2875
6.96%
77.98%
大众 汽车
23
451
5.10%
高尔 夫
190
2875
6.61%
84.59%
克莱 斯勒
17
第一章 描述性统计
1. 某生产车间50名工人日加工零件数如下(单位:个)。试在minitabe 下画直方图,并分析数据特征。
117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 118 108 110 118 123 126 133 134 127 123 118 112 112 134 127 123 119 113 120 123 127 135 137 114 120 128 124 115 139 128 124 121
3. 甲乙两个班各有40名学生,期末统计学考试成绩的分布如下:
考试成 绩
优 良 中 及格 不及格
人数
甲班 乙班
3
6
6
15
18
9
9
8
4
2
(1)根据上面的数据,在Excel中画出两个班考试成绩的复合柱形图、 环形图和图饼图。
(2)比较两个班考试成绩分布的特点。 (3)在Excel中画出雷达图,比较两个班考试成绩的分布是否相似。
(3) 如果让你选择一种排队方式,你会选择哪一种?试说 明理由(选择第二种,因为平均等待时间短,而且离散 程度小)。
6. 在某地区抽取的120家企业按利润额进行分组,结果如下
按利润额分组 200—300 300—400 400—500 500—600 600以上 合计
企业数 19 30 42 18 11 120
原材料 供应商 1
甲 0.379 甲 0.400 乙 0.267 乙 0.098 丙 0.266 丙 0.299 丁 0.122 丁 0.248
2 0.331 0.305 0.325 0.617 0.451 0.546 0.342 0.258
员工编号
3
4
5
0.259 0.233 0.223
0.277 0.231 0.434
(2)首先计算出各车的累计频率。然后制图。
频数
累计频率
频数
福美
累计频 率
来 556 2875 19.34% 19.34% 丰田 149 451 33.04% 33.04%
夏利 541 2875 18.82% 38.16% 现代 102 451 22.62%
捷达 370 2875 12.87% 51.03% 日产 68 451 15.08%
23 23 23 24 24 25 27 29 30 31 34 38
(1) 计算众数、中位数。(exlce数据分析:众数19,中位数22.5) (2) 根据定义公式计算四分位数(上四分位数的位置为 3(24+1)/4=18.75,所以上四分位数是26.5,下四分位数的位置是 (24+1)/4=6.25,所以下四分位数是19)。 (3) 计算平均数和标准差(平均数是23.29,标准差是5.75)。 (4) 计算偏态系数和峰态系数(偏态系数是0.93,峰度系数是 0.59)。 (5) 对网民年龄的分布特征进行综合分析。(根据以上的分析得 出,网民的年龄主要集中在19岁,偏态系数大于0,说明网民的年龄分
1.给数据排序2.拿数据最大值减最小值,确定组数 3.由于组距一般为5或 10,因此确定组距为5 4.计算频数 5.绘制直方图,再编辑横轴和纵轴的 区间。 数据特征:大多数人的日加工零件数在120到125之间。
2. 为了了解车间加工零件误差与原材料供应商以及工人的关系,收集如 下数据,试画多元箱线图展示该数据并进行分析
6
451
1.33% 100.00%
8. 对10名成年人和10名幼儿的身高(单位:cm)进行抽样调查,结果 如下:
成年组 166 169 172 177 180 170 172 174 168 173 幼儿组 68 69 68 70 71 73 72 73 74 75
(1)要比较成年组和幼儿组的身高差异,你会采用什么样的指标测 度值?为什么?
0.299 0.372 0.157
0.236 0.219 0.305
0.304 0.423 0.274
0.392 0.434 0.312
0.176 0.242 0.427
0.269 0.172 0.303
6 0.289 0.475 0.257 0.212 0.299 0.318 0.265 0Hale Waihona Puke Baidu390
相关文档
最新文档