统计学例题-统计整理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
按企业规模 分组
大型企业 中型企业 小型企业
按企业登记注册类型 分组
内资企业 外商投资企业 港澳台商投资企业
注:不属于复合分组 每一组只能固定一个因素,同时又掩盖了其他因
素对差异的影响。
第三章 统计数据的整理
14
平行排列与重叠排列
平行排列
重叠排列
技术人员
技术职称
企业 总 数 高称职称 中级职称 初级职称
认识统计总体:
3,调查某市的失业率,则调查对象是全市的:
A.就业人口, B.失业人口, C.总人口, D.经济活动人口(A+B)。
统计总体的同质性指:
A.总体各单位具有全部共同的品质标志或数量标志 B.总体各单位具有全部共同的品质标志属性或数量标
志值 C.总体各单位具有某一共同的品质标志属性或数量标
10/31/2019
23
1、将原始资料按其数值大小重新排列
36 82 89 90 93 96 97 99 100 104 106 107 107 108 108 109 112 112 113 114 105 115 117 119 121 121 123 125 125 129
10/31/2019
700~800,800~900 900~1000,……
10~49,50~99, 100~199,……
月工资水平 800~1000,1000~1500, (元/人) 1500~1800,1800~2000
第三章 统计数据的整理
16
例:
某小组10名学生某课程的考试成 绩如下(单位:分)
65,69,74,76,78,80,80, 84,88,89
志值 D.总体各单位具有某一共同的品质标志或数量标志。
简单现象总体
车间名称
一车间 二车间 合计
产量(万件)
2011 f0 9 6
2012 f1 14 12
15
26
4
复杂现象总体
产品
A 产品 B 产品 C 产品 合计
产量
单位
f
吨
900
千件
160
立方米
500
-
-
5
简单现象总体(与前比较)
产 品 单位
第三章 统计数据的整理
20
例 某企业电子元件耐用时数抽样资料
单位:小时
830 880 1 170 1 080 1 250 1 360 1 410 1170
810 1 130 1 080 1 010 1 270 1 250
1 230 1 050 1 270 1 230 1 140 1 050
1 100 1 100 1 420 1 260 1 190 1 250
比重(%)
40 60 100.00
8
多层总体
考试成绩 (分)
65~75 75~85 85~95
合计
学生数 (人)
30 50 20
100
比重 (%)
30 50 20
100.00
第三章 统计数据的整理
9
空间概念总体
2003年直辖市农民人均纯收入
直辖市
上海市 北京市 天津市
农民人均纯收入(元)
6 653.92 5 601.55 4 566.01
认识统计总体:
1,要了解某班50名学生的学习情况,则总体是: A.50名学生,B.50个学生的学习成绩, C.每一个学生,D.每一个学生的学习成绩。
2,若要了解10所高校教学设备的使用状况,则统 计研究的总体单位是: A.每一所高校, B.每一所高校的每一台设备, C.全部高校的全部设备, D.每一所高校的每一台教学设备。
第三章 统计数据的整理
17
表 学生按性别分组 (品质分布数列)
性别 学生数(人)
男生 女生 合计
各组名称
4 6
10
次数或 频数
比重(%)
40 60 100.00
频率
第三章 统计数据的整理
18
表 学生按考试成绩分组 (变量分布数列)
考试成绩 (分) 60~70 70~80 80~90 合计
各组变量值
-
-
29
例:单项式分组
育龄妇女生育子女存活数
按存活数分组(个)
0 1 2 3 4 5 合计
人数 f
7 24 35 20 10 4 100
2019/10/31
30
例:品质数列
按企业类型分组
国有企业 独资企业 合资企业 民营企业
合计
频数 f
24 35 20 10
89
2019/10/31
品质数列
31
例:组限的重叠(连续)排列
—
次数/频数
第三章 统计数据的整理
34
A 产品 B 产品 C 产品
合计
吨 千件 立方米
-
产值(万元)
3 000 1 850 2 800 7 650
6
单层总体:
某小组10名学生某课程的考试成 绩如下(单位:分)
65,69,74,76,78,80,80, 84,88,89
7
多层总体
性别
男生 女生 合计
学生数(人)
40 60 100
名称
男女
合 计
男
女
合 计
男
女
合 计
男
女
合 计
合计
第三章 统计数据的整理
15
例:组距式分组举例
分组形式 等距分组
异距分组
统计总体
某市所有 医院
某市所有 商业职工 某市所有 商业企业
某市所有 居民家庭
分组标志 (变量)
病床数 (张)
月工资水平 (元/人)
职工人数 (人)
各个组别 (各变量值组)
100~199,200~299 300~399,400~499
10
时间概念总体
某省国有企业科技人员统计表
年份
2001 2002 2003 2004
科技人员总数年 (人) 334 784 351 844 372 711 379 016
平均每万人中 科技人员(人)
108.4 112.1 116.8 117.1
11
随机数表
688 680 800 668 152 562 941 288 434 433 584 475 717 498 314 773 547 312 422 350 882 513 998 900 927 879 566 162 904 524 569 853 789 201 832 781 246 598 361 252 359 323 439 386 300 394 578 135 852 699 980 242 732 689 131 258
8 27 26.7 90.0
17 22 56.7 73.3
24 13 80.0 43.3
30
6 100.0 20.0
合计
30 100.00 -
-
--
第三章 统计数据的整理
28
累计频数和累计频率
注:当关注标 志值较小的各 组分布时,用 向上累计
按耐用时数 (x)
8 00~9 00 9 00~1 000 1 000~1 100 1 100~1 200 1 200~1 300 1 300~1 400 1 400~1 500 1 500以上
按营业额分组 (百万元)(x)
连锁店家 频率(比重) 数( fi ) ( fi / ∑ fi )
单位:小时
累计频数
累计频率
向上 向下 向上 向下
90以下 3 90~100 5 100~110 9 110~120 7 120~130 6
10.0 16.7 30.0 23.3 20.0
3
30 10.0 100.0
10/31/2019
26
4、确定组限
如果变量值相对集中,无特大或特小的极 端值时,则采用闭口式;
反之,如果有特大或特小的极端值时,则 采用开口式。
本例可设置下限开口组,最大组的上限可 取整数130
10/31/2019
27
5、编制变量数列
注:当关注标 志值较大的各 组分布时,用 向下累计
某班学生统计学考试成绩
按考试成绩分组 学生人数 f
60分以下
7
60~70
8
70~80
16
80~90
6
90分以上
3
合计
40
按上限不在内原则: 将70分归入此组
2019/10/31
32
例:组限的衔接(间断)排列
下限开口组 上限开口组
按学生年龄分组 学生人数 f
9岁以下
7
10~19岁
28
20~29岁
35
1 180 1 580 1 210 1 460 1 070 1 370 1 200 1 630 1 180 1 030 870 1 150 1 380 1 510 1 010 860 1 260 1 350 930 1 420 1 160 1 320 1 380 1 310
注:等距分8组,组距为100,以800为第一组下限。
30~39岁
20
40岁以上
10
合计
100
2019/10/31
33
频率密度(或次数密度)
考Байду номын сангаас成绩 (分)
40~60 60~80 80~90 90~100
合计
学生数 (人)
4 5 7 4
20
比重 (%)
20 25 35 20
100.00
频数 密度
0.20 0.25 0.70 0.40
—
频率 密度%
1.00 1.25 3.50 1.00
第三章 统计数据的整理
21
表 50个电子元件耐用时数资料表
按耐用时数分组 (x)
800~900 900~1 000 1 000~1 100 1 100~1 200 1 200~1 300 1 300~1 400 1 400~1 500 1 500以上
频数或次数 ( fi )
5 1 8 11 11 7 4 3
合计
单位:小时
频数或次数 频率
( fi ) ( fi / ∑ fi )
5
0.10
1
0.02
8
0.16
11
0.22
11
0.22
7
0.14
4
0.08
3
0.06
累计 频数
5 6 14 25 36 43 47 50
累计 频率
0.10 0.12 0.28 0.50 0.72 0.86 0.94 1.00
50
1.00
24
2、确定全距
确定全距前,要检查数据组两端有没 有极端值。
计算全距前应去掉极端值。本例有极 端值36。
全距 = 129‐82 = 47
10/31/2019
25
3、确定组距和组数
组距= 全距/组数 组距应采用整数,最好是5或10的整
倍数 组距 = 47/5 = 9.4,调整为10
单位:小时
频率 ( fi / ∑ fi )
0.10 0.02 0.16 0.22 0.22 0.14 0.08 0.06
合计
50
1.00
第三章 统计数据的整理
22
例
某公司下属30家连锁店的营业额如下,试编制分 布数列(单位:百万元)。 89 129 125 107 112 121 97 36 100 108 114 106 117 90 108 104 109 112 93 113 105 107 115 121 119 96 123 99 82 125
第三章 统计数据的整理
12
随机数表的应用
可以从表中的任意一个位置开始,方 向也可自由选择。
如:350882513998900927…… 对应的(两位数)学号为:35,50,
08,25,51, 13, 39,09, 27,……
10/31/2019
13
例 简单分组的平行排列
按经济成分 分组
公有经济 非公有经济
学生数 (人)
2 3 5 10
次数/频数
比重 (%)
20 30 50 100.00
频率
第三章 统计数据的整理
19
表 学生按考试成绩分组 (变量分布数列)
考试成绩 (分)
65~75 75~85 85~95
合计
学生数 (人)
3 5 2
10
比重 (%)
30 50 20
100.00
思考:表3与表4哪个组距数列较真实地反映总体内各 单位的实际分布特征?