《统计学》_第三章_统计整理
统计学原理-统计整理
统计整理的意义
统计调查所搜集的反映个体量的原始资料是分散 的,不是集中的;是零碎的,不是系统的。根据这 些资料。人们难以从总体上分析和认识现象的数量 表现。
至于某些已经加工的综合资料,则往往由于资料在 分组方法、总体范围或指标涵义、口径、计算方法 等方面不同,而不能满足统计分析的要求,也必须 先通过统计整理,才能据以从总体上分析社会经济 现象的数量表现,
一、统计分组的意义和作用
统计分组的作用
⒈区分社会经济现象的类型-类型分组 ⒉研究现象的内部结构-结构分组 ⒊分析现象之间的依存关系-分析分组
某地区2008年底各类工业企业数 按所有制性质分组 企业数(个) 比重(%) 全民所有制企业 集体所有制企业 3204 1286 64.08 25.72
私营企业 中外合资企业 外商独资企业
二、统计分组的要求和方法
统计分组的方法
2、按品质标志和数量标志分组
经调查 ,某地年末货币流通量为 15.3亿元,比上年增加 4.5亿元。
按地区分组 甲县 乙县 丙县 丁县 合计 上期 36000 24000 28000 20000 108000 本期 52000 34000 41000 26000 153000 增减% 44.4 41.7 46.7 30.0 41.7
第三节 变量数列
一、变量数列的概念 分 类
品质标志数列
数量标志数列
连续型变量数列
离散型变量数列 单项数列 组距数列 等距数列 异距数列
按品质标志分组—品质数列,一般是单项式分组
某班学生的性别构成情况 按性别分组 男 女 合计 绝对数人数 30 10 40 比重(%) 75 25 100
某厂第二季度工人平均日产量 工人数 绝对数 比重(%) 10 15 30 40 20 115 8.7 13.0 26.1 34.8 17.4 100
统计学 第3章 统计数据的整理
统计分组的标志
第三章 统计数据的整理
统计分组的标志:分组标志就是将总体分为各个性质不同的标准或根据。
根
据分组标志的特征不同,总体可按属性标志分组,也可按数量标志分组。
1.按属性标志分组
以属性标志作为分组标志,并在属性标志的变异范围内划分各组界限,将总体 分为若干组。属性标志划分,概念明确,容易确定分组组数,如性别。
2.按数量标志分组
以数量标志作为分组标志,并在数量标志的变异范围内划分各组界限,将总体 分为若干组。如工资。
第三章 统计数据的整理
(五)简单分组和复合分组
在统计分组时,根据统计研究目的不同,分组标志的选择可以是一个标志,也可以是 两个或两个以上的标志,这样就有简单分组和复合分组之分:
1.简单分组 对总体只按一个标志分组称为简单分组。
第三章 统计数据的整理
数量次数分布的编制方法
在组距次数分布中,各组组距相同的次数分布称为等距次数分 布(表3-8)。各组组距不同的次数分布称为异距次数分布。
等距次数分布一般在现象性质差异变动比较均衡的条件下使用。
优点:
• 易于掌握次数分布的特性。
• 各组次数可以直接比较。
组数= 全距/组距
组距=全距/组数
100.00
提问:这是单 项次数分布还 是组距次数分 布?
第三章 统计数据的整理
数量次数分布的编制方法
例:对某工厂某月50名工人装配零件(件)情况进行调查, 得到下列初级资料:
106 81 98 111 91 107 86 105 93 106 82 108 114 122 109 104 125 103 113 102 106 84 128 104 91 112 85 96 115 89 97 105 92 111 107 97 105 124 106 86 96 110 112 103 108 110 109 125 101 119
《统计学基础》第三章
U形分布特点:与Q钟形相 反,靠近中间的变量值分布次 数较少,靠近两端的变量值分 布的次数较多,开成“两头大、 中间小”的U字形分布。
如:人口总体中幼儿和老年死
亡人数较多,而中年死亡人数最少。
研究对象4个特点
三、次数分布的主要类型(3种)
(三)J形分布
正J形分布:次数随着变量 值的增大而增多,如投资按利 润率大小分布。
V
13-17
18-25
第四节 基本概念
V
180以上
25以上
四、统计分组的种类
(三)平行分组体系与复合分组体系 2、复合分组体系——由复合组结果所形成的分组体系。 例如:认识我国高等学校在校学生的基本情况: (1)理科组 研究生 男 女 男 女 (2)文科组 研究生
本科
男 男
本科 女
女
专科 男
第四节 基本概念
六、分配数列的编制方法
(四)确定组限 组限——组距两端的分界限。 1、根据变量的性质确定:
重叠组限
(连续型变量) 月收入分组 (元) 3000以下 4000-6000 6000以上 合计 人数 20 15 10 35
不重叠组限
(离散型变量) 按班级人数分组 (人) 19以下 20-29 30-39 40以上 班级数 1 6 19 4
第二节
统计分组与分配数列
一、统计分组的概念
统计分组同时具有两方面的含义: 对总体而言是“分”:将总体区分为性质相异的若
干部分;
对个体而言是“合”:将性质相同的个体组合起来。 分组基本原则:必须保持各组内资料的“同质性”
和组与组之间资料的“差异性”。
第三节
二、统计分组的作用
(一)划分现象类型
专门调查
统计学第3章统计整理
14
7.0 21 10.5 193 96.5
4 90 —100 31 15.5 52 26.0 179 89.5 5 100—110 65 32.5 117 58.5 148 74.0
6 110—120 52 26.0 169 84.5 83 41.5
7 120—130 8 130—140
23 11.5 192 96.0 31 15.5
一、分配数列的概念和种类
1.概念
统计总体按照某一标志分组以后, 用以反映总体各单位分配情况的统计 数列,称分配数列,又可称次数分配, 或次数分布。
它由两部分组成: 总体所分的各个组和各组所拥有的 单位数(次数或频数)。
例
月工资分组(元) 工人数(人) 占总数比重(%)
1000 以下
210
39.6
1000-1500
组距式 分组
以变量值变动的一个区间作为一组,区间的 距离称为组距。适用于连续型变量和离散型 变量的变量值较多的情况。
第三章 统计整理
在进行组距分组时,会涉及到一 些问题,包括:等距分组和不等距分 组、组限、组中值。
第三章 统计整理
等距 分组
不等距 分组
各组组距均相等。如: 10—20 20—30 30—40
组中值 = (上限值+下限值)÷2
开口组组中值的计算: 缺下限:组中值=本组上限— 相邻组组距/2
缺上限:组中值=本组下限+ 相邻组组距/2
例
产值(万元)
第一组组中值:
50以下 50 — 60 60 — 70 70以上
50-(10÷2)= 45 最后一组组中值: 70+(10÷2)= 75
第二节 分配数列
较合适是? (c)
《统计学概论》第三章 统计整理
70 ~ 80
80 ~ 90
90 ~ 100
合
计
学生人数
(人)
5 15 18 10
2 50
由表3-1可见,整理后的学生考 STAT 分资料,较整理前的考分资料明 显要条理、系统。由上表可见, 在学生总体中,60分以下和90分 以上的学生人数都较少,绝大多 数学生的考分分布在60—90分之 间。
所以,统计整理是统计调查的继续,是统计分析的前提, 它实现了从个别单位的标志表现(标志值)向总体综合指标 的过渡,在统计研究中起着承前启后重要的作用。
编制步骤:
⒈求变异全距 R X max X min 139 107 32(百万元)
⒉确定组距及组数 R≤组距(d) ×组数(m)
确定组距的原则:
要能区分各组的性质差异 要能反映总体资料的分布特征 为方便计算,尽可能为5或10的整数倍
编少)
要求编制组距数列。
STAT
• 排序结果为
• 107 108 108 110 112 112 113 114 115 117 117 117 118 118 118 119 120 120 121 122 122 122 122 123 123 123 123 124 124 124 125 125 126 126 127 127 127 128 128 129 130 131 133 133 134 134 135 137 139 139
合计
频数(人) 3 5 8 14 10 6 4
50
频率(%) 6 10 16 28 20 12 8
100
统计分组方法
选择反映事物属性差异的标
按品质标志分组 志作为分组标志,如性别、
所有制类型
统计学(第三章)
四、统计分组方法 统计分组的关键在于选择分组标志和 划分各组界限。划分各组界限,就是要在 分组标志的变异范围内,划定各相邻组之 间的性质界限和数量界限。 (一)按品质标志分组的方法 选择反映事物属性差异的标志作为分 组标志,界限比较明确,类型比较稳定。 如,企业按所有制分组、人口按性别分组 等。
(二)按数量标志分组的方法 数量标志有离散型和连续型之分,其分 组的方法和形式也不同。 1、按离散型变量标志分组其形式有2个 (单项式分组和组距式分组); 2、按连续型变量标志分组其形式只有一 个(组距式分组)。
某班级学生按性别分组 学生按性别分组 男 女 合 计 人数(人) 60 40 100
2、按数量标志分组。按数量标志分组 就是选择反映事物数量差异的数量标志作 为分组标志,并在数量标志的变异范围内 划定各组界限,将总体划分为性质不同的 若干组成部分。 3、根据分组选择标志的多少不同,统 计分组又可分为简单分组和复合分组。 简单分组。简单分组是指对统计总体 仅按一个标志进行分组。
二、统计整理的步骤 1.设计统计整理方案 2.对原始资料进行审核 3.对原始资料进行分组和汇总 4.编制统计表或绘制统计图 综上所述,设计整理方案、对原始资 料进行审核是整理的前提,统计分组是统 计整理的基础,统计汇总是统计整理的中 心环节,编制统计表或绘制统计图是统计 整理的结果。
1.2、统计分组 一、统计分组的意义 统计分组既是统计认识问题的一种基 本方法,又是统计整理工作的具体内容之 一,因此它在整个统计工作过程中具有十 分重要的作用。
4、次数分配的类型
对称分布
右偏分布
左偏分布
正J型分布
反J型分布
几种常见的频数分布
U型分布
1、钟形分布 钟形分布的特征是“中间多,两边少”,这类 分布是以平均值为中心的,越接近中心,分配的次 数越多,离中心越远,分配的次数越少,其曲线就 像一口古钟。
第三章统计整理
20.27%
68.70% 11.03%
16.60%
70.14% 13.26%
工厂按产量分组
Â Ý Ô · 1 2 3 4 5 6 Ï Æ º ¼
ú ¿ ¨Ô ² Á £ ª þ © ¼ £ x
2 3 4 3 4 5 21
¥ » É ± µ Î ³ ¾ ¨Ô £ y £ ª © 73 72 71 73 69 68 426
•向下累计是将各组频数和频率由变量值大的组 向变量值小的组累计(是各组下限以上的累计频 数或累计频率)
向下累计 生活费 250 275 300 325 350 375 合计 频数 10 8 12 9 5 6 50 累计频数 50 40 32 20 11 6 累计频率 100% 80% 64% 40% 22% 12%
2. 统计表的内容构成:主词部分和宾词部分。
注:统计表的构成和内容构成见表3-2
总标题
表3-2
按考试成绩分组 (分)
某班统计学原理考试成绩分布表
频数 组中值 学生数 (人) 比重 (%) 向上累计 学生数 (人) 比重 (%) 向下累计 学生数 (人) 比重 (%)
纵 栏 标 题
90以上 80-90 横 行 标 题 70-80 60-70 60以下 合计
大型企业 中型企业 小型企业 大型企业 中型企业 小型企业 重工业
轻工业
按分组标志的性质分
学生按性别分组
男 女
学生按民族分组
学生按考试成绩分组
90分以上 80-90 70-80 60-70 60 分以下 19岁及以下 20岁 21岁 22岁 23岁 24岁及以上
汉族 回族 苗族 土家族 羌族 壮族 . . .
统计学原理第三章(统计资料整理)习题答案解析
第三章统计资料整理一.判断题部分1:对统计资料进行分组的目的就是为了区分各组单位之间质的不同。
(×)2:统计分组的关键问题是确定组距和组数。
(×)3:组中值是根据各组上限和下限计算的平均值,所以它代表了每一组的平均分配次数。
(×)3:分配数列的实质是把总体单位总量按照总体所分的组进行分配。
(∨)4:次数分配数列中的次数,也称为频数。
频数的大小反映了它所对应的标志值在总体中所起的作用程度。
(∨)5:某企业职工按文化程度分组形成的分配数列是一个单项式分配数列。
(×)6:连续型变量和离散型变量在进行组距式分组时,均可采用相邻组组距重叠的方法确定组限。
(∨)7:对资料进行组距式分组,是假定变量值在各组内部的分布是均匀的,所以这种分组会使资料的真实性受到损害。
(∨)8:任何一个分布都必须满足:各组的频率大于零,各组的频数总和等于1 或100%。
(×)9:按数量标志分组形成的分配数列和按品质标志分组形成的分配数列,都可称为次数分布。
( ∨ )10:按数量标志分组的目的,就是要区分各组在数量上的差异。
(×)11:统计分组以后,掩盖了各组内部各单位的差异,而突出了各组之间单位的差异。
(∨)12:分组以后,各组的频数越大,则组的标志值对于全体标志水平所起的作用也越大;而各组的频率越大,则组的标志值对全体标志水平所起的作用越小。
(×)二.单项选择题部分1:统计整理的关键在( B )。
A、对调查资料进行审核B、对调查资料进行统计分组C、对调查资料进行汇总D、编制统计表2:在组距分组时,对于连续型变量,相邻两组的组限( A )。
A、必须是重叠的B、必须是间断的C、可以是重叠的,也可以是间断的D、必须取整数3:下列分组中属于按品质标志分组的是( B )。
A、学生按考试分数分组B、产品按品种分组C、企业按计划完成程度分组D、家庭按年收入分组4:有一个学生考试成绩为70分,在统计分组中,这个变量值应归入( B )。
统计学c第三章统计整理
合计
经济、管理类 基础课程
统计学
第三节 分布数列—变量数列
第五、绘制频数直方图和折线图
我一眼就看出 来了,大多数 人的日加工零 件数在120~ 125之间!
直方图下的面 积之和等于1
频 15
数
12
(人) 9
6 3 105 110 115 120 125 130 135 140 日加工零件数(个) 某车间工人日加工零件数的直方图
统计学
第三节 分布数列—变量数列
第四步,编制变量数列 某车间50名工人日加工零件数分组表 按零件数分组(件)
105~110 110~115 115~120 120~125 125~130 130~135 135~140
频数(人)
3 5 8 14 10 6 4 50
频率(%)
6 10 16 28 20 12 8 100
目前我国有的地方性别比为120:100,这是不正常的现象
2.划分现象的类型:如我国经济成份划分为国有经济
和非国有经济,工业化分为轻、重工业。
经济、管理类 基础课程
统计学
第二节 统计分组
3 揭示现象的内部结构:如我国人员结构、产业结构。 新交通法中,正确处理机动车司机和过路行人之间的关系 体现以人为本的理念.
经济、管理类 基础课程
统计学
第三节 分布数列—变量数列
(1)组距数列的几个常用概念
A. 组限:各组的界限,有上限和下限之分。
B. 组距:上限与下限之差 。 C. 组中值:上、下限之和的半数,即:
D. 次数密度:单位组距分配的次数。即:
经济、管理类 基础课程
统计学
第三节 分布数列—变量数列
E. 开口组与开口数列:第一组无下限或最后一组无 上 限的组称开口组。含开口组的数列称开口数列。 注意:a. 开口组的组距按相邻组的组距推算; b. 分组时正好等于组限的数应按“归下限原则”处 理。 缺上限的组中值= 下限+相临组组距的一半 缺下限的组中值= 上限—相临组组距的一半
统计学第三章 统计数据的整理
汇总技术:
有传统手工汇总和现代电子计算机汇总两种技术。
(1)手工汇总。常用的汇总方式有四种: • 划记法。划“正”字符号计数,多用于对总体单位数或次数的简单汇总。
• 过录法。将原始资料分类过录到事先设计的汇总简表中,可用于对内容项 目较多的资料的汇总。
• 折叠法。将每张调查表中需要汇总的同类项目及数据折压一个印记,一张 一张的重叠在一起,再进行汇总。这种方法一次只能选择一个项目及其数 据进行汇总,故适用于数据较少的资料。
• 卡片法。将需要汇总的项目数据分类登记在卡片上,再汇总计算。这种方 法适用于总体单位数多、且多采用复合分组形式的事物,特别是设备、器 材类的实物资产的汇总。
(2)电子计算机汇总。其数据处理程序如下: • 第一步,编程。使用计算机语言编写出一套完整的数据处理程序。
• 第二步,数据录入。计算机自动按程序进行数据处理,并将数据处理结果 存储在磁盘、磁带等磁介质中。
树茎
数叶
数据 个数
10 7 8 8
3
11 0 2 2 3 4 5 7 7 7 8 8 8 9
13
向上累 计个数
3
16
12 0 0 1 2 2 2 2 3 3 3 3 4 4 4 5 5 6 6 7 7 7 8 8 9
24
40
13 0 1 3 3 4 4 5 7 9 9
10
50
14 0 0 1 3
16284
22.3
第三产业
20228
27.7
合计
73025
100.0
3、变量数列的编制
成绩 (分)
某班学生《统计学》考试成绩分布表
学生人数 频率 (人) (%)
向上累计
人
统计学原理与实务第三章统计整理
平均指标与变异指标
总结词
平均指标是用来反映社会经济现象总体的一 般水平或集中趋势的指标。
详细描述
平均指标通常用平均数表示,如人均收入、平 均工资等,用于描述总体的一般水平。
平均指标的分类
数值平均数和位置平均数,如算术平均数、调和 平均数、几何平均数等。
变异指标
变异指标是用来反映总体各单位之间数量差异程度 的指标。
直接计数法、测量法、推算法等。
相对指标
总结词
相对指标是用来反映社会经济 现象之间数量对比关系的指标 。
相对指标的分类
结构相对数、比例相对数、比 较相对数、强度相对数等。
详细描述
相对指标通常用相对数或比例表示 ,如人口密度、劳动生产率等,用 于揭示事物之间的数量关系。
相对指标的计算方法
直接计算法、对比法、平均法 等。
通过调查、观测、实验等方式直 接获取原始数据。
间接来源
通过文献资料、政府部门或统计机 构等途径获取已整理过的数据。
现代技术
利用互联网、大Biblioteka 据等技术手段进 行数据收集。数据预处理与筛选
01
02
03
04
缺失值处理
根据实际情况对缺失数据进行 填充或删除。
异常值处理
识别并处理异常值,如使用Z 分数法或IQR法。
详细描述
变异指标通常用变异系数或标准差表示,用于揭 示总体各单位之间的数量差异程度。
变异指标的分类
绝对变异指标和相对变异指标,如标准差系数、离差系 数等。
05
统计整理的应用实例
人口普查数据的整理
总结词
系统化、标准化
详细描述
人口普查数据涉及大量个体数据,需要进行系统化、标准化的整理,以便进行 后续的数据分析。具体包括数据清洗、分类、编码等步骤,确保数据质量可靠、 准确。
统计学-第三章 统计数据整理
2020/1/10
(三)分组标志的选择(关键)
(1)分组标志:进行统计分组的标准或根据。 (2)遵循的原则(三个):
(a)符合统计研究的目的和要求; (b)必须选择最主要的、能反映总体本质特征的标志作为分组依据; (c)要考虑到社会经济现象所处的具体历史条件。
(四)统计分组的种类(两大类,五小类)
2020/1/10
引例 如何整理和显示数据?
为确定一批灯泡的使用寿命(单位:小时),质检人员在 该批灯泡中随机抽取100只进行测试,所得数据如下表3-1:
表3-1 100只灯泡使用寿命表 700 716 728 719 685 709 691 684 705 718 706 715 712 722 691 708 690 692 707 701 708 729 694 681 695 685 706 661 735 665 668 710 693 697 674 658 698 666 696 698 706 692 691 747 699 682 698 700 710 722 694 690 736 689 696 651 673 749 708 727 688 689 683 685 702 741 698 713 676 702 701 671 718 707 683 717 733 712 683 692 693 697 664 681 721 720 677 679 695 691 713 699 725 726 704 729 703 696 717 688
2020/1/10
第三节 频数分布(重点)
(一)分布数列的意义
2.分布数列的两要素(名称和频数)
(1)组的名称:按一定标志划分出来的各个组。按 数量标志分组表现为各组的变量值(标志值),常 用x表示。 (2)各组次数(频数):落在各组中的总体单位个 数,绝对数。常用f表示。频率:各组频数f占总体 单位总数的比重,频数的相对数形式。反映总体的 构成,常用f/f表示。(频率分析)
第三章统计整理
统计整理
第一节 统计整理的意义和步骤
第二节 统计分组
第三节 分配数列 第四节 统计表和统计图
本章的教学目的、要求及内容
一般了解统计整理的概念和内容、统计分组、分配 数列及统计表等概念和内容。
重点与难点:重点掌握统计分组的方法,在分组的 基础上进行次数分配数列的编制,并学会用统计表 来表示统计资料。
预处理
分组汇总
编制表图
数据的预处理
数据的预处理,主要包括三个方面: 1. 数据的审核 2. 数据的筛选 3. 数据的排序
统计数据资料整理的内容
统计整理的步骤:
(1)拟定统计整理方案 (2)审查原始资料 (3)对各项原始资料分组、汇总,计算总体总量指标 (4)将汇总的结果,以统计表或统计图的形式表现出 来 (5)将统计资料进行系统积累
统计分组的作用 3、揭示现象的内部结构
现象的内部结构是表明现象本质特点的一个重要方面,将同 一总体不同时期的结构联系起来,还可以看到现象的发展趋 势和规律。 “九五”期间我国国内生产总值构成(%)
年
份
1996
20.4
1997 1998
19.1 18.6
1999
17.6
2000
15.9
第一产业
第二产业
分配数列表
频数
分布数列的种类
分布数列以分组标志特征不同可以 分为: 品质数列
Байду номын сангаас
变量数列
品质数列
品质数列:按品质标志分配而形成的数列叫属性 分配数列,简称品质数列。用来观察总体单位中 不同属性的单位分布情况。
例 某班学生的性别构成情况
按性别分 组 男 女 合计
绝对数人 比重(%) 数 30 75 10 40 25 100
统计学课件 第三章 统计整理
2013-7-26
人数(人) 男 1 4 9 7 2 23 女 1 6 9 5 1 22 合计 2 10 18 12 3 45
9
(四)编表(或绘图)
编表是把汇总的资料按一定的规则在表格 上表现出来。
成绩 50~60 60~70 70~80 80~90 90以上 合计 人数 (人) 2 7 11 8 2 30
(一)数据的预处理
包括数据的审核 、筛选、 排序等. 数据的审核:
1. 数据的审核
检查数据中的错误
2. 数据的筛选
找出符合条件的数据
3. 数据排序
升序和降序 寻找数据的基本特征
2013-7-26 7
(二)统计分组
• 分组是根据研究任务的要 求,对调查所得的原始资 料,确定要进行哪些分组 或分类。 • 如右表是对统计学考试成 绩进行分组。
2013-7-26 4
二、统计整理的意义
统计工作
统计调查
统计整理
统计分析
作用:是统计调查的继续,是统计分 析的前提和基础,在整个统计工作中 发挥着承上启下的作用。
2013-7-26 5
三、统计整理的步骤
1.数据的预处理
2.统计分组
3.编制分配数列
4.汇总统计资料
5.制作统计表或统计图
2013-7-26 6
组别
2013-7-26
øÔýËý ½¶ÊÈÊ 30 10 40
次数
È × (%) ±Ö 75 25 100
频率
28
变量数列
±3-6 Ä ³ Ú ¶ » ¶ ¸ Ë Æ ½ È ² Á í ³ §µ þ ½ È ¤È ¼ ù Õ ú ¾ ¤È ¼ ù Õ ú Á þ ¸ Ë Æ ½ È ² ¾ (» ) ¸ Ë Ê ¤È ý ø Ô ý ½ ¶ Ê È × ±Ö (%) 2 10 8.7 3 15 13.0 4 30 26.1 5 40 34.8 6 20 17.4 Ï Æ ¹ » 115 100.0
第三章 统计整理
1.分组标志的选择原则 (1)应根据研究的目的与任务选择分组标志。 例如,同一个工人总体,有多种不同分组方法: ①如果研究学历对收入的影响时,应选择“文 化程度”作为分组标志。 ②如果研究资历对收入的影响时,则应选择 “工龄”作为分组标志。
(2)要选择能够反映事物本质或主要特征的标志。 例如,研究职工生活水平的高低情况时,可 以用“职工的工资水平”作为分组标志,也可以 用“职工家庭成员平均收入水平”作为分组标志。 应该选择后者作为分组标志。 (3)要根据现象的历史条件变化来选择分组标志。 例如,前面讲到研究职工生活水平问题,如 果要列出“职工生活贫困户”一组,则“贫困户” 的标准就随历史条件变化而变化,而且不同地区 标准也不相同。
第三节,变量数列(分配数列)
一、分配数列(次数分布)的概念
在统计分组的基础上,将总体中所有单位按组 归类整理,并按一定的顺序排列,形成总体中各单 位数在各组间的分布称为次数分布,又称分布数列 分布在各组的个体单位数叫次数,又称频数 (fi)。各组次数与总次数(Σfi)之比称为比 率,又称频率。 分配数列(次数分布)有两个构成要素:一 个是分组,另一个是次数。 统计分布的实质:把总体的全部单位按某标 志所分的组进行分配所形成的数列。
第二节 统计分组
一、统计分组的意义: • 统计分组的含义:是根据统计研究任务的 要求和现象总体的内在特点,把统计总体 按照某一标志划分为若干性质不同而又联 系的几个部分(或组)的一种统计方法。 统计分组的关键是分组标志的选择和 划分各组界限。而核心问题是正确地选择 分组标志。 (下)
• 在一个总体中,单位的品质标志或数量标志, 其标志表现可能是互不相同的,总体内部各 个单位间存在许多的变异标志又是人们把总 体进一步分为性质不同的几个部分的客观依 据。 • 统计分组是在总体内部进行的一种分类。兼 有“分”和“合”的双重含义:对总体而言 是“分”(分为范围更小的总体),而对总 体单位而言是“合”(合为性质相同的组); 对分组标志而言是“分”(按分组标志划分 总体成为标志表现不同的许多组),而对其 它标志来说又是“合”(其它标志表现的差 异消失了)。
《统计学》_第三章_统计整理
第三章统计整理(一)填空题1、统计整理是统计工作的第三阶段。
在这一阶段,通过对原始资料进行科学的加工,可以得出反映事物总体特征的资料。
2、统计整理在统计分析中起着承前启后的作用,它既是统计调查的必然继续,又是统计分析的基础和前提条件。
3、统计分组实质上是在统计总体内部进行的一种定性分类。
4、对原始资料审核的重点是真实性。
5、区分现象质的差别是统计分组的根本作用。
6、标志是统计分组的依据,是划分组别的标准。
7、根据分组标志的特征不同,统计总体可以按品质分组,也可以按数量分组。
8、对所研究的总体按两个或两个以上的标志结合进行的分组,称为复合分组。
9、次数分布数列根据分组标志特征的不同,可以分为品质分布数列和数量分布数列两种。
10、变量数列是单项变量分组、组距式分组所形成的次数分布数列。
11、按品质标志分组的结果,形成品质分布数列。
12、组限是组距变量数列中表示各组数量界限的变量值,其中下限是指最小值的变量值,上限是指最大值的变量值。
13、组距变量数列的组距大小与组数的多少成反比。
与全距的大小成正比。
14、组距变量数列的分布可以用次数分布曲线图表示。
15、划分连续变量的组限时,相邻组的组限必须重叠;划分离散型变量的组限时,相邻组的组限可以重叠,也可以不重叠。
16、统计资料的整理方法主要有统计分组和统计汇总两种。
17、钟形分布、U形分布和J形分布是次数分布的三种主要类型。
18、统计分组体系有品质标志分组和数量标志分组两种。
19、统计表按主词是否分组和分组的程度可分为简单表、简单分组表和复合分组表三种。
20、统计表从内容结构上看,是由主词和宾词两部分构成。
(二)单项选择题(在每小题备选答案中,选出一个正确答案)1、统计分组的结果表现为( A )A. 组内同质性,组间差异性B. 组内差异性,组间同质性C. 组内同质性,组间同质性D. 组内差异性,组间差异性2、统计分组的依据是( A )A、标志B、指标C、标志值D、变量值3、下面属于按品质标志分组的有( C )A. 企业按职工人数分组B. 企业按工业总产值分组C. 企业按经济类型分组D. 企业按资金占用额分组4、统计分组的关键在于( A )A、正确选择分组标志B、正确划分各组界限C、正确确定组数和组限D、正确选择分布数列种类5、下面属于按数量标志分组的有( B )A. 工人按政治面貌分组B. 工人按年龄分组C. 工人按工种分组D. 工人按民族分组6、在全距一定的情况下,组距的大小与组数的多少成(B)A、正比B、反比C、无比例关系D、有时成正比有时成反比7、某地区商业企业按所有制形式分组,然后在各种所有制形式中再按销售额多少分组,这样的分组属于( C )A. 按数量标志分组B. 简单分组C. 复合分组D. 平行分组体系8、次数分配中,靠近中间的变量值分布的次数少,靠近两端的变量值分布的次数多,这种次数分布的类型是( B )A. 钟形分布B. U形分布C. J形分布D. 洛伦茨分布9、变量数列中的各组频率(以百分比表示)的总和应该( D )A. 大于100%B. 小于100%C. 不等于100%D.等于100%10、等距分组适合于( B )A、一切变量B、变量变动比较均匀的情况C、呈急剧升降变动的变量D、按一定比率变动的变量11、单项数列中,某组的向上累计次数是80,这表示总体中( C )A. 低于该组标志值的单位有80个B. 等于该组标志值的单位有80个C. 等于和低于该组标志值的单位有80个D. 高于该组标志值的单位有80个12、确定连续型变量的组限时,相邻的组限要求( B)A、不重叠B、重叠C、不等D、重叠或不重叠13、在编制等距数列时,如果全距等于56,组数为6。
第三章 统计整理
《统计学》第三章 统计整理
完整性
是指所有的调查表格或问卷是否都已 收齐,所有的问题是否都有答案。
准确性 是指原始资料是否准确可靠.
一是逻辑检查,检查调查资料内
审 核
容是否合理,各个项目之间有没有相 互矛表格或
法 问卷中各项数字在计算方法和计算结
果上有无错误,数字的计量单位有没
分组
《统计学》第三章 统计整理
25%
33%
分组前
分组后
42%
作用:1·区分事物的性质
例:按所有制性质划分,我国现有8种经济类型:
国有经济;集体经济;私营经济;个体经济 联营经济;股份制经济;外商投资经济;港 澳台投资经济
《统计学》第三章 统计整理
2·反映总体内部结构
例:上海市按GDP计算的三次产业结构(%)
从不同角度说明总体的内部状况的认识体系。
对同一总体选择两个 平行分组体系 或两个以上标志分别进行
简单分组。各分组标志表 现并列使用。
复合分组体系 各分组标志表现交叉 结合使用。
平行分组体系
《统计学》第三章 统计整理
对教师 的分类
按性别分类
男性 女性
高级 按职称分类 中级 共计7组
初级 2+3+2
青年 按年龄分类
将统计调查得到的原始资料进行科
统计整理 学的分类和汇总,使之成为系统化、
条理化的综合资料,以反映研究总 体的特征。
地位 是统计调查的继续,统计分析的前提 和基础,起着承前启后的作用。
统计整理的种类
《统计学》第三章 统计整理
根据定期统计报表资料进 定期统计资料的整理 行综合整理
专题统计资料的整理 历史统计资料的整理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章统计整理(一)填空题1、统计整理就是统计工作得第三阶段。
在这一阶段,通过对原始资料进行科学得加工,可以得出反映事物总体特征得资料。
2、统计整理在统计分析中起着承前启后得作用,它既就是统计调查得必然继续,又就是统计分析得基础与前提条件。
3、统计分组实质上就是在统计总体内部进行得一种定性分类。
4、对原始资料审核得重点就是真实性。
5、区分现象质得差别就是统计分组得根本作用。
6、标志就是统计分组得依据,就是划分组别得标准。
7、根据分组标志得特征不同,统计总体可以按品质分组,也可以按数量分组。
8、对所研究得总体按两个或两个以上得标志结合进行得分组,称为复合分组。
9、次数分布数列根据分组标志特征得不同,可以分为品质分布数列与数量分布数列两种。
10、变量数列就是单项变量分组、组距式分组所形成得次数分布数列。
11、按品质标志分组得结果,形成品质分布数列。
12、组限就是组距变量数列中表示各组数量界限得变量值,其中下限就是指最小值得变量值,上限就是指最大值得变量值。
13、组距变量数列得组距大小与组数得多少成反比。
与全距得大小成正比。
14、组距变量数列得分布可以用次数分布曲线图表示。
15、划分连续变量得组限时,相邻组得组限必须重叠;划分离散型变量得组限时,相邻组得组限可以重叠,也可以不重叠。
16、统计资料得整理方法主要有统计分组与统计汇总两种。
17、钟形分布、U形分布与J形分布就是次数分布得三种主要类型。
18、统计分组体系有品质标志分组与数量标志分组两种。
19、统计表按主词就是否分组与分组得程度可分为简单表、简单分组表与复合分组表三种。
20、统计表从内容结构上瞧,就是由主词与宾词两部分构成。
(二)单项选择题(在每小题备选答案中,选出一个正确答案)1、统计分组得结果表现为( A )A、组内同质性,组间差异性B、组内差异性,组间同质性C、组内同质性,组间同质性D、组内差异性,组间差异性2、统计分组得依据就是( A )A、标志B、指标C、标志值D、变量值3、下面属于按品质标志分组得有( C )A、企业按职工人数分组B、企业按工业总产值分组C、企业按经济类型分组D、企业按资金占用额分组4、统计分组得关键在于( A )A、正确选择分组标志B、正确划分各组界限C、正确确定组数与组限D、正确选择分布数列种类5、下面属于按数量标志分组得有( B )A、工人按政治面貌分组B、工人按年龄分组C、工人按工种分组D、工人按民族分组6、在全距一定得情况下,组距得大小与组数得多少成( B )A、正比B、反比C、无比例关系D、有时成正比有时成反比7、某地区商业企业按所有制形式分组,然后在各种所有制形式中再按销售额多少分组,这样得分组属于( C )A、按数量标志分组B、简单分组C、复合分组D、平行分组体系8、次数分配中,靠近中间得变量值分布得次数少,靠近两端得变量值分布得次数多,这种次数分布得类型就是( B )A、钟形分布B、 U形分布C、 J形分布D、洛伦茨分布9、变量数列中得各组频率(以百分比表示)得总与应该( D )A、大于100%B、小于100%C、不等于100%D、等于100%10、等距分组适合于( B )A、一切变量B、变量变动比较均匀得情况C、呈急剧升降变动得变量D、按一定比率变动得变量11、单项数列中,某组得向上累计次数就是80,这表示总体中( C )A、低于该组标志值得单位有80个B、等于该组标志值得单位有80个C、等于与低于该组标志值得单位有80个D、高于该组标志值得单位有80个12、确定连续型变量得组限时,相邻得组限要求( B )A、不重叠B、重叠C、不等D、重叠或不重叠13、在编制等距数列时,如果全距等于56,组数为6。
为统计运算方便,组距取( D )A、 9、3B、 9C、 6D、 1014、简单表与分组表得区别在于( A )A、主词就是否分组B、宾词就是否分组C、分组标志得多少D、分组标志就是否重叠15、正态分布得图形为( C )A、 U形B、 J形C、钟形D、不确定形16、统计表得横行标题表示各组得名称,一般应写在统计表得( B )A、上方B、左方C、右方D、均可以17、组距变量数列得全距等于( D )A、最大组得上限与最小组得上限之差B、最大组得下限与最小组得下限之差C、最大组得下限与最小组得上限之差D、最大组得上限与最小组得下限之差18、在统计汇总时,如果只要求计算各组分配得单位数,可采用( B )A、过录法B、划记法C、折叠法D、卡片法19、工业企业按经济类型分组与资金利税率分组( C )A、都就是按品质标志分组B、都就是按数量标志分组C、前者按品质标志分组,后者按数量标志分组D、前者按数量标志分组,后者按品质标志分组20、在填写统计表时,当发生某项不应有数字时,用( C )符号表示A、OB、XC、—D、、、、21、某小组5个学生得“统计学”考试成绩分别为80分、70分、62分、86分、76分,这5个数字就是( B )A、标志B、标志值C、变量D、指标22、累计次数或累计频率中得“向上累计”就是指( C )A、将各组变量值由小到大依次相加B、将各组次数或频率由小到大依次相加C、将各组次数或频率从变量值最低得一组向最高得一组依次相加D、将各组次数或频率从变量值最高得一组向最低得一组依次相加23、划分连续型变量得组限时,相邻两组得组限( A )A、必须重叠B、必须间断C、既可以就是重叠得,又可以就是间断得D、以上都不就是24、某商业局对其所属商店得销售计划完成百分比采用如下分组,请指出哪项就是正确得( C )A、 80%-89% 90%-99% 100%-109% 110%以上B、 80%以下 80、1%-90% 90、1%-100% 100、1%-110%C、 90%以下 90%-100% 100%-110% 110%以上D、 85%以下 85%-95% 95%-105% 105%-115%25、有一个学生考试成绩为70分,这个变量值应归入( B )A、 60-70B、 70-80C、 60-70或70-80都行D、 60-70或70-80都不行26、某连续变量数列,其末组为开口组,下限为200,又知其邻组得组中值为170,末组得组中值为( C )。
A、260B、215C、230D、18527、某一离散型得统计资料,变量值少、变化幅度小,适于作( A )A、单项式分组B、组距式分组C、相邻得组限重叠式分组D、异距式分组28、某连续变量数列,其末组为500以上。
又如其邻近组得组中值为480,则末组得组中值为( A )A、 520B、 510C、 530D、 540(三)多项选择题(在每小题备选答案中,至少有两个答案就是正确得)1、对统计调查所搜集得原始资料进行整理,就是因为这些原始资料就是( ACD )A、零碎得B、系统得C、分散得D、具体得E、概括得2、统计资料整理得内容一般包括( ABCE )A、资料审核B、统计分组C、统计汇总D、统计分析E、编制统计表3、统计整理得基本步骤就是( BCDE )A、确定整理得目得B、设计与编制整理方案C、对原始资料进行审核D、进行统计分组与汇总E、编制统计表,显示整理结果4、下列分组中属于按品质标志分组得有( BCDE )A、职工按工龄分组B、企业按所有制属性分组C、教师按职称分组D、人口按地区分组E、人口按文化程度分组5、统计分组得关键就是( BE )A、正确地计算组距与组中值B、正确地选择分组标志C、按数量标志分组D、运用统计体系分组E、正确划分各组界限6、下列分组中属于按数量标志分组得有( ABD )A、企业按计划完成程度分组B、职工按工龄分组C、企业按隶属关系分组D、企业按年产量分组E、学生按健康状况分组7、统计分组得主要作用在于( ABC )A、区分事物得本质B、反映总体得内部结构C、分析现象之间得相互依存关系D、说明总体单位得数量特征E、说明总体单位得质量特征8、在组距数列中,组距大小与( CE )A、单位数得多少成正比B、单位数得多少成反比C、单位数得多少无关系D、组数多少成正比E、组数多少成反比9、下列分组属于品质标志分组得有( BCD )A、按工资分组B、按职业分组C、按产业分组D、按地区分组E、按人均收入分组10、统计表从内容上瞧由( DE )组成。
A、总标题B、横行标题C、纵栏标题D、主词E、宾词11、下列分组属于数量标志分组得有( ADE )A、按工龄分组B、按性别分组C、按工种分组D、按人数分组E、按平均工资分组12、统计分组得作用在于( ABE )A、区分现象得类型B、反映现象总体得内部结构C、比较现象间得一般水平D、分析现象得数量变化E、研究现象之间得依存关系13、在组距数列中,影响各组次数分布得主要因素有( ACE )A、组数B、变量值得大小C、组限D、总体单位数得多少E、组距14、组距数列中影响各组分配次数得因素就是( ABC)A、组距得大小B、组数得多少C、不同得组限D、变量值得大小E、分组标志得性质15、对统计总体进行分组时,采用等距分组还就是异距分组,决定于( AD )A、现象得特点B、变量值得多少C、次数得大小D、统计研究得目得E、组数得多少16、选择分组标志时应考虑得因素有( ABD )A、统计研究目得或分组目得B、标志能否反映事物本质C、就是区分事物数量差别还就是性质差别D、现象所处得客观历史条件E、变量就是连续变量还就是离散变量17、对连续型变量编制次数分布数列( ABC )A、只能用组距数列B、相邻组得组限必须重合C、组距可相等也可不相等D、首尾两组一定得采用开口组限E、首尾两组一定得采用闭口组限18、统计资料审核主要就是审核资料得( ABC )A、准确性B、及时性C、完整性D、代表性E、科学性19、编制组距数列时,组限得确定( BC )A、最小组得下限应大于最小变量值B、最小组得下限应小于或等于最小变量值C、最大组得上限应大于或等于最大变量值D、最大组得上限应大于最大变量值E、最小组得下限与最大组得上限应分别等于最小与最大变量值20、统计汇总得组织形式一般有( ABE )A、逐级汇总B、集中汇总C、手工汇总D、电子计算机汇总E、逐级汇总与集中汇总相结合21、统计资料汇总审核得主要内容包括( CDE )A、资料得系统性B、资料得广泛性C、资料得准确性D、资料得及时性E、资料得完整性22、广义得统计表从其用途上瞧包括( ABC )A、调查表B、汇总表C、分析表D、简单分组表E、复合分组表23、常用得手工汇总方法有( ABCD )A、画记法B、过录法C、折叠法D、卡片法E、制表法24、在组距数列中,组中值( ABD )A、就是上限与下限得中点数B、在开口组中可参照相邻组来确定C、在开口组中无法计算D、就是用来代表各组标志值得一般水平E、就就是组平均数25、次数分布数列根据分组标志特征得不同,可以分为( DE )A、单项变量数列B、组距变量数列C、异距变量数列D、变量数列E、品质数列26、统计表从表式结构瞧,包括( ABDE )A、横行标题B、总标题C、主词D、纵栏标题E、指标数值27、反映总体次数分布得图式表示方法有( BCD )A、直线图B、曲线图C、直方图D、折线图E、趋势线图28、对离散变量分组( CD )A、只能用单项式分组B、只能用组距式分组C、相邻组得组限可重叠也可不重叠D、组距可相等也可不相等E、首尾两组一定得采用闭口组限29、统计分组就是( ACD )A、在统计总体内进行得一种定性分类B、在统计总体内进行得一种定量分类C、将同一总体区分为不同性质得组D、把总体划分为一个个性质不同得、范围更小得总体E、将不同得总体划分为性质不同得组30、在组距数列中,组中值就是( ABD )A、上限与下限之间得中点数值B、用来代表各组标志值得平均水平C、在开放式分组中无法确定D、在开放式分组中,可以参照相邻组得组距来确定E、组平均数(四)就是非题1、统计表中如果不存在某项数字时,应用符号“—”表示。