第二章 统计调查和统计资料整理
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章
统计调查和统计资料整理
本章目的:要求了解统计调查的含 义、方法以及统计资料整理的含义、步 骤与内容,知道统计调查的种类、统计 表的基本结构和编制原则;学会并能使 用统计分组方法;掌握变量数列编制。
第一节 统计调查的概念和种类
一、统计调查的概念、地位和要求 (一)概念:根据统计研究的目的、要求和任务, 运用各种科学的调查方法,有计划、有组织地搜集 有关现象的各个单位的资料,对客观事实进行登记, 取得真实可靠的调查资料的活动过程。 统计调查所涉及的资料有两种:一种是直接向调 查单位搜集的未经加工、整理的资料,称为原始资 料或初级资料;另一种是根据研究目的,搜集经初 步加工、整理过的、能够在一定程度上说明总体现 象的资料,一般称为次级资料或二手资料。统计调 查一般指的是对第一种资料的搜集。
组中值—各组上限与下限的中点数值 组中值公式: 课本
P22
3-27
± í 2— 5 È ¾ Ë ù Ä ê Ê Õ È ë £ ¨Ô ª £ © 2500Ò Ô Ï Â 2500¡ ª 3000 3000¡ ª 3400 3400¡ ª 4000 4000¡ ª 5000 5000Ò Ô É Ï Ï ¼ º Æ
± í 2-2 È Ë ¿ Ú Ð Ô ± ð ± È À ý Ô ± Ð ð Ä Ð Å ® Ï Æ º ¼ Ë Ê È ý £ ¨Í ò Ë È £ © 63629 61181 124810 È Ö ± Ø ¨ £ %£ © 50.98 49.02 100
3-23
变量分布数列:按数量标志分组 形成的分配数列。
3-4
二、统计调查的种类
(一)按调查对象的范围分:全面调 查和非全面调查。 (二)按调查登记时间是否有连续性 分为:经常性调查和一次性调查。 (三)按组织方式不同,可分为:统 计报表和专门调查。
3-5
三、 统计调查方案
(一)、确定调查目的和任务 (二)、确定调查对象和调查单位 (三)、确定调查项目,设计调查表式 (四)、确定调查的时间、空间和方法 (五)、编写填表说明
变量值 要素: 组次数(频数或频率)
概念:组限(开口、闭口)——见P21 组距(等距、异距) 组中值
3-26
组限—各组界限的变量值。其中较小的变量 值为下限,较大的变量值为上限。
开口组—上限或下限只有一个的组 闭口组—上限和下限都齐全的组
组距—各组上限与下限之差。
全距—各组组距之和或最大变量值与最小变量值之差
见课本P20
3-20
品质数列
按品质标志分组形成的数列
组名称 要素: 组次数(频数或频率)
3-21
表2-1 某公司职工文化程度状况()
文化程度 小学 初中 高中 大学 合计
工人数 400 1500 2600 500 5000
比重(%) 8 30 52 10 100
3-22
3-40
调查表
年末职工家庭就业人口调查表
家庭人口——人 就业人口——人
姓名 与户 性别 年龄 工作 职业 职务 备注 单位 职称 主关 系
3-41
整理表或汇总表
某年甲、乙两地工业企业从业人数、工业 增加值和税金
按地区分 组 (甲) 甲地 从业人数 (万人) (1) 11.47 工业增加 上缴税金 值(万元) (万元) (2) (3) 216622.4 643.2 2 368573.5 9141.46 9 585196.0 9784.66 1
3-17
(二)、按品质标志或按数量标志分组
1、按品质标志分组——见课本P20表2—3 2、按数量标志分组——见课本P20表2—4 (三)、简单分组和复合分组 1、简单分组——见课本P20表2—1 2、复合分组——见课本P20表2—2
3-18
三 分配数列 (次数分布)
分配数列 --- 统计分组的必然结果
表2-9 年份
农村居民人均纯收入 农村居民人均纯收 入(元) 2622 2936 3255 3587 4140
3-39
2003 2004 2005 2006 2007
统计表的种类
(一)、按用途分为调查表、汇总表和分 析表。 调查表——用于登记、搜集原始统计资料 的表格。 汇总表——用于表现统计汇总或整理结果 的表格。 分析表——用于对整理所得的资料进行定 量分析的表格。
包括——单项式变量数列、组距 式变量数列
单项式变量数列:按数量标志分组 后,用一个变量值代表一个组形 成数列
3-24
组距式变量数列:按数量标志分组后, 用变量值变动的一定范围(即组距) 代表一个组所形成数列
见课本P20
3-25
变量数列
单项式数列—适应范围 组距数列—适应范围 等距数列 异距数列
3-31
2、最小组的下限要略低于最小变量值, 最大组的上限要略高于最大变量值。
3、对于等距数列,如果组距是5,10,…100,…, 则每组的下限最好是它们的倍数。
3-32
某月啤酒公司60个销售点的销量
48 71 52 53 36 41 69 58 47 60 53 29 41 72 81 37 43 58 68 42 73 62 59 44 51 53 47 66 59 52 34 49 73 29 47 16 39 58 43 29 46 52 38 46 80 58 51 67 54 57 58 63 49 40 54 61 58 66 47 50 单位:桶
3-29
3)确定组限:离散变量组 限不重叠,连续变量组限 重叠 4)计算各组单位数,编制 变量数列
3-30
组限的确定主要考虑下列几点
1、对于连续型变量,划分组限时相邻组 的组限必须重合。对于越高越好的现象, 如收入、产量等,习惯上规定,各组不包括 其上限变量值的单位,即所谓“上组限不在内”的 原则。对于越低越好的现象,如费用、成本等, 习惯上规定,各组则包括其上限变量值的单位, 即所谓“上组限在内”的原则。
³ Ï Ä Ø È Ë ¾ ù Ä ê Ê Õ È ë
Ë Ê È ý £ ¨Ç §È Ë £ © 32.00 88.00 160.00 272.00 152.00 44.00 748.00
3-28
三、变量数列的编制
1、步骤(见P21-22) 1)将原始资料按数值大小依次排 列 2)确定全距(排序) 确定组数 全距 组数 组距
一、统计整理的意义和步骤
含义——是根据统计研究的目的,将统计调查所得的资料进行 科学的分类和汇总,为统计分析准备系统的、条理化的综合 资料的工作过程。 内容 数据处理:分类、汇总、 表现(制表) 数据管理:输入、贮存、更新、输出 步骤 制定统计整理方案、审核原始资料、 数据处理和表现、数据贮存
3-15
3-2
(续)
(二)与一般社会调查的主要区别。 (1)主要着眼于数字资料的搜集; ( 2 )不是搜集个别单位的资料,而 是搜集大量单位的资料并能够据以汇总计 算形成说明总体的综合数据。
3-3
(续)
(三)地位:是整个统计工作的基础环节。 (四)要求:准确性、及时性、系统性和完整性。 准确性——如实反映客观实际。真实性是统计的生命。 及时性——即时效性,尽快提供资料及时整理分析。过时 的信息有如“雨后送伞”。 系统性——有条理,合乎逻辑,不杂乱无章,便于汇总。 完整性——不重复、不遗漏、所列调查项目的资料搜齐 全。
3-13
非全面抽查的比较
调查单位构成 重点调查 重点单位 典型调查 有意识选择典型 单位 目的 总体关系
了解总体基 不能推断总体 本情况
抽样调查 按随机原则抽取 部分单位
了解生动具 “划类选点”时, 体资料 可推断总体, 但不能计算和 控制误差 推断总体 可计算和控制 误差
3-14
第二节
统计资料整理
(一)、分配数列的概念
概念:总体各单位按某一标志分组 后,所形成的总体单位数在各组之 间的分布。
次数或频数:分布在各组的总体单位数
比重、比率或频率:各组次数占总次数之比。
见课本P20
3-19
2 构成要素——频数(次数) 频率
二、分配数列的种类 种类—品质分布数列、变量分布数列
品质分布数列:按品质标志分组 形成的分配数列
总标题
3-37
某地工工业部门的分组
按经济类型和企业规模分 组 全民所有制企业 企业数 252
其中:大型企业 中型企业 小型企业 集体所有制企业 其中:大型企业 中型企业 小型企业
15 23 214 960 2 8 950
3-38
性质不同 时间数列表:主词栏中是按时间单位 的顺序排列的统计表,如表2—9所示。
3-10
(四)、典型调查
定义:根据调查目的和要求,在对所研究总体 全面分析的基础上,有意识地从中选择少数具有 典型性的单位进行深入调查研究的一种非全面调查
3-11
非全面调查
1、重点调查 2、典型调查 3、抽样调查
3-12
重点调查与典型调查的关系
联系:两者均属非全面调查,都是通过对总 体中的部分单位进行调查,以实现调查目的。 区别:1、选择调查单位标准不同:典 型调查 选择对总体中具有代表性单位; 而重点调查选择是总体中重点单位。 2、调查目的不同:典型调查对典型单位研究, 可以认识同类现象的本质和规律性,以达到由 特殊到一般的认识目的;重点调查则是对重点 单位调查,认识总体的基本情况。
3-33
啤酒销售量的分布数列(表2-3)
销售桶数 10—19 20—29 30—39 40—49 50—59 60—69 70—79 80—89 合计 销售点数 1 3 5 16 20 9 4 2 60 频率(%) 1.7 5.0 8.3 26.7 33.3 15.0 6.7 3.3 100.0
3-34
见课本P13——14
3-6
四、统计调查方法
(一)直接观察法 (二)报告法 (三)采访法 (四)卫星遥感法
见课本P16
3-7
五、 统计调查的组织方式
(一)普查——是根据统计任务的特定目的 而专门组织的一次全面调查,调查内容详细、 提供重要的国情、国力为目的,必须在规定 的时间内统一进行。 1、意义 2、普查的组织 3、快速普查
乙地
全地区
35.99
47.46
3-42
分析表 某年甲、乙两地工业企业人均增 加值和上缴税金
某班学生考试成绩次数表
成绩(分) 60以下 学生人数 2 向上累计 2 向下累计 54
60-70
70-80 80-90
15
19 15
17
36 51
52
37 18
90-100合 计35454——
3
——
3-35
五、
统计表及其设计
一、统计表的意义和构成 定义:表现经过整理的统计数据的表格。 意义:P24 构成——P24
3-8
(二)、抽样调查—见第六章
定义:它是从总体中按随机原则抽取一部分 单位进行观测,并根据这部分单位的 资料推断总体数量特征的一种方法。
3-9
(三)、重点调查
1、定义:是指在调查对象中,只选择一 部分重点单位而进行的非全面调查。 2、方法:一次性调查、经常性调查 重点单位:是指单位可能数目不多,但 就调查的标志值来说,却在总体标志 总量中占有很大比重。
统计表的构成 按形式:标题——总标题、横栏标题、纵列标题 横行、纵列 数字 按内容:主词 主栏 宾词 宾栏
3-36
(二)统计表的结构
形式
统 计 表
内容
统计表的名称, 又称横标目,它 用以概括统计表 横行标题 表明统计表横行 中全部统计资料 一般在各横行标 又称纵标目,它 纵栏标题 项目的名称,一 的内容,一般放 统计表所要说明 题与纵栏标题的 表明纵栏指标名 般置于表的左边 在表的上端中央 用来说明主词的 的对象,即统计 交叉处,是说明 数字资料 称,一般置于表 各种统计指标, 总体各个组成部 总体(各组)数 的右上方 一般指表的纵栏 分的名称,一般 量特征的指标。 主词 标题和数字资料 是指表的标行标 下面看 部分 。。 题部分 宾词 个例子 吧
二、 统计分组
(一)、 统计分组的含义 1、概念——P17
对总体——分 对个体——合 突出组与组之间的差异、抽象组内各单位差异
(二)、统计分组的作用和原则 1、 区分现象质的差别、反映结构比例、揭示依
存关系
2、原则: 科学性、完备性、互斥性
三、统计分组的方法
(一)正确选择分组标志 1、根据研究目的选择分组标志 2、选择最能反映事物本质特征进行分组 3、根据具体条件选择分组标志
统计调查和统计资料整理
本章目的:要求了解统计调查的含 义、方法以及统计资料整理的含义、步 骤与内容,知道统计调查的种类、统计 表的基本结构和编制原则;学会并能使 用统计分组方法;掌握变量数列编制。
第一节 统计调查的概念和种类
一、统计调查的概念、地位和要求 (一)概念:根据统计研究的目的、要求和任务, 运用各种科学的调查方法,有计划、有组织地搜集 有关现象的各个单位的资料,对客观事实进行登记, 取得真实可靠的调查资料的活动过程。 统计调查所涉及的资料有两种:一种是直接向调 查单位搜集的未经加工、整理的资料,称为原始资 料或初级资料;另一种是根据研究目的,搜集经初 步加工、整理过的、能够在一定程度上说明总体现 象的资料,一般称为次级资料或二手资料。统计调 查一般指的是对第一种资料的搜集。
组中值—各组上限与下限的中点数值 组中值公式: 课本
P22
3-27
± í 2— 5 È ¾ Ë ù Ä ê Ê Õ È ë £ ¨Ô ª £ © 2500Ò Ô Ï Â 2500¡ ª 3000 3000¡ ª 3400 3400¡ ª 4000 4000¡ ª 5000 5000Ò Ô É Ï Ï ¼ º Æ
± í 2-2 È Ë ¿ Ú Ð Ô ± ð ± È À ý Ô ± Ð ð Ä Ð Å ® Ï Æ º ¼ Ë Ê È ý £ ¨Í ò Ë È £ © 63629 61181 124810 È Ö ± Ø ¨ £ %£ © 50.98 49.02 100
3-23
变量分布数列:按数量标志分组 形成的分配数列。
3-4
二、统计调查的种类
(一)按调查对象的范围分:全面调 查和非全面调查。 (二)按调查登记时间是否有连续性 分为:经常性调查和一次性调查。 (三)按组织方式不同,可分为:统 计报表和专门调查。
3-5
三、 统计调查方案
(一)、确定调查目的和任务 (二)、确定调查对象和调查单位 (三)、确定调查项目,设计调查表式 (四)、确定调查的时间、空间和方法 (五)、编写填表说明
变量值 要素: 组次数(频数或频率)
概念:组限(开口、闭口)——见P21 组距(等距、异距) 组中值
3-26
组限—各组界限的变量值。其中较小的变量 值为下限,较大的变量值为上限。
开口组—上限或下限只有一个的组 闭口组—上限和下限都齐全的组
组距—各组上限与下限之差。
全距—各组组距之和或最大变量值与最小变量值之差
见课本P20
3-20
品质数列
按品质标志分组形成的数列
组名称 要素: 组次数(频数或频率)
3-21
表2-1 某公司职工文化程度状况()
文化程度 小学 初中 高中 大学 合计
工人数 400 1500 2600 500 5000
比重(%) 8 30 52 10 100
3-22
3-40
调查表
年末职工家庭就业人口调查表
家庭人口——人 就业人口——人
姓名 与户 性别 年龄 工作 职业 职务 备注 单位 职称 主关 系
3-41
整理表或汇总表
某年甲、乙两地工业企业从业人数、工业 增加值和税金
按地区分 组 (甲) 甲地 从业人数 (万人) (1) 11.47 工业增加 上缴税金 值(万元) (万元) (2) (3) 216622.4 643.2 2 368573.5 9141.46 9 585196.0 9784.66 1
3-17
(二)、按品质标志或按数量标志分组
1、按品质标志分组——见课本P20表2—3 2、按数量标志分组——见课本P20表2—4 (三)、简单分组和复合分组 1、简单分组——见课本P20表2—1 2、复合分组——见课本P20表2—2
3-18
三 分配数列 (次数分布)
分配数列 --- 统计分组的必然结果
表2-9 年份
农村居民人均纯收入 农村居民人均纯收 入(元) 2622 2936 3255 3587 4140
3-39
2003 2004 2005 2006 2007
统计表的种类
(一)、按用途分为调查表、汇总表和分 析表。 调查表——用于登记、搜集原始统计资料 的表格。 汇总表——用于表现统计汇总或整理结果 的表格。 分析表——用于对整理所得的资料进行定 量分析的表格。
包括——单项式变量数列、组距 式变量数列
单项式变量数列:按数量标志分组 后,用一个变量值代表一个组形 成数列
3-24
组距式变量数列:按数量标志分组后, 用变量值变动的一定范围(即组距) 代表一个组所形成数列
见课本P20
3-25
变量数列
单项式数列—适应范围 组距数列—适应范围 等距数列 异距数列
3-31
2、最小组的下限要略低于最小变量值, 最大组的上限要略高于最大变量值。
3、对于等距数列,如果组距是5,10,…100,…, 则每组的下限最好是它们的倍数。
3-32
某月啤酒公司60个销售点的销量
48 71 52 53 36 41 69 58 47 60 53 29 41 72 81 37 43 58 68 42 73 62 59 44 51 53 47 66 59 52 34 49 73 29 47 16 39 58 43 29 46 52 38 46 80 58 51 67 54 57 58 63 49 40 54 61 58 66 47 50 单位:桶
3-29
3)确定组限:离散变量组 限不重叠,连续变量组限 重叠 4)计算各组单位数,编制 变量数列
3-30
组限的确定主要考虑下列几点
1、对于连续型变量,划分组限时相邻组 的组限必须重合。对于越高越好的现象, 如收入、产量等,习惯上规定,各组不包括 其上限变量值的单位,即所谓“上组限不在内”的 原则。对于越低越好的现象,如费用、成本等, 习惯上规定,各组则包括其上限变量值的单位, 即所谓“上组限在内”的原则。
³ Ï Ä Ø È Ë ¾ ù Ä ê Ê Õ È ë
Ë Ê È ý £ ¨Ç §È Ë £ © 32.00 88.00 160.00 272.00 152.00 44.00 748.00
3-28
三、变量数列的编制
1、步骤(见P21-22) 1)将原始资料按数值大小依次排 列 2)确定全距(排序) 确定组数 全距 组数 组距
一、统计整理的意义和步骤
含义——是根据统计研究的目的,将统计调查所得的资料进行 科学的分类和汇总,为统计分析准备系统的、条理化的综合 资料的工作过程。 内容 数据处理:分类、汇总、 表现(制表) 数据管理:输入、贮存、更新、输出 步骤 制定统计整理方案、审核原始资料、 数据处理和表现、数据贮存
3-15
3-2
(续)
(二)与一般社会调查的主要区别。 (1)主要着眼于数字资料的搜集; ( 2 )不是搜集个别单位的资料,而 是搜集大量单位的资料并能够据以汇总计 算形成说明总体的综合数据。
3-3
(续)
(三)地位:是整个统计工作的基础环节。 (四)要求:准确性、及时性、系统性和完整性。 准确性——如实反映客观实际。真实性是统计的生命。 及时性——即时效性,尽快提供资料及时整理分析。过时 的信息有如“雨后送伞”。 系统性——有条理,合乎逻辑,不杂乱无章,便于汇总。 完整性——不重复、不遗漏、所列调查项目的资料搜齐 全。
3-13
非全面抽查的比较
调查单位构成 重点调查 重点单位 典型调查 有意识选择典型 单位 目的 总体关系
了解总体基 不能推断总体 本情况
抽样调查 按随机原则抽取 部分单位
了解生动具 “划类选点”时, 体资料 可推断总体, 但不能计算和 控制误差 推断总体 可计算和控制 误差
3-14
第二节
统计资料整理
(一)、分配数列的概念
概念:总体各单位按某一标志分组 后,所形成的总体单位数在各组之 间的分布。
次数或频数:分布在各组的总体单位数
比重、比率或频率:各组次数占总次数之比。
见课本P20
3-19
2 构成要素——频数(次数) 频率
二、分配数列的种类 种类—品质分布数列、变量分布数列
品质分布数列:按品质标志分组 形成的分配数列
总标题
3-37
某地工工业部门的分组
按经济类型和企业规模分 组 全民所有制企业 企业数 252
其中:大型企业 中型企业 小型企业 集体所有制企业 其中:大型企业 中型企业 小型企业
15 23 214 960 2 8 950
3-38
性质不同 时间数列表:主词栏中是按时间单位 的顺序排列的统计表,如表2—9所示。
3-10
(四)、典型调查
定义:根据调查目的和要求,在对所研究总体 全面分析的基础上,有意识地从中选择少数具有 典型性的单位进行深入调查研究的一种非全面调查
3-11
非全面调查
1、重点调查 2、典型调查 3、抽样调查
3-12
重点调查与典型调查的关系
联系:两者均属非全面调查,都是通过对总 体中的部分单位进行调查,以实现调查目的。 区别:1、选择调查单位标准不同:典 型调查 选择对总体中具有代表性单位; 而重点调查选择是总体中重点单位。 2、调查目的不同:典型调查对典型单位研究, 可以认识同类现象的本质和规律性,以达到由 特殊到一般的认识目的;重点调查则是对重点 单位调查,认识总体的基本情况。
3-33
啤酒销售量的分布数列(表2-3)
销售桶数 10—19 20—29 30—39 40—49 50—59 60—69 70—79 80—89 合计 销售点数 1 3 5 16 20 9 4 2 60 频率(%) 1.7 5.0 8.3 26.7 33.3 15.0 6.7 3.3 100.0
3-34
见课本P13——14
3-6
四、统计调查方法
(一)直接观察法 (二)报告法 (三)采访法 (四)卫星遥感法
见课本P16
3-7
五、 统计调查的组织方式
(一)普查——是根据统计任务的特定目的 而专门组织的一次全面调查,调查内容详细、 提供重要的国情、国力为目的,必须在规定 的时间内统一进行。 1、意义 2、普查的组织 3、快速普查
乙地
全地区
35.99
47.46
3-42
分析表 某年甲、乙两地工业企业人均增 加值和上缴税金
某班学生考试成绩次数表
成绩(分) 60以下 学生人数 2 向上累计 2 向下累计 54
60-70
70-80 80-90
15
19 15
17
36 51
52
37 18
90-100合 计35454——
3
——
3-35
五、
统计表及其设计
一、统计表的意义和构成 定义:表现经过整理的统计数据的表格。 意义:P24 构成——P24
3-8
(二)、抽样调查—见第六章
定义:它是从总体中按随机原则抽取一部分 单位进行观测,并根据这部分单位的 资料推断总体数量特征的一种方法。
3-9
(三)、重点调查
1、定义:是指在调查对象中,只选择一 部分重点单位而进行的非全面调查。 2、方法:一次性调查、经常性调查 重点单位:是指单位可能数目不多,但 就调查的标志值来说,却在总体标志 总量中占有很大比重。
统计表的构成 按形式:标题——总标题、横栏标题、纵列标题 横行、纵列 数字 按内容:主词 主栏 宾词 宾栏
3-36
(二)统计表的结构
形式
统 计 表
内容
统计表的名称, 又称横标目,它 用以概括统计表 横行标题 表明统计表横行 中全部统计资料 一般在各横行标 又称纵标目,它 纵栏标题 项目的名称,一 的内容,一般放 统计表所要说明 题与纵栏标题的 表明纵栏指标名 般置于表的左边 在表的上端中央 用来说明主词的 的对象,即统计 交叉处,是说明 数字资料 称,一般置于表 各种统计指标, 总体各个组成部 总体(各组)数 的右上方 一般指表的纵栏 分的名称,一般 量特征的指标。 主词 标题和数字资料 是指表的标行标 下面看 部分 。。 题部分 宾词 个例子 吧
二、 统计分组
(一)、 统计分组的含义 1、概念——P17
对总体——分 对个体——合 突出组与组之间的差异、抽象组内各单位差异
(二)、统计分组的作用和原则 1、 区分现象质的差别、反映结构比例、揭示依
存关系
2、原则: 科学性、完备性、互斥性
三、统计分组的方法
(一)正确选择分组标志 1、根据研究目的选择分组标志 2、选择最能反映事物本质特征进行分组 3、根据具体条件选择分组标志