第七章 整理资料
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
除了上述必备要素外,有些统计表根据情 况的需要,还需增列补充资料、注解、附 记、资料来源、填表单位、填表人及填表 日期。
三、统计表的种类 1、简单分组表:即主项只按照一个标志进行 分组的统计表。如按年份分组,按性别分 组,按家庭人口分组 2、复合分组表:即主项按两个或两个以上标 志进行层叠分组的统计表。这种统计表可 以从不同角度深入反映社会现象的特征 3、组距分组表
三、资料分组的类型 (一)按分组标志性质的不同划分 1、按品质标志分组 按品质标志分组,就是按反映事物属性或质的特征的品质标志 进行的分组。如老年人按婚姻状况、户居方式、受教育水平分 组;流浪儿童按外流原因、外流生活来源、流出地分组等。 这种分组能直接反映事物性质的不同,给人以具体明确的概念。 按品质标志分组有的比较简单,如上面所举之例均如此,它们 随着分组标志的确定,组别也就基本确定了;有的则比较复杂, 如对人口职业分类就比较复杂,其类别繁多,且各组界限很难 划定。对于比较复杂的重要品质标志的分组,国家往往编有标 准分类目录,以统一全国分组口径。
二、统计表的结构 统计表的结构有形式结构和内容结构之分。 1、统计表的形式结构⑴总标题;⑵横行标题 ; ⑶纵栏标题;⑷指标数值 2、统计表的内容结构⑴主词 ;⑵宾词 主词是统计表所要说明的对象,总体、总体的各 个组、总体单位的名称和时间都可以成为主词。 宾词是用来说明主词的各个统计指标,包括指标 名称和指标数值。通常把主词放在表的左方,宾 词列在表的右方。
表四 某乡农民家庭人均纯收入分组表
开放式
年人均纯收入(元) 200以下 户数
200—500
500—1000
1000以上
合计
表五 某乡农民家庭人均纯收入分组表
封闭式
年人均纯收入(元) 150—200 200—500 500—1000 户数
1000—1500 合计
(6)分组界限通常是标明界限,而不是真实界限。 标明界限的低数组的上限即为高数组的下限。当 某一标志值正好与这一分组界限重合时,一般都 遵循“上限不在内”的原则,将其划归属于下限 的那一组。 (7)组中值:上限与下限之间的中间数值。其计 算公式为: 封闭式组距:组中值=(下限+上限)/2 开口式组距: ①缺下限的组中值=上限-相邻组的组距/2 ②缺上限的组中值=下限+相邻组的组距/2
2、复合分组 复合分组就是对所研究对象选择两个或以 上的标志进行层叠分组。即先按一个标志 分组,然后,再对每一个组别按另一个标 志作进一步分组。复合复合分组在分组时, 应根据分析的要求,确定分组标志的主次 顺序,主要标志在先,次要标志在后。 例见表一
表一 某市工业企业状况
分组标志 企业数目 比重(%)
二、资料分组标志的选择 1、根据社会调查目的选择分组标志 例如进行人口调查,人口具有年龄、性别、文化程度、民 族、职业等特征,如果研究的目的是分析人口的年龄构成, 就应以年龄这个特征作为分组的标志。 2、选择能够反映现象本质特征的标志 例如调查农民对养老模式的意见和态度时,必须抓住农民 家庭的经济状况作为分组的标志。 3、多角度选择分组标志 例如研究在校大学生的恋爱观时,不但可以从男女性别角 度,还可以从年龄、年级、文理科、家庭背景等多角度进 行分组研究。
第二节 资料分组
一、资料分组的意义 所谓资料分组,也称统计分组。它是根据社会调 查的目的和要求,按照一定的标志,将所研究的 事物和现象区分为不同的类型或组的一种整理资 料的方法。它的最基本的原则就是要把不同性质 的事物区别开来,把性质相同的事物联系起来。 资料分组具有两方面的含义:从现象总体角度看, 它是“分”的过程,是将现象总体中的各个单位 划分为若干性质不同的组成部分;从现象个体角 度看,它又是“合”的过程,是把现象总体中性 质相同的单位组合成一组。
(4)组限及其表示方法 组限是各组的数量界限,即每组两端的数值。其 中较大的标志值为上限,较小的标志值为下限。 组限的表示方法有两种:一是上下限重叠式;二 是上下限不重叠式。 (5)开口组与闭口组 开口组常出现在第一组和最后一组,用“以下”、 “以上”的形式表示。闭口组是组内既有上限也 有下限。一般情况下,最好采用闭口组的形式。
3、折叠法:折叠法是将所有调查表中需要汇总的 项目和数值折在边上,一张一张的叠在一起进行 汇总计算。此方法不需过录,简便易行,适用于 对标志值的汇总。 4、卡片法:这是将每个调查单位需要汇总的项目 和数字摘录在特制的卡片上,再根据卡片分组归 类和汇总计算。此方法比划记法、过录法、折叠 法的质量要高,适用于调查资料多、统计分组细 的情况。 卡片法的操作步骤:编号;制作卡片;摘录;分 组计数。
职业分类
各类专业技术 人员 国家机关、党 群组织、企事 业单位负责人 服务性工作人 员
性别 合计 男 女 合计 男 女 合计 男 女
人数(万人) 比重(%) 344 100 189 55 155 45 114.6 100 101.4 88.5 13.2 11.5 154.5 100 74.7 48 79.8 52
二、资料整理的程序 1、设计整理方案 2、审核原始资料 在资料汇总之前,必须对调查得来的原始资料进行一次认 真、细致、全面的审查和核定。重点检查调查资料的真实 性、准确性和完整性。 3、进行资料分组 资料分组是资料整理的关键。它是根据社会调查的目的和 任务,按照整理方案中所选择的分组标志,对原始资料进 行统计分组,为资料的统计分析作准备。 4、实施资料汇总 5、编制统计图表
(3)等距分组与异距分组 等距分组即数列中各组组距相等。 异距分组是数列中各组组距不相等。 采用等距分组还是异距分组,主要取决于研究现 象特点的差异变动是否均衡。对资料进行异距分 组,由于各组组距的大小对各组的次数分配有影 响。这时的次数分布不能准确反映总体的分布特 征,要消除组距不同的影响,就需用各组的次数 密度来反映现象的实际次数分布状况。
国有企业
大型
中型
小型
集体企业 大型 中型 小型 三资企业 大型 中型 小型
私营企业
大型
中型 小型 合计
(三)根据总体标志值变动范围大小,按 数量标志分组又可以分为:单项式分组和 组距式分组 1、当数量标志值的变动范围较小,而且标 志值的项数不多时,可以进行单项式分组, 即可直接将每个标志值列为一组。如表二 所示:
第二节 资料的审核
一、资料审核的一般要求: 1、真实性:资料来源的客观性;资料本身 的真实性 2、准确性:重点检查那些含糊不清、相互 矛盾的资料 3、完整性:调查资料总体的完整性;每份 调查资料的完整性
二、资料审核的方法 1、逻辑审核:即核查调查资料的内容是否合乎逻辑和常 识,项目之间有无相互矛盾之处,与其他有关资料进行对 照是否有明显出入等等 2、计算审核:针对数字资料进行审查,要检查计算有无 失误,度量单位有没有用错,前后数字之间有无相互矛盾 之处等等 3、发现问题的处理: (1)对于调查中已经发现并经过认真核实后确认的错误, 可由调查者代为更正 (2)对于资料中的可疑之处或明确有错误出入的地方, 应设法进行补充调查 (3)在无法进行或无须进行补充调查的情况下,应坚决 剔除那些有明显错误的或没有把握的资料,以保证资料的 真实性和准确性
2、按数量标志分组 按数量标志分组,就是按事物的数量特征 进行分组。如了解职工生活按经济收入分 组,研究地区的社会保险按参保企业个数 分组,等等。 按数量标志分组,必须以分组结果能够反 映被研究现象的不同类型和性质差异为前 提。
(二)按分组标志数量的多少划分 1、简单分组 简单分组就是对研究对象只按一个标志进行 的分组。如农村居民按家庭人均收入分组, 妇女按初婚年龄分组,职工按性别分组等。 它们分别只能从一个角度说明现象的分布状 况和内部构成。对于同一总体采用两个或两 个以上的标志进行简单分组,形成平行分组 体系。在平行分组体系中,各简单分组的分 组标志是平等的关系,无主次之分。
表六 全国刑事案件立案与破案情况 (简单分组表)
年份
1981 1982
每万人立案件数
8.9 7.4
破案பைடு நூலகம்(%)
73.1 77.4
1983 1984
1985 1988 1992
6.0 5.0
5.2 7.7 13.5
70.6 76.9
78.8 75.7 65.2
表七 1990年全国部分职业分性别的在 业人口
表八 1990年全国部分职业分性别的 在业人口 (单位:万人)
性别
男 189
女 155
合计 344
职业分类
各类专业技术人 员
国家机关、党群 101.4 组织、企事业单 位负责人 服务性工作人员 74.7
合计 365.1
13.2
114.6
79.8
248
第七章 整理资料
第一节 资料整理的意义与程序
一、资料整理的意义 1、含义:资料整理是指根据调查目的,运用科学 方法,对搜集的原始资料进行审核、汇总与初步 加工,使之系统化、条理化,从而得到体现调查 对象总体特征的综合资料的工作过程。 2、意义和作用: 第一,资料整理使资料质量有了保证。第二,资 料整理使资料分析有了可能。第三,资料整理使 分析质量有了基础。第四,资料整理使资料保存 有了条件。
(二)计算机汇总 优点显著:速度快,精度高,汇总量大, 具有逻辑运算、自动工作和储存资料的功 能。 其汇总步骤大致可以分成五个阶段:编制 程序、资料编码、数据录入、逻辑检查和 制表打印。
第四节 统计表
一、统计表的意义 统计表是用表格显示统计资料的一种基本形式。 广义的统计表包括统计工作各个阶段的一切表格, 如调查表、汇总表、整理表与分析表。本节所讲 的统计表是狭义的,介绍的主要是显示资料整理 结果所用的统计表。 统计表的主要作用表现在以下几个方面:1、统计 表把大量的统计资料有条理地组织与安排,资料 系统清晰,直观易懂。2、统计表内的数字组织科 学,排列有序,因而便于统计资料的比较对照。3、 它是分析研究各指标之间的数量关系,进行统计 分析的有效工具。
表三 某班40名学生社会调查课考试成 绩统计表
成绩(分) 60分以下 60—70 学生人数 2 7 百分比(%) 5.0 17.5
70—80
80—90
11
12
27.5
30.0
90—100
合计
8
40
20.0
100.0
(1)组距式分组组数的确定,应从调查研 究的实际需要出发。组数一般以5—8组为 宜 (2)组数与组距 组距是每组标志的最大值与最小值之差。 组距与组数是相互关联的,它等于全距除 以组数。二者呈反比关系。
表二 1990年我国家庭户规模
家庭规模 一人户 二人户 户数(万户) 占总户数比重(%) 173.9 306.6 6.27 11.05
三人户
四人户
657.8
716.2
23.71
25.82
五人户
六人户
492.3
233.3
17.75
8.41
七人户
八人及八人户以上 合计
108.9
85.1 2773.9
3.92
3.07 100.00
2、当数量标志值的变动范围较大,标志值的项数 又较多时,就可将一些近邻的标志值合并为一组, 作为分组的依据,以减少组的数量。这种以标志 值的一定变动范围为分组依据的方法叫做组距式 分组。 例如:某班40名学生的社会调查课考试成绩如下: 89 88 76 99 74 60 82 60 89 97 86 93 99 77 73 98 79 59 78 63 95 70 87 84 79 82 77 67 83 79 72 84 85 56 81 94 65 65 66 92
四、分组资料的汇总 分组资料的汇总技术有手工汇总和电子计算机汇总两 种。 (一)手工汇总 1、划记法:这是用点线符号(如“正”字)计算各组 的单位数的方法。此方法简便易行,但只能汇总总 体调查单位数,不能汇总标志值。一般在调查单位 资料不多的情况下采用。 2、过录法:过录法就是将调查资料先过录到事先设计 好的汇总表中,并计算加总,然后再将其结果填入 正式的统计汇总表中。