调查报告基本知识
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、调查问卷的审查与编校
(一)资料整理的含义
所谓资料整理,是指运用科学的方法,将调查所得的原始资料按调查目的进行审核、汇总与初步加工,使之系统化和条理化,并以集中、简明的方式反映调查对象总体情况的过程。
(二)资料整理的步骤
1、设计和编制资料整理方案。
这是保证统计资料的整理有计划、有组织地进行的重要一步。
资料的整理往往不是整理一个或两个指标,而是整理多个有联系的指标所组成的指标体系。
登记与编号
负责接收问卷的人员要事先设计好一定的表格,用于登记交付上来的问卷。
表格上的项目一般包括调查员的姓名,调查地区,调查实施的时间,交付的日期,实发问卷数,上交问卷数,未答或拒答问卷数,丢失问卷数,其他问卷,合格问卷数等等。
重要的是对不同调查员和不同地区(或单位)交付上来的问卷在登记之后要及时在问卷表面编号或注明调查员和调查地区等。
否则大量的问卷混在一起,弄乱之后就会失去很多的信息。
2、对原始资料进行审核。
资料的审核是第一步,为了保证质量必须进行严格的审核。
3、综合汇总调查项目,对原始资料进行分组、汇总和计算是关键。
4、对整理好的资料在进行一次审核,然后编制成一个统计表,以表示社会经济现象在数量上的联系。
(三)、资料审核的内容
1、资料的真实性。
调查资料来源的客观性问题,来源必须是客观的。
调查资料本身的真实性问题,要辨别出资料的真伪,把那些违背常理的、前后矛盾的资料舍去。
2、资料的准确性。
准确的审核要着重检查那些含糊不清的、笼笼统统的以及互相矛盾的资料。
3、资料的完整性。
第一,调查资料总体的完整性。
第二,每份调查资料的完整性。
4、对无效问卷的审定
无效的问卷指的是以下几种可能情况:
①不完全的问卷,即有相当的部分没有填写的问卷;
②别调查者没有理解问卷的内容而答错的,或是没有按照指导语的要求来回答的问卷。
例如跳答的问题没有按要求去做,等等;
③回答没有什么变化的问卷也是值得怀疑的。
例如在5级的态度量表中,不管是正向的还是反向的看法,填表人都只选4(比较同意)的情况;
④缺损的问卷,即有数叶丢失或无法辨认的问卷;
⑤在截至日期之后回收的问卷;
⑥由不符合要求的其他人填写的问卷,例如在一项商品调查中,调查对象是20-70岁的成年人,因此在这个范围之外的人所填写的问卷都应视为无效;
⑦前后矛盾或有明显错误的问卷,例如年龄为20岁,职业为退休人员;或是年龄为60岁,职业为中学生之类的问卷均为无效。
5、按缺失数据处理
在以下三种情况,按缺失值来处理是可行的:
①不大符合要求的问卷数较少时;
②这些问卷中不大符合要求的问答的比例也很小,或者
③对应于不合要求的问答变量不是关键变量时。
6、丢弃
在以下五种情况下,不大符合要求的问卷(即调查对象)可以丢弃:
①不大符合要求的被调查者(问卷)的比例很小(低于10%);
②样本容量很大;
③不大符合要求的调查对象与符合要求的调查对象之间没有明显的不同(例如在人口特征、媒介接触行为或商品使用行为方面);
④准备丢弃的每个调查对象所完成的问卷不符合要求的回答占很大的比例;
⑤对关键变量的回答是缺失的。
二、调查问卷的编码
数据编码就是给每个问题的每个可能答案分配一个代码,通常是一个数字。
编码可以在设计问卷时进行,也可以在数据收集结束后进行,分别叫事前编码和事后编码。
(一)、事前编码(Pre-coding)
事前编码的问卷通常是将每个答案的对应值印在问卷上,数据文件用的记录格式常常放在最右边或放在某处的括弧内。
(二)、事后编码(Post-coding)
事后编码指的是给某个没有事先编码的答案分配一个代码。
通常需要事后编码的有:
●封闭式问题的“其他”项
●开放式问题
事后编码通常可遵循以下的要点:
●提供编码员一份空白的“参照问卷”
●提供每个需要事后编码的项目一份编码表或编码名单
●对每一个项目做一份编码本。
内含一页或几张单页
●让所有的编码员都在同一地点、使用同一编码进行工作
●提供编码指南,说明什么时候以及怎样设立一个新的代码或合并答
案
●设立较多较窄的类别要优于设立较少较宽的类别
●保持编码册的整洁和清晰。
三、数据的汇编、制图与制表
(一)统计分组
1、统计分组,是指根据社会调查的目的和要求,按照一定标志,将所研究的事物或现象区分为不同的类型或组的一种整理资料的方法。
2、统计分组的作用
⏹可以找出总体内部各个部分之间的差异。
⏹可以深入了解现象总体的内部结构。
⏹可以显示社会现象之间的依存关系。
举例:统计分组可以深入了解现象总体的内部结构
⏹我国三次产业分类的从业人员构成情况单位(%)
产业\年份 1993 1994 1995 1996 1997
第一 56.4 51.3 52.2 50.0 49.9
第二 22.4 22.7 23.0 23.5 23.7
第三 21.2 23.0 24.8 26.0 26.4
合计 100.0 100.0 100.0 100.0 100.0
举例:统计分组可以显示社会现象之间的依存关系。
⏹某地区粮食单位面积产量和施肥量的关系
每公顷化肥施用量粮食单位面积产量
(千克)(千克/公顷)
116.25 2827.5
133.50 3124.5
145.50 3396.0
153.75 3608.3
163.50 3484.0
3、统计分组标志的选择
⏹标志含义。
标志指反映事物属性或特征的名称。
⏹正确分组必须遵守以下原则:
1)、根据调查研究的目的和任务选择分组标志
2)、选择能够反映被研究对象本质的标志。
3)、应从多角度选择分组标志,并不是唯一性的
4、统计分组的类型
⏹根据分组标志的数量有:简单分组和复合分组两类。
⏹根据所使用分组标志的性质有:品质标志分组和数量标志分组。
举例:图书分类
⏹我国各级各类型图书馆普遍使用的分类方法就是《中国图书馆图书分类法》,简称“中图法”。
《中图法》是我国于1975年正式出版编制的一部大型综合性的图书分类法。
它采用五分法的分类体系,把图书资料所包括的知识内容划分为"马克思主义列宁主义毛泽东思想"、"哲学"、"社会科学"、"自然科学"和"综合性图书"五大基本部类。
举例:图书分类
⏹社会科学........................
A 马列主义、毛泽东思想
B 哲学
C 社会科学总论
D 政治、法律
E 军事
F 经济
G 文化、科学、教育、体育
H 语言、文字
I 文学
J 艺术
K 历史、地理
(二)次数分布
1、次数分布:是将总体中的所有单位按某个标志分组后,所形成的总体单位数在组之间的分布。
分布在各的总体单位数叫次数或频数。
各组次数与总次数之比叫做比重、比率或频率。
2、次数分布实质:是反映统计总体中所有单位在各组的分布状态和分布特征的一个数列,也可以称做次数分配数列,简称分布数列。
分布数列
3、分布数列的两大组成部分:(1)各组名称(或)各组变量值(2)各组单位数(次数)。
4、变量数列的种类及计算:(1)单项变量数列;组距变量数列
举例:单项变量数列
按日产量分组(件)工人人数(人)比重
(%)25 10 6
26 20 10
27 30 17
28 50 28
29 40 22
0 30 17
合计 180 100
举例:组距变量数列
按计划完成程度分组企业数比重(%)
100以下 6 21.3
100—110 16 57.4
110以上 6 21.3
合计 28 100.00
(三)变量次数分配的编制
按数量标志编制次数分配,所形成的结果称为变量次数分配。
变量次数分配编制程序如下:
⏹将原始资料顺序排列
⏹将各个数据按其数值大小归入相应的组内
⏹确定组数和组距
⏹确定组限
举例:变量次数分配的编制
⏹假设某企业30个非熟练工人的周工资额(元)如下:
106、99、85、121、84、94、106、105、110、119、101、95、91、87、105、106、109、118、96、128、91、97、105、111、111、107、103、101、107、106。
举例:变量次数分配的编制
⏹第一步:按从小到大的顺序排列数据
84、85、87、91、91、94、95、96、97、99、101、101、103、105、105、105、106、106、106、106、107、107、109、110、111、111、118、119、121、128⏹第二步:将相同的数据归入同一组,并汇总各组数值得个数
举例:变量次数分配的编制
举例:变量次数分配的编制
⏹第三步:确定组数和组距
⏹第四步:确定组限
分组方法选择
选择等距分组还是不等距分组,主要根据研究的目的和观察值的特点决定。
⏹如果研究目的是要从数量上区分不同性质的类别,就必须根据被研究现象各类别在数量上的特点确定各组组距,
⏹如果所收集的原始数据中有极端值存在,为避免组数太多,分布特征无法详实的情况,也可能采用不等距分组,在数据分布密集的地方用较短组距,在数据分布疏散的地方采用较长组距。
举例:不等距分组的变量次数分配编制
某地区人口年龄分配情况
按年龄分组人口数(万人)
1岁以下 2
1~7岁 12.2
7~18岁 24.0
18~25岁 14.8
25~55岁 34.2
55岁以上 16.3
合计 103.5
某地区个人年收入额分配
按年收入额各组所占百分比
分组(元)(%)
0~5,000 23.9
5,000~10,000 34.8
10,000~15,000 20.1
15,000~45,000 17.28
45,000~75,000 1.74
75,000~105,000 0.88
105,000~135,000 0.81
135,000以上 0.48
合计 100.00
(四)制表
⏹表的结构:标题、横标目、纵标目、数字。
⏹表的种类:简单分组表、复合分组表。
⏹制作方法:制作应遵循科学、实用、简练、美观原则。
⏹制表应注意以下问题:
⏹1)标题简单明了。
⏹2)如表格栏数多,应对栏数加以编号。
⏹3)数字要填写整齐,对准数位。
⏹4)凡需说明的文字一律写入表注
(五)绘图
⏹统计图的种类:条形图或称柱状图、圆形图、曲线图、象形图。
⏹统计图的作用:
⏹表明事物总体结构。
⏹表明统计指标不同条件下的对比关系。
⏹反映事物发展变化的过程和趋势。
⏹说明总体单位按某一标志的分布情况。
⏹显示现象之间的相互依存关系。