最新统计学原理统计资料的搜集与整理
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
特 点
•是一种非全面调查,但是又要 达到对总体数量特征的认识。 •按照随机原则抽选调查单位。
优 点
经济性、时效性、 准确性、灵活性
作 用
•能够解决全面调查无法或难以解决的问题。 •可以补充和订正全面调查的结果。 •可以用于对总体的某种假设进行检验。
组 •简单随机抽样 织 •类型随机抽样 形 •等距随机抽样 式 •整群随机抽样
• 将这些数字从小到大排列起来:
• 2000 2120 2170 2220 2260 2290 2350 2370 2400 2460 2530 2570 2590 2600 2620 2640 2710 2730 2750 2760 2810 2810 2810 2830 2840 2860 2800 2910 2940 2960 2980 3010 3030 3040 3090 3110 3190 3220 3240 3270 3290 3320 3370 3430 3520 3550 3600 3670 3820 3980
对体先类先以,总中对,将群对将小隔体按总再总为中总顺抽不照体按体单选体序取进随各随各位群各排样行机单机单,的单列本任原位原位从所位,单何则按则划中有按然位整抽主抽分随单某后进理选要选为机位一依行,调标调许抽进标一调直查志查多选行志定查接单进单群部调大间。从位行位,分查总。分。再群。
统计报表
什么是统计报表? 基本特点是什么?
- 组距式分组 —— 运用于变量变动幅度大、 项目多的分组。
三 次数分布
(一).概念
统计总体按照某一标志分组以后, 用以反映总体各单位分配情况的 统计数列,称分配数列,又可称 次数分配,或次数分布。
例
月工资分组(元) 工人数(人) 占总数比重(%)
2000 以下
210
39.6
2000-2500
187
普查是一种不连续调查
查 作用:普查主要用来搜集那些反映国
普查必须规定 标准调查时间
情国力方面的基本统计资料。
例如:人口普查、工业普查、物资库存普查、 乡镇企业普查、商业饮食业普查等等。
抽样调查
涵 义
•抽样调查是一种非全面调查,它是按照随机原则从 总体中抽取部分单位进行观察,用以推断总体数量 特征的一种调查方式。
下限
1 2
邻组组距Βιβλιοθήκη 在组距数列中,每组的最大变量值(终点值) 为上限,最小变量值(起始值)为下限。连续变 量数列中小组中(上一组)的上限也是大组中 (下一组)的下限。在分组时如果遇到变量值恰 好等于相邻两组的组限时,一般把此值归入大组 中。上限与下限的中点数值为组中值。它是各组 上下限数值的简单平均数。即组中值=(上限+ 下限)/2。组中值用以代表多组标志值的平均水 平。
统计资料的搜集与整理
第一节 统计资料及其搜集方法
一、统计调查的意义
统计调查就是按照统计任务的要求,运用科
学的调查方法,有组织地向社会实际搜集资 料的过程。
应当正确理解社会调查在人们认识中的地位; 应当正确理解统计调查在统计工作中的地位; 应当正确理解统计调查理论和方法在统计学原 理中的地位。
例:企业生存取决于市场。对企业来说,生产什么? 售价多少?何地销售?如何推广?产品市场份额多 大?产品发展潜力多深?竞争对手会有什么应对策 略?等等,一系列问题均要通过市场调查。
⑴ 关于组限问题
组距分组通常有等距分组和不等距分组两种。 等距分组即标志变量在各组保持相等组距。 反之为不等距分组。 在分组标志变更比较均匀的情况下适用等距分组。 标志变异差别急剧升降时,就应按不等距分组,不 等距分组更多的应根据事物性质变化的数量界限来确 定组距。
例 已知组距为5,组数为7,最大值39,
第二节 调查方式与调查方案
进行统计调查 • 一方面要选择恰当的调查方式;
• 另一方面要在调查之前通盘设计好调查的活 动方案
普查 抽样调查 统计报表 重点调查 典型调查
涵义:普查是专门组织的,一般用来调查属于一定 时点上社会经济现象数量的全面调查。
普 特点
普查是专门调查 普查是全面调查
普查通常是一次 性的或周期性的
适用于越大越好的变量,如产值。
下组限不在内
适用于越小越好的变量,如成本。
对不连续变量,组与组间是间断的。
⑵ 关于组中值问题 闭口式分组的组中值求法:
组中值
组的上限
2
组的下限
或
下限
上限
2
下限
⑵ 关于组中值问题
开口式分组的组中值求法:
缺下限的开口组的组中
值
上限
1 2
邻组组距
缺上限的开口组的组中
值
单一表
将一个调查单位的项目登记在一份表或一
种卡片上。这便于容纳较多的项目,且便 于整理、分类,缺点是繁琐。
4.其他内容
• 调查内容的时间特征; • 调查工作的时间限制; • 搜集数据的具体方法; • 调查的具体组织实施工作。
第三节 统计调查误差
一、统计调查误差的种类 登记误差;代表性误差
二、产生误差的客观原因
拟订调查项目时要注意几个原则:
- 调查项目要少而精; - 调查项目含义要明确; - 尽可能做到各个调查项目之间有一定的联系。
调查表是把所调查的内容具体化为一些明确的 项目或指标,并恰当排列制成表格。
调查表分为:
一览表
把许多调查单位和相应的项目按次序登记
在一张表格里。这便于汇总,但缺点是分 不开,故调查深度不够;
例,对一批灯泡的合格率进行调查, 应该采用抽样调查方式。
典型调查:先对总体进行分析,然后选择 有代表性的单位进行调查。
例,选取部分企业进行调查,以了解企业 股份制改革后的成果及问题。
三 统计调查的设计(即统计调查方案)
1.确定调查的目的 —— 即为什么调查
2.确定调查对象和调查单位 —— 即向谁做调查
统计分组可以按分组的任务和作用、分组标志 多少以及分组标志的性质等方面进行分类。
(二) 统计分组的类型
1.按分组标志的特征不同分为 : 品质标志分组 —— 反映事物属性差异
- 简单分组。如人口按性别分组。 - 复杂分组,亦称分类。如人口按职业分组。
数量标志分组 —— 反映事物数量差异
- 单项式数量分组 —— 运用于变量变动幅 度小、项目少的分组。
最小值5,怎样分组?
(a)
(b)
(c)
3-8
4-9
5-10
8-13
9-14
10-15
13-18
14-19
15-20
18-23
19-24
20-25
23-28
24-29
25-30
28-33
29-34
30-35
33-38
34-39
35-40
按分法(a)较合适
对连续变量,组数也要连续。在登记次数 时,习惯上遵守: 上组限不在内
二 统计分组
1.概念 把同质总体中的具有不同特点的 单位分开,从而正确地认识事物 的本质及其规律性。
2.分组的关键:
选择恰当的分组标准 准确地划分组的界限
统 计 分 组 根据统计研究任务的要求和现 象的内 的 意 义 在特点,把统计总体按照某一标志划
分为若干性质不同又有联系的几部分, 称为统计分组。
现在举例说明变量数列编制的过程。例如根据 抽样调查,1995年某城镇50户居民家庭平均每 人每月生活费收入的资料如下:
• 3670 3220 2940 2730 2370 3980 3270 2980 2760 2460 3110 3550 2400 2750 2960 3240 3820 2290 2640 2880 2350 2710 2910 3190 3600 2260 2620 2860 3090 3520 3370 2220 2600 2840 3040 3430 2170 2590 2830 3030 2000 2530 2810 3010 3290 2120 2570 2810 3030 3320
• 原始资料:是通过统计调查或试验所取得的统计资料, 都属于第一手资料;
• 次级资料:来源与别人通过统计调查或试验所取得并 已经加工整理过的统计资料,都属于第二手资料。
• 原始资料的收集方法:
1 访问调查
2 电话调查
3 邮寄问卷
4 观测
5 互联网调查
三、搜集资料的注意事项
• 1 涉及范围要适度 • 2 事先进行规划 • 3 注意版权问题
统计整理是根据统计研究任务的要 求,对调查所搜集到的原始资 料进行分组、汇总,使其条理 化、系统化的工作过程。
第四节 统计数据的整理
一 统计数据整理的意义和步骤
1.目的 数据简单化、系统化。 2.方法 分组
3.步骤:
对原始资料进行审核; 对原始资料进行分组和汇总; 经汇总结果用统计表或统计图的方式表现出来, 为统计资料的使用和分析做好准备。
56-60
2
60-100
38
合计
40
若把上表改变为如下统计表,则基本上能准确反 映总体的分布特征。
某班学生统计学考试成绩表
考试成绩(分) 人数(人) 比重(%)
50-60
2
5.0
60-70
7
17.5
70-80
11
27.5
80-90
12
30.0
90-100
8
20.0
合计
40 100.0
2.分组组距和组中值
• 计算全距。3980-2000=1980
根据这50户居民家庭人均月生活费收 入序列化后所呈现出一定规律性的认识,参 照上面所说一系列分组方法的原理,我们假 定把变动全距分为8个相等的组距,
则组距为:
1980/8=247.5元,化整为250元。
这里第一组的下限应为2000元,于是上下限 化 整 为 2000—2250 元 , 2250—2500 元……。分组情况见下表:
按报送周期长短不同统计报表分为:
日报
旬报
定期报表月季报报
半年报
年报
2. 专门调查 分为普查、重点调查、抽样调查、典型调查。
普查为全面调查,后三者为非全面调查。
普查:为专门组织的一次性调查,用来调查 属于一定时点的社会现象的总量。
例: 每5年进行一次的经济普查,包括工业普 查、三产普查、基本单位普查、建筑业普 查。这种普查制度在周期安排上和国家编 制五年计划相衔接。
35.3
2500 以上
133
25.1
合计
530
100.0
组别(变量) 次数(频数) 频率(比率)
(二) 数量分组的次数分布
组限 组距两端的数值。分为上限和下限。
组距 某一组的上限和下限的距离,分等距
和异距。 组距=上限-下
全距 分组数列中最限大值的上限与最小值的
下限之差。
等距数列的组距
全距R 组数
客观随机性 操作不当 计算中的舍入错误 故意制造的误差
第三节 统计调查误差
三、怎样看待误差
第一,误差降低了统计数据的质量。 第二,误差是难以避免的。 第三,人们对准确性的要求是相对。 第四,追求过高的准确性往往得不偿失。
第四节 统计数据的整理
一 统计数据整理的意义和步骤
统计调查搜集上来的资料,不论是 哪一种类型的资料都必须经过 整理才能进一步进行分析。资 料的类型不同,研究的目的不 同,资料整理的方法也不同。
组中值 组的上限和下限的中间值。
因数列两端组限形式不同分: 开口式组距:最低组与最高组不封口。例:
成绩60分以下,90分以上。
闭口式组距:例40-60分,90-100分。
1.分组方法
例 若将考试成绩仅分为不及格与及格两组, 则可编成如下组距数列:
某班学生统计学考试成绩表 考试成绩(分) 人数(人)
调查对象就是我们需要进行研究的总体范围, 即调查总体。它是由性质相同的许多调查单 位所组成的。 作为调查单位乃是进行登记的标志表现的直 接承担者。例:人口普查的调查单位是每一 个人
3.调查内容和调查表 —— 即用什么方法调查
调查活动的核心是要进行调查的内容, 也就是需要想调查单位了解的情况和问题。
请看目前:
各国企业和研究机构全年 投资于每个消费者的平均调查费
单位:美元 英国22.9
美国16.5
日本8 中国0.1
统计资料的三个基本性质: 数量性 总体性 客观性
二 统计资料的搜集
准确性
及时性
准确性要求和及时性要求是相互结合相互依 存的,及时性在准确性要求的前提下才有意 义,而准确性也不能损害及时性的要求。
重点调查:对重点单位进行调查。重点单位指 的是这些单位数占总体的很少部分,而研究 的标志总量占绝大部分(或绝大比重)。
例:某地区为了掌握该地区水泥生产的质量 情况,拟对占该地区水泥总产量80%的五个 大型水泥厂的生产情况进行调查,属于重点 调查。
抽样调查:按随机原则从总体中抽取一 部分单位进行调查。
有何作用?
有哪几种类型?
重点调查与典型调查
二者共同点 都属于非全面调查
重点调查的目的是反映总体的基本情况
二 调查目的不同
者
典型调查的目的是推算总体的数量特征
区
别 选择调查单位的方法不同
重点调查
典型调查
根据客观标准 选择重点单位
在对现象分析的基础上 有意识地选择典型单位
1. 统计报表
统计报表分为: 基本统计报表 专门统计报表