第二章 统计数据的收集整理与显示
统计学第二章 统计数据的收集、整理与显示试题及答案
第二章统计数据的收集、整理与显示二、单项选择题1、人口普查的调查单位是(C )。
A、每一户B、所有的户C、每一个人D、所有的人2、对一批商品进行质量检验,最适宜采用的调查方法是(B )。
A、全面调查B、抽样调查C、典型调查D、重点调查3、下列调查中,调查单位与填报单位一致的是(D )。
A、企业设备调查B、人口普查C、农村耕畜调查D、工业企业生产经营现状调查4、抽样调查与重点调查的主要区别是(D )。
A、作用不同B、组织方式不同C、灵活程度不同D、选取调查单位的方法不同5、先对总体中的个体按主要标志加以分类,再以随机原则从各类中抽取一定的单位进行调查,这种抽样调查形式属于( D )。
A、简单随机抽样B、等距抽样C、整群抽样D、类型抽样6、对某省饮食业从业人员的健康状况进行调查,调查单位是该省饮食业的(D )。
A、全部网点B、每个网点C、所有从业人员D、每个从业人员7、调查时限是指(B )。
A、调查资料所属的时间B、进行调查工作的期限C、调查工作登记的时间D、调查资料的报送时间8、对某市全部商业企业职工的生活状况进行调查,调查对象是(B )。
A、该市全部商业企业B、该市全部商业企业的职工C、该市每一个商业企业D、该市商业企业的每一名职工9、作为一个调查单位(D )。
A、只能调查一个统计标志B、只能调查一个统计指标C、可以调查多个统计指标D、可以调查多个统计标志10、某市规定2018年工业经济活动成果年报呈报时间是2019年1月31日,则调查期限为( B )。
A、一天B、一个月C、一年D、一年零一个月11、统计分组对总体而言是( B )A、将总体区分为性质相同的若干部分B、将总体区分为性质不同的若干部分C、将总体单位区分为性质相同的若干部分D、将总体单位区分为性质不相同的若干部分12、按某一标志分组的结果表现为( B )A、组内差异性,组间同质性B、组内同质性,组间差异性C、组内同质性,组间同质性D、组内差异性,组间差异性13、设对某地区的人口按年龄分组如下:不满周岁,1—3岁,4—6岁,7—12岁,……60—64岁,65—79岁,80—99岁,100岁以上,最后一组的组中值近拟为( C )A、110岁B、104岁C、104.5岁D、105岁14、为充分利用所得到的原始资料以取得大量统计指标,在统计整理时关键是要( C )A、进行各种汇总B、进行各种计算C、充分利用分组法D、对原始资料进行分析15、按变量的性质和数据的多少划分,变量数列可分为( C )。
统计学 第二章 统计数据的搜集、整理和显示
(二)实验方式
所谓实验方式,就是运用自然科学的试验 法,通过观测人为安排条件下试验产生的各种 结果并加以记录的方式来获取数据,或通过人 为安排条件下的试验来探求某个或某些因素对 所研究事物的数量影响程度和作用方式,凭借 实验结果来揭示所考察因素与所研究事物之间 的数量因果关系。
1、实验的原则
运用实验方式需要遵循下列两个原则:均衡分散
1、普查
普查是根据特定的统计研究目的而专门组织的 一次性的全面调查,用以收集所研究现象总体的全 面资料(即总体中的所有个体都是观测单位)。 普查的组织方式一般有两种:一是建立专门的 普查机构,配备一定数量的普查人员,对观测单位 直接进行登记。如我国历次的人口普查等。二是利 用观测单位的原始记录和核算资料,颁发调查表, 由观测单位按要求填报。如物资库存普查等。
重点调查的单位可以是一些企业、行业、 也可以是一些地区、城市。此种调查方式的优点是, 所投入的人力、物力少,而又较快地搜集到统计 信息资料。一般来讲,在调查任务只要求掌握基 本情况,而部分单位又能比较集中反映研究项目 和指标时,就可以采用重点调查。
在下列问题中为了得到数据,采用什么调查? • 为了买校服,了解每个学生衣服的尺寸。 • 商检人员在某超市检查出售的饮料的合格率。 • 对占全市工业总产值五分之一的六个大型企 业进行调查,以了解全市工业总产值的基本 情况。
观测性误差
数 据 收 集 误 差
也叫登记性误差或调查性误差,它 是在调查观测的各个环节因工作粗 心或被观测者不愿很好配合而造成 的所收集数据与实际情况不符的误 差,包括计量错误、记录错误、计 算错误、抄写错误、汇总错误、计 算机输入误差等工作误差,以及被 调查者不愿或难以提供真实情况的 误差,有时还存在调查人员弄虚作 假的误差和各种人为因素干扰的误 差。 这部分误差通常是人为造成的,通 过对统计调查资料的严密审核,是 可以发现并加以更正的。观测性误 差则可能存在于任何统计调查。 因样本不能完全代表总体而产生 的估计结果与总体真实数量特征 不符的误差。根据样本不能完全 代表总体的原因不同,代表性误 差又分为系统性代表性误差和偶 然性代表性误差两种。
第二章 统计数据的搜集整理和显示
同时
变量的不同取值个数较少 具备
44
《统计学》第二章 统计数据的搜集、整理和显示
表2 某厂第二季度工人平均日产量
STAT
工人平均日产量
工人数
(件)X
(人) f
2
10
3
15
4
30
5
40
6
20
合计
115
45
《统计学》第二章 统计数据的搜集、整理和显示
②组距式分组
STAT
每个组的变量值用一个区间来表现。
抽样调查的应用范围
(1)在实际工作中不可能进行全面调查而又需STAT 要了解其全面资料的事物时。 (2)有些资料虽可以进行全面调查,但比较困 难或并不必要。 (3)对普查或全面调查统计资料的质量进行检 查和修正。 (4)可以应用于生产过程中产品质量的检查和 控制。 (5)可以用于对总体的某种假设进行检验。
返回 40
《统计学》第二章 统计数据的搜集、整理和显示
(二)统计分组的方法
STAT
1、分组标志的选择 2、统计分组的方法阐述 (1)品质分组 (2)数量分组 3、组限、组距、组数和组中值的计算
返回
41
《统计学》第二章 统计数据的搜集、整理和显示
1、分组标志的选择
STAT
统计分组的关键: 要选择适当的分组标志。
(二) 统计调查方案设计 STAT
1、确定调查目的 2、确定调查对象和调查单位 3、确定调查项目 4、设计调查表格和问卷 5、确定调查时间和调查期限 6、确定调查的组织实施计划
8
《统计学》第二章 统计数据的搜集、整理和显示
1、确定调查目的
STAT
明确为什么要进行调查, 调查要解决什么样的问题。
西南财经大学向蓉美、王青华《统计学》第三版——第2章:统计数据的收集、整理与显示
– 调查内容详细、提供重要国情国力资料、数 据的规范化程度较高
提供抽样框
总
– 特别注意
体
• 必须规定标准时间 • 在规定时间内统一进行
• 基本内容和指标解释统一并相对稳定
• 需要PPT配套视频,请加VX:1033604968 11
Statistics
2.统计报表 –概念 • 按照国家有关法规的规定、自上而下地统一 布置、自下而上地逐级提供基本统计数据。 –特点 • 全面性、稳定性、连续性、可比性 • 曾经是我国数据收集的主要方式 • 耗费大、数据质量差等等。
3
Statistics
§2.1.2 统计调查方案
调查方案的内容
调
调查
调查
查
对象
项目
其
目
调查
和调
的
单位
查表
他
4
Statistics
1.确定调查目的
调查要达到的具体目标 回答“为什么调查?” 调查之前必须明确
5
Statistics
2.确定调查对象和调查单位
调查对象:调查研究的总体或调查范围 调查单位:需要对之进行调查的单位。可以是调查
12
Statistics
第二次全国经济普查的标准时点是2008年12月31日,时
期资料为2008年度。
第六次quanguo人口普查
主要目的:人口普查是一项重大的国情国力调查。组织开
展第六次全国人口普查,将查清十年来我国人口在数量、结构、
分布和居住环境等方面的变化情况,为科学制定国民经济和社
会发展规划,统筹安排人民的物质和文化生活,实现可持续发
重点单位——标志值在总体标志总量中占有 较大比重的单位
统计学第二章数据搜集整理
普查的规定
• • • • 规定统一的调查项目 规定统一的标准时点 规定统一的普查周期 例如:第六次人口普查,调查表,性别、年龄、 民族、受教育程度、行业、职业、迁移流动、社 会保障、婚姻生育、死亡、住房情况等 • 截止时间,标准时点是2010年11月1日零时 • 人口普查的周期是10年,2000年,2010年
频率
fi
fi
fi :第i组频数
32
(2)频率的性质 (A )
0
fi
1 fi
(B ) (3)频数密度与频率密度(消除异距分组对频数影响) (A) (2.7) 频数密度=频数/组距 (B) (2.8) 频率密度=频率/组距 各组频数密度与各组组距乘积之和等于总体单位数,各 组频率密度与各组组距乘积之和等于1.
29
组数的确定(H.A.Struges经验公 式)
•
n = 1 + 3.3logN
N – 24 – 44 – 89 – 170 – 359 n 5 6 7 8 9
(斯特杰斯)
• • 15 • 25 • 45 • 90 • 180 • 组距=
30
四、频数(次数)分布
1.频数分布的基本理论
(1)频数分布的定义 在统计分组的基础上,将总体所有单位按某一标志 归类排列,并计算其相应出现的次数。 频数分布是统计整理的重要形式,通过对零乱的、 分散的原始资料进行有次序的整理,形成一系列反映 总体各组之间单位分布状况的数列,即分布数列。
10
• 概率抽样的特点: 1、样本单位按随机原则抽取,排除了主观因素对 选样的影响。 2、根据部分调查的实际资料对调查对象总体的数 量特征作出估计。 3、抽样误差可以事先计算并加以控制。 • 抽样调查的适用场合
统计数据的收集整理和显示总结 PPT课件
样本 21 12 13 16
7 69
大四 女生 总体 105 64 44 126
22 361
样本 21 13 9 26
5 74
▪ 九、组员及组员分工
▪ 组长:万海峰
▪ 组员:曾福星 胡远洲 万山 陈丽珍 张焕娟
▪ 分工如下表所示:
▪ 组员分工
▪ 曾福星 胡远洲
设计、发送调查问卷
▪ 陈丽珍 张焕娟
★ 三、统计调查的组织形式
四、统计调查体系 五、次级资料的收集
全面统计报表
全面调查
调查
范围
非全面调查统计 Nhomakorabea调 查
连续调查 调查
组 织
时间
不连续调查
形
式
组织 定期报表
形式
专门调查
普查 抽样调查 重点调查 典型调查
周期性调查
一次性调查
普查
抽样调查
返
重点调查
回
普查
指国家为详尽了解某项重要的国情 国力而专门组织的一次性全面调查
数据来源
Data Sources
数据 来源
直接来源
间接来源
试验
问卷调查
观察
出版物 (或者网上)
➢直接向调查对象搜集反映调查单位的统计资料 的(第一手资料或原始资料)方法称为统计调查。 ➢搜集已经加工整理过的、说明总体现象的资料 (次级资料或第二手资料)不是统计调查。
统计调查是整个统计认识活动的基础, 决定着统计认识过程及其结果的成败
第一节 统计调查
一、统计调查的基本理论
★ 二、统计调查方案的设计
三、统计调查的组织形式 四、统计调查体系 五、次级资料的收集
(一)明确调查目的(Why) [例]人口普查:准确查清人口的数量、地区分布、
第2章 数据收集、整理与显示
4、定比尺度 定比尺度又称比率尺度,它是对事物之间比值的一种测 度。其功能要比定距尺度更强一些,除能区分类别、排 序、比较大小、求出大小差异、可采用加减运算以外, 还可以进行乘除运算; 在计量尺度的应用中,需要注意的是,同类事物采用不 同的尺度量化,会得到不同的尺度数据。如农民收入数 据按实际填写就是定距尺度;按高、中、低收入水平分 就是定序尺度;按有无收入计量则是定类尺度;而说某 人的收入是另一人的两倍,便是定比尺度了。
随着社会主义市场经济的建立与完善,抽样调查在我国 统计调查中的应用领域越来越广泛。
18
(四)重点调查
重点调查是指在调查对象中,只选择少数重点单位进 行的非全面调查。所谓重点单位,是着眼于现象的量的方 面而言,尽管这些单位在全部单位中只是一部分,但它们 在所研究现象的标志总量中却占有绝大的比重,在总体中 具有举足轻重的作用。 (五)典型调查 有意识地选择若干个具有代表性的典型单位进行深入、 周密、系统地调查研究。典型调查的主要目的不在于取得 总体数值,而在于了解与数字相关的生动具体情况。
3.统计分组的原则
穷尽原则,就是使总体中的每一个单位都应有组可归,或 者说各分组的空间足以容纳总体所有的单位。 互斥原则,就是在特定的分组标志下,总体中的任何一个 单位的只能归属于某一组,不能同时归属于几个组。
典型调查
具体的统计调查形式
(一)普查
普查是专门组织的一种全面调查。普查一般是调查 属于一定时点上的社会经济现象的总量,但也可以调查某 些时期现象的总量,乃至调查一些并非总量的指标。 (二)统计报表制度
统计报表制度是我国统计调查方法体系中的一种重 要的组织方式。它是根据国家的统一规定,按统一的表格 形式,统一的指标内容,统一的报送时间,自下而上逐级 提供统计资料的统计报告制度。
第二章统计数据的搜集、整理与显示1
统计数据的搜集、整理与显示
三、统计调查体系
统计调查体系
一个国家开展统计调查方法和制度的总称。
我国的统计调查体系:
建立以必要的周期性的普查为基础,经常性的抽 样调查为主体,同时辅之以重点调查、科学推算和部 分全面报表综合运用的统计调查方法体系。
统计数据的搜集、整理与显示
四、调查方案的设计
在一项统计调查工作开始以前,应该做好各种准备工作, 设计出一个切实可行的统计调查方案,使调查工作有组织、有 计划地进行,从而达到预期的目的。一个完整的统计调查方案 应包括以下几方面的内容:
表现形式:
表头 调查表 表体 表外附加 调查问卷:用来收集数 据的一种工具
列出调查项目的表格形式就是调查表。
统计数据的搜集、整理与显示
在拟定调查项目时,要注意下列问题
(1)调查项目要少而精,只列入为实现调查目的所必
1953年的人口普查,项目为4项,全国人口总数为58260万余人 1964年的人口普查,项目为7项,全国人口总数为69122万余人 1982年的人口普查,项目为19项,全国人口总数为103188万余人 1990年的人口普查,同国际接轨,全国人口总数为113051万余人 2000年的人口普查,全国人口总数为129533万余人 2010年的人口普查,全国人口总数为137053万余人
面获得第一手资料 调查单位少,能深入全 特点有意识选出的单位具有 较高的代表性 机动、灵活、省人、省 力
统计数据的搜集、整理与显示
2)典型单位的选择
在统计调查中使用典型调查方式时,对于典型单位的 确定,应注意以下几点:
① 选择典型应从实际出发,结合有关专业知识,对 调查对象进行全面分析。
统计数据的搜集、整理与显示
经济统计 lcg 第二章 统计资料的收集、整理与显示
(三)抽样调查 1. 抽样调查是一种非全面调查。它是按随机 原则从总体中抽取一部分单位作为样本进行 观察,然后根据样本指标值去推算调查对象 的总体指标的一种调查。 随机原则,排除主观因素的影响。 (1)每个单位有相同的中选可能性。 (2)每个单位的中选不中选不是主观所决 定的。
不抽烟不喝酒林彪同志63岁 不抽烟只喝酒恩来同
例如:要了解全国钢铁企业的生产状况,可以选择产量 较大的少数几个企业,如邯钢、宝钢等,作为重点单位 进行调查,以便对钢铁产量有一个大致了解。
(五)典型调查: 根据调查目的和任务,对所研究的现象 总体进行初步分析的基础上,有意识的选取若干具有代表性 的单位进行调查和研究,借以认识事物发展变化的规律。 典型调查单位的确定与其他非全面调查相比较,更多地取决 于调查者主观的判断与决策。 特点:(1)专门组织的非全面调查。(2)主观性。 例如:要研究工业企业的经济效益问题,可以在同行业中选 择一个或几个经济效益突出的单位作为典型,做深入的调查, 从中找出经济效益好的原因和经验。 重点调查是选取一部分重要样本进行调查,这些重要样本在 量的方面占优势;而典型调查是有目的的选取有代表性的样 本进行调查,侧重该样本的质的方面!
2.确定调查对象、调查单位和填报单位
解决向谁(who)调查?由谁来具体提供资料? 调查对数,指需要调查的现象总体,该总体是性 质相同的许多调查单位组成。 调查单位,是指所要调查的具体单位,它是进行 调查登记的标志的承担者。(可以是个人、单位 也可以是物) 报告单位亦称填报单位,一般是在行政上,经济 上具有一定独立性的单位。 调查单位与报告单位的关系(见第7题和第8题) 例如:调查河南省乡镇企业经营状况。 调查对象:全省所有的乡镇企业;调查单位:每个 乡镇企业;填报单位:每个乡镇企业 例如:进行工业设备普查。报告单位是 设备管理部 门,调查单位是单台设备。
第二章统计数据的收集、整理与显示
2019/9/7
版权所有 BY 统计学课程组
7
对于某些特定行业的数据,如证券业数据,我们 可以从各证券报、中国证券监督管理委员会、上海证 券交易所、深圳证券交易所、各证券公司等单位的网 站数据库和出版发行的刊物中取得有关数据。各上市 公司的季报、半年报、年报中的各种数据属于公开数 据,可以直接使用,但如果存在后续的补充报告,在 使用时应该及时调整。
2019/9/7
版权所有 BY 统计学课程组
19
(一) 统计调查方式(9)
抽样调查主要应用于以下几个方面: (1) 当不可能进行全面调查时,只能采用抽
样调查来推断总体数量特征。 (2) 不必要进行全面调查时,以相对很少的
代价进行抽样调查就可以满足需要。 (3) 当来不及进行全面调查时,采用抽样调
2019/9/7
版权所有 BY 统计学课程组
22
访问调查法
按照调查对象的不同,访问调查 可分为居民入户调查和个别采访两 种。
按照对调查过程控制程度的不 同,访问调查又可分为非标准式访 问和标准式访问两种。
2019/9/7
版权所有 BY 统计学课程组
23
2.问卷调查法
问卷的形式是一份预先精心设计好的问题表格,
进行统计调查? 3.数据资料怎样整理和展示?
2019/9/7
版权所有 BY 统计学课程组
4
第一节 统计数据的收集
一、间接数据的来源 二、直接数据的来源
2019/9/7
版权所有 BY 统计学课程组
5
一、间接数据的来源
间接数据主要是从公开渠道获 得的数据,如公开出版的报纸、书 籍及相关网站中的数据,有些未公 开的数据在获得数据所有者允许的 情况下也可以使用。
管理统计学 第2版 第二章 统计数据的收集整理与显示
(4)系统抽样
首先将总体中各 单位按一定顺序 排列,根据样本 容量要求确定抽 选间隔,然后随 机确定起点,每 隔一定的间隔抽 取一个单位的一 种抽样方式。是 纯随机抽样的变
种
最主要的优势就 是经济性。最大 的缺陷在于总体 单位的排列上。 一些总体单位数 可能包含隐蔽的 形态或者是“不 合格样本”,调 查者可能疏忽, 把它们抽选为样
• 普查需要规定标准的时点:如第五次人口普查规定的标准时间 为2010年11月1日零时为标准时间。
统计报表
• 统计报表是按照国家有关的规定,自上而下同一布置,自下而上逐级 提供统计资料的调查组织方式。
• 统计报表是我国特有的一种统计调查方式,是建立在各基层单位原始 记录的基础上的一种统计调查方式,由于统计报表是逐级上报和汇总 的,有利于各级部门了解本地区、本部门或本行的的社会和经济发展 现状。
2.1 统计数据的收集
数据的来源
• 间接来源 研究者直接从公开出版物或通过网络渠道获取
所需数据,如《中国统计年鉴》、《中国统计摘 要》、《中国社会统计年鉴》 • 直接来源
研究者直接通过调查取得研究所需数据资料
2.1 统计数据的收集
普查
常用的统计 调查方式
抽样调查
重点调查
典型调查
简单随 机抽样
分层抽样
抽样调查
• 抽样调查是取得数据资料的最主要的一种方式,它是按照 随机原则从总体中抽取部分单位组成样本,对样本指标进 行测定,根据样本指标推断总体指标的一种非全面调查。
抽样调查的具体组织形式 抽样调查
简单随 机抽样
分层抽样
等距抽 样
整群抽样
(1)简单随机抽样
从总体N个单位中任意抽取n个单位作为样本, 使每个可能的样本被抽中的概率相等的一种 抽样方式
第二章数据收集、整理与显示
第二章数据搜集、整理与显示Ⅰ.学习目的本章阐述统计数据搜集、整理与显示的理论与方法,通过学习,要求:1.了解统计数据的类型及其搜集方法;2.了解普查、统计报表、抽样调查、重点调查等各种统计调查组织形式的特点及其适用场合;3.掌握统计分组方法;4能够编制分布数列;5.能够运用各种统计图表。
Ⅱ.课程内容要点第一节数据的搜集一、数据搜集数据是人们对现象进行调查研究所搜集、整理、分析和解释的事实和数字,是对客观现象进行计量的结果。
数据搜集就是根据统计研究预定的目的和任务,运用相应的科学的调查方法与手段,有计划、有组织地搜集资料的过程。
数据的计量尺度有四种定类尺度是按照某种属性对客观事物进行平行分类或分组的一种测度,定类尺度的值是以文字表述的,可以用数值标识,但仅起标签作用。
定序尺度是把各类事物按一定特征的大小、高低、强弱等顺序排列起来,构成定序数据。
它是对事物之间等级或顺序差别的一种测度。
定序尺度不仅可以测度类别差,还可以测度次序差,并可比较大小,但其序号仍不能进行加减乘除计算。
定距尺度是对事物类别或次序之间间距进行的一种测度。
定距尺度不仅能区分事物的类别、进行排序、比较大小,而且可以精确地计量大小的差异,可以进行加减运算,没有绝对零点。
定比尺度是对事物之间比值的一种测度,定比尺度能区分类别、排序、比较大小、求出大小差异、可采用加减乘除运算,具有绝对零点。
从不同方面数据划分为不同类型。
根据数据反映的现象的特征不同,可以归结为两类:品质数据(亦称定性数据)和数量数据(亦称定量数据)。
品质数据是由定距尺度和定比尺度计量所形成的数据,数量数据是由定距尺度和定比尺度计量所形成的数据。
根据数据反映的现象的时间不同,可以将数据分为横截面数据和时间序列数据。
横截面数据是指在同一时间对同一总体内不同单位的数量进行观察而获得的数据。
时间序列数据是指在不同时间对同一总体的数量表现进行观察而获得的数据。
根据数据的搜集方法,可以将数据分为观察数据和实验数据。
统计学第二章
第二章统计数据的收集、整理与显示2.1统计数据的收集一、统计数据的来源1、直接来源(原始来源):分为实验和统计调查(直接观察、报告、采访、登记)2、间接来源(二手资料):出版物、网络二、统计调查组织方式1、分类①按调查单位的范围大小分:全面调查和非全面调查②按调查时间是否连续分:经常性调查和一次性调查③按调查组织方式分:统计报表和专门调查。
其中专门调查又分为普查、重点调查、典型调查、抽样调查2、统计报表制度:按照国家统一规定的各项要求,自下而上地定期向国家和主管部门报送基本统计资料的一种报告制度①优点:能保证统计资料的全面性和连续性;能保证统计资料的统一性和及时性;能满足各级部门对统计资料的需要②缺点:统计报表过多会增加基层负担;有可能由于虚假瞒报而影响统计资料质量3、普查:是指国家为详尽了解某项重要的国情国力而专门组织的一次性全面调查(主要用于搜集时点资料)①作用:可以为抽样调查提供抽样框;可以收集统计报表所不能提供的反映重大国情国力的基本统计信息②局限:由于需要大量的人力、物力、财力,不宜经常进行4、重点调查:是指为了解总体基本情况,在调查对象中只选择一部分重点单位进行调查的一种非全面调查组织方式。
(这些单位数目不多,但其标志值在总体标志总量中占有较大比重,能反映总体的基本情况)①作用:能以较少的投入和较快的速度取得总体基本情况及变动趋势的资料②局限:只适用于客观存在重点单位的情况5、典型调查:是指在对调查对象有一定了解的基础上,有意识的选择少数典型单位进行调查的一种非全面调查方式。
(指在数量表现上具有普遍意义呵呵代表性的总体单位,可以用来推断总体的数量)①作用:一定条件下能估计总体指标数值;可以用来研究新生事物②缺陷:不能确定推断的把握程度,无法计算和控制推断误差6、抽样调查:是指按照随机原则从调查对象中抽取一部分样本单位进行调查,再用样本资料推断把握总体的数量特征的一种非全面调查组织方式。
统计学 2统计数据收集、整理与显示
2021/5/4
精品文档
11
(2)普查的基本形式
普查的基本形式有两种: 一种是设立专门的普查机构,配备一定的 普查人员,对调查单位直接进行登记,如 历次全国人口普查就是采用这种形式;
另一种是利用企事业单位的原始记录 和核算资料,设计一系列调查表,这些基 层报告单位根据普查的要求自行填报,如 全国科技人才普查即是如此。
统计调查方式
普
抽
统
重
典
样
计
点
型
查
调 查
报 表
调 查
调 查
2021/5/4
精品文档
9
1 普查 (census)
(1)概念:普查是国家为了详细地了解某 项重要的国情国力而专门组织的一次性 全面调查,主要用来调查属于一定时点 上现象的总体特征,如全国人口普查、 经济普查、农业普查等。
相对于全面统计报表,普查能取得内容更详
年计 鉴年
鉴
6. 检验和回答某些疑问和假设
7. 寻找研究问题的思路和途径
8. 收集次级统计数据在研究中应优先考虑
返回
2021/5/4
精品文档
6
2.1.1.2 应用中要注意的问题
(1)应根据研究目的选择次级数据; (2)注意次级数据变量名称的含义是否发生过变化。 随着历史的变迁,有些次级数据变量名称的内涵或 外延发生了变化,在采用数据时应该进行调整; (3)注意次级数据的计算口径和计算方法是否一致; (4)注意尊重次级数据所有者的权益。 一是要合法采用次级数据; 二是要注明数据的来源出处,这样既尊重他人的劳 动成果,又便于阅读者核实。
2021/5/4
精品文档
返回
7
2.1.2 初级统计数据的来源
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5.统计报表是按照国家有关法规的规定,自上而下地 逐级提供统计数据的一种调查方式。 特点:是由政府部门组织、采用统一的表格、自上而下 布置、自下而上报告。统计报表是经常性的全面调查。 种类: (1) 调查范围:全面报表、非全面报表 全面报表:要求调查对象每一个单位都填报。 非全面报表:要求调查对象中的部分单位填报。 (2) 内容和实施范围:国家/部门/地方统计报表 (3) 报送周期长短:日报、旬报、月报、季报、半年报、 年报 (4)报送单位不同:基层统计报表、综合统计报表。
表- 宿舍所住学生数的频数分布表
宿舍所住学生数/人
4 5 6 7 8 合计 频数/户 20 35 60 12 25 152 频率/% 13.16 23.03 39.47 7.89 16.45 100
2) 组距式频数分布 步骤:a 、分组 b 、统计出每组变量的频数,频率 c 、按各组组限的大小顺序列出组距式变量数列 d 、给出频数分布表
数据,称为实验数据
收集数据的要求:准确、及时 拟定统计调查方案:确定统计调查的目的、调查的对象、 调查的项目等内容
2.1.1 统计调查方案的确定 1.确定调查目的(为什么调查) 2.确定调查对象和调查单位(向谁调查) 3.设计调查项目和调查表(调查什么) 4.方案设计中的其他内容(如何调查) 2.1.2 常用的统计调查方法
第2章 统计数据的收集整理与显示
2.1 统计数据的收集
2.2 统计数据的整理
学习重点
1、统计数据的搜集 2、分组的概念、特点和原则,分组的作用,能 熟练进行分组 3、频数分布的概念及其构成; 4、组限的表现形式及原则、组距和组中值的计算 5、统计表的含义及其构成,统计表的编制方法和原 则
本部分难点
2.1.4 统计数据的误差
统计数据的误差:指统计数据与客观现实之间 的差距。 研究误差的目的:找出导致误差产生的原因, 进而采取对策避免、减少误差或控制误差水平。 误差的主要来源:登记性误差和代表性误差。
1.登记性误差(非抽样误差)
登记性误差:人为因素所造成的误差。 调查者 规定或解释不明确导致的填报错误; 调查员粗心,记录出现错误; 调查员的态度、情绪以及责任心等。 被调查者 不理解规定或解释不明确导致的填报错误; 有意虚报或瞒报调查数据等。 注:登记性误差理论上讲是可以消除的。
(3)开口组:当变量值变动范围较大时,最小组为
“……以下”,或最大组为“……以上”。 如:2以下,[2,4),[4,6),[6,8),8以上
组中值的确定 组中值=(上限+下限 )÷2 开口组的组中值 =下限+邻组组距/2(缺上限) =上限-邻组组距/2(缺下限) 见例2.2-P39
2.2.2 频数分布 频数(frequency)=分布在各组内的数据个数. 频率 (percentage)=各组频数/全部频数之和 频数分布:在统计分组的基础上,将总体中所有的个体按 某一标志进行归类排序 2.2.2.1 频数分布表
1.调查方法的比较; 2. 统计分组的方法; 3.频数分布的编制; 4.组限的表现形式、组距和组中值的计算
?
§2.1 统计数据的收集
统计调查 :按照统计研究的任务,运用科学的 统计调查方法,有计划、有组织地 数据来源 向客观实际搜集资料的过程 科学实验 :在实验中控制实验对象而收集到的
2.代表性误差(抽样误差)
代表性误差:用样本数据推断总体时所产生的误差。 影响误差的主要因素 样本容量的大小:样本容量越大,代表性误差就越小 总体的离散程度的高低:总体中各个体间的差异越大, 抽样误差也就越大
注:代表性误差通常无法消除,但事先可以进行 控制和计算。
本节小结
统计数据搜集
统计调查涵义
统计报表
普
查
本节小结
统计数据搜集
重点调查
典型调查
抽样调查
本节小结
统计数据误差
登记性误差
代表性误差
2.2 统计数据的整理
整理数据的中心任务:分组/编制频数分布表。 2.2.1 统计数据分组 统计数据分组:就是根据统计研究的需要,将统计 数据按照一定的标志划分为若干组成部分的一种 统计方法。
品质标志 分组的标志: 数量标志
表2-1 问卷调查表
您的性别:1男生 您的职务:1主任 2女生 2组长
3教师
一.您认为目前教改阻力来自哪些单位?(可复选) A1 1教育行政单位 A11 2学校行政人员 A12 3家长团体 A13 4教师本身 A14 5其他团体 A15
二.您认为目前教改对哪些人会有影响?(可复选) A2 1教师 A21 2行政人员 A22 3学生 A23 4其他 A24
2 3 4 5 6 2 3 4 5 6 2 3 4 5 6 2 3 4 5 6 2 3 4 5 6 2 3 4 5 6 2 2 2 2 2 2 2 3 3 3 3 4 4 4 5
2) 组距式分组 组距式分组:将全部变量值依次划分为若干区间,并将 这一区间的变量值作为一组。 适用条件:连续变量/离散变量且变量值较多 组距: 等距分组: 适用于变量值的变动比较均匀 不等距分组: 适用于变动很不均匀,且变动幅度大 例:对学生成绩的分组可以分为0~20分、20~40分、 40~60分、60~80分、80~100组 等距分组 例:学生成绩分组也可分为0~60(D)、 60~80(C) 不等距分组 80~90(B)、90~100(A) 关键问题:分组数目的确定/组距的确定
A:您至今未买电脑的原因是什么?(单选不可以,多 选可以) (a)买不起(b)没有用(c)不懂(d)其它
(3) 无论多/单选题,任一个备选答案都不能有多 重含义。 A.您选择信息专业的目的是:
(a)自己喜欢,好就业(b)„„
(4) 无论多/单选题,备选答案之间不能有包含关 系。 A.您上大学的目的是:
调查方式/调查时间 调查的组织与实施
1.普查:是专门组织的一般用来调查属于一定时点上 社会经济现象数量的全面调查。 优点:全面、系统 缺点:只限于有限总体、工作量大、时间性强
2.重点调查:只在对象中选择一部分重点单位进行调查 以了解总体情况的一种非全面调查 优点:省时、省力、行全面分析的基础上,有 意识地选择部分有代表性单位进行调查 优点:调查范围小、省时省力、具体深入 人为选择的 缺点:具有主观性 典型单位 4.抽样调查:是从调查对象中随机抽取一部分单位作为 样本进行调查的一种非全面调查 优点:经济灵活、时效性强、适应面广和准确性高
2.按数量标志分组 数值型数据:主要是按照数值进行分组。 例:对学生成绩分组,可分为60分以下、60~70分、 70~80分、80~90分、90分以上5个组。
单项式分组 按数量标志分组的方法: 组距式分组
单项式分组:把每一个变量值作为一组。 适用条件:通常只适于离散变量且变量值较少的情况
组距的确定 组距=(最大值-最小值)÷组数。 组限的确定 (1)第一组的下限应略低于最小变量值,最后一组的上 限应高于最大变量值。
(2)对于离散型变量,相邻组的上下限可以不重叠;
如:2-4,5-6,7-8
对于连续型变量,相邻两组的上下限应重叠,用“上 限不在内”原则解决不重问题(左闭右开) 如:[2,4)[4,6)[6,8)
√您对它的服务质量是否满意?
例:您最常用的获取新闻的方式是什么?(只适合单选) 例:×最近您是否浏览过网站?
√今天您是否浏览过网站?
(3) 在问卷中的问题,必须是能够获得诚实回答的问题。 例: 你对本课程的任课教师是否满意?(实名调查) (4) 问题的不同提法,可能导致不同的回答结果。 例:1941年罗格(Rugg)进行的试验: A:您是否认为美国应该禁止反对民主的公开言论? B:您是否认为美国应该允许反对民主的公开议论? 调查结果:A54% “是” B75% “否”
2.1.3.2 问卷调查表的编码
1.单选题问卷调查表的编码 (1) 题号代号不能重复。 (2) 同一量表的题号最好有相同的识别码。 (3) 名义或类别问题的代号最好与其意义内涵有关, 以3~6个英文字母简写代表最好。 例:年龄为AGE,年级为YEAR,工作类别为JOB等, 学生性别为SEX,教育程度为EDU等。 2.复选题问卷调查表的编码。
等距分组的基本步骤: 数据排序 分组数目的确定 使每组所包含的数据个数,平均不少于4个或5个, 或采用斯特吉斯经验公式,即 k=1+3.322lgN k为组数;N为总体中的个体数。
表2-3 分组组数参考表 N k 15~24 5 25~44 6 45~89 7 90~179 8 180~359 9
2.1.3 调查问卷设计与问卷调查表的编码 2.1.3.1 调查问卷设计
1.问卷的基本结构
问卷是调查者根据调查目的和要求所设计的, 一般由开头部分、甄别部分、主体部分和背景部 分组成。
主体部分是调查问卷的核心内容, 它包括了所要调查的全部问题。
例:见P356
案例
2.设立问卷问题的注意事项
(1) 提问的内容尽可能短。 (2) 问题设计的用词要准确,用语要含义明确。 例:×您通常喜爱选购什么样的鞋? √您外出旅游时,会选购什么牌号的旅游鞋? 例:×您对它的价格和服务质量满意还是不满意? √您对它的价格是否满意?
表2-2 变量编码表
NUM SEX JOB A11 A12 A13 A14 A15 A21 A22 A23 A24
001
002
1
1
1
2
1
0
0
0
1
1
1
1
0
1
1
1
1
0
0
0
1
0
编码表说明:
NUM- 编码 SEX- 性别 jOB- 职务 A11~A15代表第一题中5个选项,选中者输入1, 未选中者输入0。 A21~A24代表第二题中4个选项,选中者输入1, 未选中者输入0。