统计学第二章数据的搜集
《统计学》第二章 统计数据的搜集、整理(1)
2.非全面调查 : 对调查对象其中的一部分单 非全面调查: 非全面调查 位进行调查。 1) 抽样调查 ) 抽样调查sampling, 是从调查对象中抽 , 取一部分单位作为样本进行观察,然后根据 所获得的样本数据,对调查对象总体特征作 出具有一定可靠程度的推算或对总体进行了 解。 A)特点: 特点: 特点 第一,按随机原则抽取样本。 , 第二, 第二 , 根据部分调查的实际资料对调查对象 总体的数量特征作出估计(统计推断)。 第三, 第三,抽样误差可以事先计算并加以控制。
2.统计表的结构 统计表的结构(P41,表2-5) 统计表的结构 , 1) 从表式上看 ) 从表式上看,表格包括总标题、 横行标题、纵栏标题和指标数值四 个部分。 2 ) 从内容上看,统计表由主词栏和 2) 从内容上看 宾词栏两个部分组成。
(二)统计表的分类
1.按主词的结构分类 按主词的结构分类 1)简单表list 2)分组表 3)复合表 2. 按宾词设计分类 1)宾词简单排列表 2)宾词分组平行排列表。
(一)全面调查与非全面调查
1.全面调查是对调查对象的所有单位 全面调查是对调查对象的所有单位 一一进行调查。 一一进行调查。 1)普查 )普查census 普查是专门组织的一种全面调查,它 普查 主要是用以调查某些不能或不宜用定 期的全面报表搜集的统计资料。
普查的主要特点: 普查的主要特点: 第一,它是一次性(非连续性)的调 查,一般间隔较长时间。 第二,它是一种全面调查,可获得大 量详细、全面的资料。 例如,人口普查,经济普查
(二)统计分组的方法
1.品质分组的方法 品质分组的方法 2.数量分组的方法 数量分组的方法 1)应注意的问题: )应注意的问题: A)分组时各组数量界限的确定必须能反 映事物质的差别。 B)应根据被研究的现象总体的数量特征, 采用适当的分组形式,确定相宜的组距、 组限。
统计学第二章 统计数据的收集、整理与显示试题及答案
第二章统计数据的收集、整理与显示二、单项选择题1、人口普查的调查单位是(C )。
A、每一户B、所有的户C、每一个人D、所有的人2、对一批商品进行质量检验,最适宜采用的调查方法是(B )。
A、全面调查B、抽样调查C、典型调查D、重点调查3、下列调查中,调查单位与填报单位一致的是(D )。
A、企业设备调查B、人口普查C、农村耕畜调查D、工业企业生产经营现状调查4、抽样调查与重点调查的主要区别是(D )。
A、作用不同B、组织方式不同C、灵活程度不同D、选取调查单位的方法不同5、先对总体中的个体按主要标志加以分类,再以随机原则从各类中抽取一定的单位进行调查,这种抽样调查形式属于( D )。
A、简单随机抽样B、等距抽样C、整群抽样D、类型抽样6、对某省饮食业从业人员的健康状况进行调查,调查单位是该省饮食业的(D )。
A、全部网点B、每个网点C、所有从业人员D、每个从业人员7、调查时限是指(B )。
A、调查资料所属的时间B、进行调查工作的期限C、调查工作登记的时间D、调查资料的报送时间8、对某市全部商业企业职工的生活状况进行调查,调查对象是(B )。
A、该市全部商业企业B、该市全部商业企业的职工C、该市每一个商业企业D、该市商业企业的每一名职工9、作为一个调查单位(D )。
A、只能调查一个统计标志B、只能调查一个统计指标C、可以调查多个统计指标D、可以调查多个统计标志10、某市规定2018年工业经济活动成果年报呈报时间是2019年1月31日,则调查期限为( B )。
A、一天B、一个月C、一年D、一年零一个月11、统计分组对总体而言是( B )A、将总体区分为性质相同的若干部分B、将总体区分为性质不同的若干部分C、将总体单位区分为性质相同的若干部分D、将总体单位区分为性质不相同的若干部分12、按某一标志分组的结果表现为( B )A、组内差异性,组间同质性B、组内同质性,组间差异性C、组内同质性,组间同质性D、组内差异性,组间差异性13、设对某地区的人口按年龄分组如下:不满周岁,1—3岁,4—6岁,7—12岁,……60—64岁,65—79岁,80—99岁,100岁以上,最后一组的组中值近拟为( C )A、110岁B、104岁C、104.5岁D、105岁14、为充分利用所得到的原始资料以取得大量统计指标,在统计整理时关键是要( C )A、进行各种汇总B、进行各种计算C、充分利用分组法D、对原始资料进行分析15、按变量的性质和数据的多少划分,变量数列可分为( C )。
统计学第2章 统计数据的搜集、整理和显示
第二节 数据整理
三、统计指标
(二)统计指标的分类
1. 数量(总量)指标
作用:反映现象的总规模、总水平或工作总量 以绝对数表示(国内生产总值、人口总数、工资总额等) 分类 总体单位数、总体标志总量 时期指标、时点指标 实物指标、价值指标和劳动量指标
第二节 数据整理
三、统计指标
搜集数据的两条途径:统计调查 + 实验 统计调查 —— 调查数据;实验 —— 实验数据 1. 确定调查目的 2. 确定调查对象和调查单位 3. 确定调查项目 4. 调查表格和问卷设计(一览表、单一表,要求简明扼要) 5. 确定调查时间(调查时间、调查期限) 6. 确定调查的组织实施计划
(三)统计调查的方案设计
上限不在内
等距分组与异距分组
等距分组
各组的标志值变动都限于相同的范围 优点:便于计算、绘制统计图 适用场合
异距分组
第一,标志值分布很不均匀的场合 第二,标志值相等的量具有不同意义的场合 第三,标志值按一定比例发展变化的场合
品质分组 单项式分组 间断组距式分组 数量分组 组限 连续组距式分组 组距式分组 等距式分组
6组:530 530 530 540 620 620 620 620 720 720 7组:720 720 630 630 630 630 620 620 620 620
8组:650 650 650 650 650 650 650 650 650 650
提问:从上述资料中,同学们能否直接看出该车间总的生产完成
类型分组
“日产量”分组
500以下 500 500以上 合计
统计学 第二章 统计数据的搜集、整理和显示
(二)实验方式
所谓实验方式,就是运用自然科学的试验 法,通过观测人为安排条件下试验产生的各种 结果并加以记录的方式来获取数据,或通过人 为安排条件下的试验来探求某个或某些因素对 所研究事物的数量影响程度和作用方式,凭借 实验结果来揭示所考察因素与所研究事物之间 的数量因果关系。
1、实验的原则
运用实验方式需要遵循下列两个原则:均衡分散
1、普查
普查是根据特定的统计研究目的而专门组织的 一次性的全面调查,用以收集所研究现象总体的全 面资料(即总体中的所有个体都是观测单位)。 普查的组织方式一般有两种:一是建立专门的 普查机构,配备一定数量的普查人员,对观测单位 直接进行登记。如我国历次的人口普查等。二是利 用观测单位的原始记录和核算资料,颁发调查表, 由观测单位按要求填报。如物资库存普查等。
重点调查的单位可以是一些企业、行业、 也可以是一些地区、城市。此种调查方式的优点是, 所投入的人力、物力少,而又较快地搜集到统计 信息资料。一般来讲,在调查任务只要求掌握基 本情况,而部分单位又能比较集中反映研究项目 和指标时,就可以采用重点调查。
在下列问题中为了得到数据,采用什么调查? • 为了买校服,了解每个学生衣服的尺寸。 • 商检人员在某超市检查出售的饮料的合格率。 • 对占全市工业总产值五分之一的六个大型企 业进行调查,以了解全市工业总产值的基本 情况。
观测性误差
数 据 收 集 误 差
也叫登记性误差或调查性误差,它 是在调查观测的各个环节因工作粗 心或被观测者不愿很好配合而造成 的所收集数据与实际情况不符的误 差,包括计量错误、记录错误、计 算错误、抄写错误、汇总错误、计 算机输入误差等工作误差,以及被 调查者不愿或难以提供真实情况的 误差,有时还存在调查人员弄虚作 假的误差和各种人为因素干扰的误 差。 这部分误差通常是人为造成的,通 过对统计调查资料的严密审核,是 可以发现并加以更正的。观测性误 差则可能存在于任何统计调查。 因样本不能完全代表总体而产生 的估计结果与总体真实数量特征 不符的误差。根据样本不能完全 代表总体的原因不同,代表性误 差又分为系统性代表性误差和偶 然性代表性误差两种。
贾俊平《统计学》(第5版)章节题库-第2章 数据的搜集【圣才出品】
第2章 数据的搜集一、单项选择题1.二手数据的特点是( )。
A.采集数据的成本低,但搜集比较困难B.采集数据的成本低,搜集比较容易C.数据缺乏可靠性D.不适合自己研究的需要【答案】B【解析】二手数据是指与研究相关的原信息已经存在,只是对原信息重新加工、整理,使之成为进行统计分析可以使用的数据。
二手数据具有搜集方便、数据采集快、采集成本低等优点,但是得到的数据往往缺乏相关性。
2.从含有N个元素的总体中,抽取n个元素作为样本,使得总体中的每一个元素都有相同的机会(概率)被抽中,这样的抽样方式称为( )。
A.简单随机抽样B.分层抽样C.系统抽样D.整群抽样【答案】A【解析】分层抽样也称分类抽样,它是在抽样之前先将总体的元素划分为若干层(类),然后从各个层中抽取一定数量的元素组成一个样本。
系统抽样也称等距抽样,先将总体各素,直至抽取n个元素组成一个样本。
整群抽样是指先将总体划分成若干群,然后以群作为抽样单元从中抽取部分群组成一个样本,再对抽中的每个群总包含的所有元素进行观察。
3.从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二个元素,直至抽取n个元素为止,这样的抽样方法称为( )。
A.重复抽样B.不重复抽样C.分层抽样D.整群抽样【答案】A【解析】重复抽样又称放回式抽样,是指每次从总体中抽取的样本单位,经检验之后又重新放回总体,参加下次抽样,这种抽样的特点是总体中每个样本单位被抽中的概率是相等的。
4.一个元素被抽中后不再放回总体,然后再从剩下的元素中抽取第二个元素,直到抽取”个元素为止,这样的抽样方法称为( )。
A.重复抽样B.不重复抽样C.分层抽样D.整群抽样【解析】不重复抽样亦称不放回抽样,是指每次从总体中抽取的样本单位,经检验之后不再放回总体,在下次抽样时不会再次抽到前面已抽中过的样品单位。
总体每经一次抽样,其样本单位数就减少一个,因此每个样品单位在各次抽样中被抽中的概率是不同的。
5.在抽样之前先将总体的元素划分为若干类,然后从各个类中抽取一定数量的元素组成一个样本,这样的抽样方式称为( )。
统计学原理(第二章)
East China University of Science And Technology
第二章 数据收集 (统计调查)
主要内容
2.1 数据的计量和类型 2.2 统计数据的收集 2.3 统计调查方案设计 2.4 统计报表制度 2.5 专(项)门调查 2.6 次级资料的收集
本章学习目标……
调查的目的
2006年全国开展第二次农业普查; 其目的是: 1)收集年度间变动缓慢的农业结构性数据 2)为抽样调查提供样本框。 主要调查:农业生产经营单位的数量、规模和 结构;耕地资源;农业生产条件;劳动力就业 和流动;农村社会福利事业等基本内容
调查的目的
2009年上海市第二次全国R&D资源清查的目的 1.全面调查了解R&D活动的总体规模和分布情况 2.研发队伍的规模和素质状况 3.研发资源的投入、成果及产出效益情况 4.政府对R&D活动扶持政策的落实情况
2.2.2 统计调查的种类
1)统计报表制度和专门(项)调查 2)全面调查和非全面调查 3)连续性调查和非连续性调查 4)直接观察法和询问调查法
统计报表制度和专门调查
1)统计报表制度: 是收集统计资料的一种重要方法,是按照国家有关法规的规定, 自下而上的逐级提供基本统计资料的一种调查方式。如统计公报。 2)专(项)门调查: 为了研究某个专(项)门问题而组织的调查方式,有普查、重 点调查、典型调查、抽样调查。 如: 2008年,奶粉三聚氰胺含量的专项调查; 2009年8月8日,台湾水灾人员伤亡情况调查(台风‘莫拉克’) 人民币升值对出口企业的影响调查; 房贷利率升高对贷款者还贷的影响调查
2.3.4确定调查时间
调查时间有两层含义: 1)确定调查的起止时间,即调查期间。 第二次经济普查的调查时期为: 2009年1月1日—5月31日。 2)确定资料所属的时期或时点。 第二次经济普查的标准时点为: 2008年12月31日24时。 第二次经济普查的时期资料为2008年度。
统计学第二章
一、统计数据的类型和来源
1. 统计调查概述
(1)统计调查的定义和意义。 ①统计调查的定义。统计调查是按照统计任务的要求, 运用科学的调查方法,有计划、有组织地向社会实际收集各项 资料的过程。统计资料的收集内容有两方面:一是直接收集反 映被调查者的个体原始资料(又称初级资料);二是根据研究 的目的,收集已经加工、整理出来的,说明现象总体的第二手 资料(又称次级资料)。由于第二手资料来源于原始资料,因 而,统计调查的基本任务是收集社会经济现象的原始资料。
前两类数据也称定性数据或品质数据,后两类数据也称 定量数据或数量数据。
一、统计数据的类型和来源
二、 统计数据的直接来源
统计数据的直接来源主要有两个:一是专门组织 的调查,二是科学试验。专门调查有统计部门进行的 统计调查,也有其他部门或机构为特定目的而进行的 调查,如新产品投放市场前所做的市场调查。专门调 查是取得社会经济数据的重要手段,而科学试验是取 得自然科学数据的主要手段。
一、统计数据的类型和来源
(1)定类尺度。定类尺度也称类别尺度或列名尺度, 是最粗略、最低层次的计量尺度。这种计量尺度只能按照事 物的某种属性对其进行平行的分类或分组。
(2)定序尺度。定序尺度又称顺序尺度,是对客观现 象之间等级差别或顺序差别的一种测度。这种计量尺度不仅 可以将客观现象分成不同的类别,还可以确定这些类别的优 劣或顺序。
一、统计数据的类型和来源
(3)定距数据。定距数据也称区间类别数据,说明的是 事物的数量特征,能够用数值表示。其结果是由定距尺度计量 形成的,表现为数值,可进行加、减运算。
(4)定比数据。定比数据也称比率类别数据,说明的也 是事物的数量特征,能够用数值表示。其结果是由定比尺度计 量形成的,表现为数值,可进行加、减、乘、除运算。
统计学第二章数据搜集整理
普查的规定
• • • • 规定统一的调查项目 规定统一的标准时点 规定统一的普查周期 例如:第六次人口普查,调查表,性别、年龄、 民族、受教育程度、行业、职业、迁移流动、社 会保障、婚姻生育、死亡、住房情况等 • 截止时间,标准时点是2010年11月1日零时 • 人口普查的周期是10年,2000年,2010年
频率
fi
fi
fi :第i组频数
32
(2)频率的性质 (A )
0
fi
1 fi
(B ) (3)频数密度与频率密度(消除异距分组对频数影响) (A) (2.7) 频数密度=频数/组距 (B) (2.8) 频率密度=频率/组距 各组频数密度与各组组距乘积之和等于总体单位数,各 组频率密度与各组组距乘积之和等于1.
29
组数的确定(H.A.Struges经验公 式)
•
n = 1 + 3.3logN
N – 24 – 44 – 89 – 170 – 359 n 5 6 7 8 9
(斯特杰斯)
• • 15 • 25 • 45 • 90 • 180 • 组距=
30
四、频数(次数)分布
1.频数分布的基本理论
(1)频数分布的定义 在统计分组的基础上,将总体所有单位按某一标志 归类排列,并计算其相应出现的次数。 频数分布是统计整理的重要形式,通过对零乱的、 分散的原始资料进行有次序的整理,形成一系列反映 总体各组之间单位分布状况的数列,即分布数列。
10
• 概率抽样的特点: 1、样本单位按随机原则抽取,排除了主观因素对 选样的影响。 2、根据部分调查的实际资料对调查对象总体的数 量特征作出估计。 3、抽样误差可以事先计算并加以控制。 • 抽样调查的适用场合
【统计学 精】第二章 统计数据的搜集和整理
(2)对普查资料进行必要的修正。
4、典型调查
• 这是一种专门组织的非全面调查。它根据调查的目的,在对所研 究的对象进行初步分析的基础上,有意识地选取若干(一个或少 数几个)具有代表性的单位进行调查和研究,借以认识事物发展 变化的规律。
• 重点调查适用的条件:
•
当统计调查的任务只要求了解调查对象的基本情况,而
调查对象中确实存在重点单位时,比较适宜进行重点调查。
• 例如,为了掌握全国钢铁生产的基本情况,可以选出鞍钢、宝钢、首钢、 马钢、武钢等几个大型钢铁企业调查,以便对钢铁产量有个大致的了解。
3、抽样调查
•抽样调查是一种非全面调查,是实际中应用最广 。 泛的一种调查方式
(3) 是运用概率的估计方法 。
• 例如:通过抽样推断得出,厦大学生的平均 月支出在(420,470)元上的可靠性为90%。
(4)抽样推断的误差可以事先计算,并加以控制。
• 抽样调查的优越性: 第一,经济性强。 第二,时效性高。 第三,适应面广。 第四,准确性大。
抽样调查的适用范围 (1)一些不可能或不必要进行全面检查的社会 现象。
性和时效性。
三、统计分组
(一)统计分组的概念和种类
• 1、定义:统计分组根据统计研究的目的和客 观现象的内在特点,按照某个标志或几个标 志把研究的总体划分为若干性质不同的部分 (或组)的一种统计方法。
统计分组
• 2.兼有“分”和“合”的双重含义: •对于现象总体,是 “分”;对于单位, 是“合”。 • 对于分组标志,是“分”,对于其他标 志,是“合”。
应用统计学第2章 数据的搜集与整理
掌握数掌握数据的测量尺度及常用类型; 了解统计数据搜集的意义; 掌握统计分组、分配数列的编制方法; 掌握数据图表展示方法。
本章教学目的
第2章 数据的搜集与整理
第2章
统计分组、分配数列的编制方法数据图表展示方法
本章重点和难点
第2章 数据的搜集与整理
第2章
2.4 分配数列
第2章
1.列表法
2.4 分配数列
2.4.3 品质分配数列的表示方法
第2章
2.图示法(1)条形图。条形图是指用宽度相同、高度不同的条形来表示数据变化的图形。条形图可以横向展示,也可以纵向展示,纵向展示时又称柱形图。
2.4.3 品质分配数列的表示方法
2.4 分配数列
第2章
2.图示法(2)饼图。饼图是用圆形及圆形面积的大小来表示数据数值大小的图形。饼图通常用来表示研究总体中各个组成部分的比例分布,对于结构性的研究问题非常实用。
2.5.2 统计表的分类
2.5 统计表
第2章
2.分组表 统计表的主词按照某种标志进行分组后所形成的表称为分组表,利用分组表可以展示统计总体不同现象的特征,说明各个分组之间的内部结构和相互关系,如表2-13所示。
2.5.2 统计表的分类
2.5 统计表
第2章
3.复合表统计表的主词按照两个或两个以上的标志进行分组的表称为复合表,如表2-14所示。
2.1.1 数据的测量尺度
第2章
2.1 数据的测量尺度与常用类型
第2章
1.绝对数、相对数和平均数绝对数是数据最基本的表现形式,是其他数据指标形成的基础。相对数反映了研究对象的相对水平,由两个相互联系的绝对数的对比而得到。平均数反映了研究对象的总体表现水平,是一个抽象了的研究对象总体各单位在某一数量标志下的表现差异,表示研究对象的总体各单位的一般水平,而不是某个单位的具体水平。
第二章统计数据的搜集与整理
第⼆章统计数据的搜集与整理第⼆章统计数据的搜集与整理(⼀)教学⽬的通过本章的学习,了解统计数据搜集与整理的基本理论与⽅法,掌握各种⽅法的特性。
(⼆)基本要求要求灵活运⽤各种数据搜集的⽅式⽅法,并对所得数据进⾏加⼯整理,为以后各章学习打下基础。
(三)教学要点1、数据搜集的⽅式⽅法;2、统计调查⽅案的设计;3、统计分组;4、变量数列的编制;5、统计数据的显⽰。
(四)教学时数9课时(五)教学内容本章共分四节:第⼀节数据的计量与类型⼀、数据的计量尺度在计量学的⼀般分类⽅法中,依据对事物计量的精确程度,可将所采⽤的计量尺度由低级到⾼级、由粗略到精确分为四个层次,即名类尺度、顺序尺度、区间尺度和⽐尺度。
1.定类尺度定类尺度(Nominal scale,亦称分类尺度、列名尺度等)是这样⼀种品质标志,按照它可对研究客体进⾏平⾏的分类或分组,使同类同质,异类异质。
例如,按照性别将⼈⼝分为男、⼥两类;按照经济性质将企业分为国有、集体、私营、混合制企业等。
这⾥的“性别”和“经济性质”就是两种名类尺度。
名类尺度是最粗略、计量层次最低的计量尺度,利⽤它只可测度事物之间的类别差,⽽不能了解各类之间的其他差别。
名类尺度计量的结果表现为某种类别,但为了便于统计处理,例如为了计算和识别,也可⽤不同数字或编码表⽰不同类别。
⽐如⽤1表⽰男,0表⽰⼥;⽤1表⽰国有企业,2表⽰集体企业,3表⽰私营企业,等等。
这些数字只是不同类别的代码,决不意味着它区分了⼤⼩,更不能进⾏任何数学运算。
名类尺度能对事物做最基本的测度,是其他计量尺度的基础。
2.定序尺度定序尺度(Ordinal scale,亦称序数尺度、顺位尺度等)是这样⼀种品质标志,利⽤它不仅能将事物分成不同的类别,还可确定这些类别的等级差别或序列差别。
例如“产品等级”就是⼀种测度产品质量好坏的顺序尺度,它可将产品分为⼀等品、⼆等品、三等品、次品等;“考试成绩”也是⼀种顺序尺度,它可将成绩分为优、良、中、及格、不及格等;“对某⼀事物的态度”作为⼀种顺序尺度,可将⼈们的态度分为⾮常同意、同意、保持中⽴、不同意、⾮常不同意,等等。
贾俊平统计学第二章 数据的搜集
2 - 21
方便抽样
1. 调查过程中由调查员依据方便的原则,自行 调查过程中由调查员依据方便的原则, 确定入抽样本的单位
调查员在街头、 公园 、 调查员在街头 、 公园、 商店等公共场所进行拦 截调查 厂家在出售产品柜台前对路过顾客进行的调查
2. 优点:容易实施,调查的成本低 优点:容易实施, 3. 缺点:样本单位的确定带有随意性 ,样本无 缺点:样本单位的确定带有随意性, 法代表有明确定义的总体, 法代表有明确定义的总体, 调查结果不宜推 断总体
速度快, 速度快,能在短时间内完成调 适合于样本单位十分分散的情况
3. 局限
如果被调查者没有电话, 如果被调查者没有电话,调查将无法实施 访问的时间不能太长 使用的问卷需要简单 被访者不愿意接受调查时, 被访者不愿意接受调查时,难以说服
2 - 32
观察式调查
1. 就调查对象的行动和意识 , 调查人员边 就调查对象的行动和意识, 观察边记录以收集所需信息 2. 调查人员不是强行介入 3. 能够在被调查者不察觉的情况下获得资 料
2 - 17
整群抽样
(cluster sampling) sampling)
1. 将总体中若干个单位合并为组 ( 群 ), 抽样时直接 将总体中若干个单位合并为组( ),抽样时直接 抽取群, 抽取群 , 然后对中选群中的所有单位全部实施 调查 2. 特点
抽样时只需群的抽样框, 抽样时只需群的抽样框,可简化工作量 调查的地点相对集中,节省调查费用, 调查的地点相对集中,节省调查费用,方便调查的 实施 缺点是估计的精度较差
2 - 30
面访式问卷调查
1. 调查员与 被调查者面对面提问、 被调查 调查员与被调查者面对面提问 、 者回答的一种调查方式 2. 优点
管理统计学 第2版 第二章 统计数据的收集整理与显示
(4)系统抽样
首先将总体中各 单位按一定顺序 排列,根据样本 容量要求确定抽 选间隔,然后随 机确定起点,每 隔一定的间隔抽 取一个单位的一 种抽样方式。是 纯随机抽样的变
种
最主要的优势就 是经济性。最大 的缺陷在于总体 单位的排列上。 一些总体单位数 可能包含隐蔽的 形态或者是“不 合格样本”,调 查者可能疏忽, 把它们抽选为样
• 普查需要规定标准的时点:如第五次人口普查规定的标准时间 为2010年11月1日零时为标准时间。
统计报表
• 统计报表是按照国家有关的规定,自上而下同一布置,自下而上逐级 提供统计资料的调查组织方式。
• 统计报表是我国特有的一种统计调查方式,是建立在各基层单位原始 记录的基础上的一种统计调查方式,由于统计报表是逐级上报和汇总 的,有利于各级部门了解本地区、本部门或本行的的社会和经济发展 现状。
2.1 统计数据的收集
数据的来源
• 间接来源 研究者直接从公开出版物或通过网络渠道获取
所需数据,如《中国统计年鉴》、《中国统计摘 要》、《中国社会统计年鉴》 • 直接来源
研究者直接通过调查取得研究所需数据资料
2.1 统计数据的收集
普查
常用的统计 调查方式
抽样调查
重点调查
典型调查
简单随 机抽样
分层抽样
抽样调查
• 抽样调查是取得数据资料的最主要的一种方式,它是按照 随机原则从总体中抽取部分单位组成样本,对样本指标进 行测定,根据样本指标推断总体指标的一种非全面调查。
抽样调查的具体组织形式 抽样调查
简单随 机抽样
分层抽样
等距抽 样
整群抽样
(1)简单随机抽样
从总体N个单位中任意抽取n个单位作为样本, 使每个可能的样本被抽中的概率相等的一种 抽样方式
统计学第二章
第二章统计数据的收集、整理与显示2.1统计数据的收集一、统计数据的来源1、直接来源(原始来源):分为实验和统计调查(直接观察、报告、采访、登记)2、间接来源(二手资料):出版物、网络二、统计调查组织方式1、分类①按调查单位的范围大小分:全面调查和非全面调查②按调查时间是否连续分:经常性调查和一次性调查③按调查组织方式分:统计报表和专门调查。
其中专门调查又分为普查、重点调查、典型调查、抽样调查2、统计报表制度:按照国家统一规定的各项要求,自下而上地定期向国家和主管部门报送基本统计资料的一种报告制度①优点:能保证统计资料的全面性和连续性;能保证统计资料的统一性和及时性;能满足各级部门对统计资料的需要②缺点:统计报表过多会增加基层负担;有可能由于虚假瞒报而影响统计资料质量3、普查:是指国家为详尽了解某项重要的国情国力而专门组织的一次性全面调查(主要用于搜集时点资料)①作用:可以为抽样调查提供抽样框;可以收集统计报表所不能提供的反映重大国情国力的基本统计信息②局限:由于需要大量的人力、物力、财力,不宜经常进行4、重点调查:是指为了解总体基本情况,在调查对象中只选择一部分重点单位进行调查的一种非全面调查组织方式。
(这些单位数目不多,但其标志值在总体标志总量中占有较大比重,能反映总体的基本情况)①作用:能以较少的投入和较快的速度取得总体基本情况及变动趋势的资料②局限:只适用于客观存在重点单位的情况5、典型调查:是指在对调查对象有一定了解的基础上,有意识的选择少数典型单位进行调查的一种非全面调查方式。
(指在数量表现上具有普遍意义呵呵代表性的总体单位,可以用来推断总体的数量)①作用:一定条件下能估计总体指标数值;可以用来研究新生事物②缺陷:不能确定推断的把握程度,无法计算和控制推断误差6、抽样调查:是指按照随机原则从调查对象中抽取一部分样本单位进行调查,再用样本资料推断把握总体的数量特征的一种非全面调查组织方式。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
编辑ppt
20
(3)整群随机抽样(cluster sampling)。先把总 体分为若干群(cluster),再以群为单位进行随机抽 样,对抽出来的群进行普查。
比如在某县进行调查,首先在所有村中选取若干村 子,然后只对这些村子的人进行调查。显然,如果各 村情况差异不大,这种抽样还是方便的。否则就会增 大误差。
2.2.1统计调查的方式 2.2.2抽样调查的常用方法 2.2.3搜集数据的基本方法 2.2.4调查方案的设计
编辑ppt
10
2.2.1 统计调查方式
统计调查方式
普
抽
统
样
计
查
调 查
报ቤተ መጻሕፍቲ ባይዱ表
编辑ppt
11
➢ 普查(census)
• 普查是为某一特定目的而专门组织的一次性全面调查。
• 特点:
– 普查通常是一次性的或周期性的。例如国务院规定每10 年进行一次人口普查。
第 2 章 数据搜集
2.1 数据来源 2.2 调查数据 2.3 实验数据 2.4 数据误差
编辑ppt
1
学习目标
1. 了解数据的来源 2. 理解数据的调查方法 3. 掌握调查方案的结构和设计 4. 掌握调查问卷设计 5. 了解实验数据 6. 了解数据的误差
编辑ppt
2
2.1 数据来源
2.1.1 数据的间接来源 2.1.2 数据的直接来源
4. 各种会议,如博览会、展销会、交易会及
专业性、学术性研讨会上交流的有关资料 中
国中
5. 从互联网或图书馆查阅到的相关资料
人国 口市 统场
计统
年计
鉴年
鉴
编辑ppt
5
➢二手数据的特点
1. 收集容易,采集成本低 2. 作用广泛
– 分析所要研究的问题 – 提供研究问题的背景 – 帮助研究者更好地定义问题 – 检验和回答某些疑问和假设 – 寻找研究问题的思路和途径 3. 收集二手资料在研究中应优先考虑
编辑ppt
6
➢二手数据的评估
1. 数据是谁收集的? – 可信度评估
2. 为什么目的而收集的? 3. 数据是怎样收集的? 4. 什么时候收集的?
编辑ppt
7
使用二手数据需要注意的问题
• 应注意数据的含义、计算口径和计算方法,避 免误用或滥用;
• 注意二手数据的时间性,不能用过时的数据; • 应充分搞清这些数据的来源和可靠程度; • 应注明数据的出处,以尊重他人的劳动成果。
编辑ppt
16
实践中,得到随机样本并不容易。即使选择对象的确是随 机的,最理想的情况所得到的样本也只代表那些愿意回答 问题人的观点所组成的总体;没有回答问题的人的观点永 远不会被这种调查的样本所代表。
比如在肺癌研究中,人们往往看到吸烟和肺癌的关系的数 据;这些数据并不是整个人群中采集的随机样本,它们可 能只是医院中的病人记录中得到的。
编辑ppt
3
2.1.1 数据的间接来源
✓二手数据的来源 ✓二手数据的特点 ✓二手数据的评估
编辑ppt
4
➢二手数据的来源
1. 统计部门和政府部门公布的有关资料,如 各类统计年鉴
2. 各类经济信息中心、信息咨询机构、专业 Internet
调查机构等提供的数据
http//WWW.
3. 各类专业期刊、报纸、书籍所提供的资料
编辑ppt
18
(2)分层(分类)随机抽样(stratified sampling)。先根 据某一特征把总体分为若干类(层,stratum),再从各类中 按简单随机抽样原则进行抽样。 比如按照教育程度把要访问的人群分成几类,再在每一类中 按其所占比例进行抽样。
样本
男生
编辑ppt
女生
19
• 层内个体之间的差异越小,而不同层之间 的差异越大时,分层抽样的效果好。
在报纸和网上也有问卷,但得到的只是上了网和有这份报 刊,而且愿意回答的人的观点。
编辑ppt
17
抽样框是有关总体全部单位的名录。
特点 – 简单、直观,在抽样框完整时,可直接从中抽取样本 – 用样本统计量对目标量进行估计比较方便
局限性 – 当N很大时,不易构造抽样框 – 抽出的单位很分散,给实施调查增加了困难 – 没有利用其他辅助信息以提高估计的效率 所以规模较大的调查中,很少直接采用简单随机抽样, 一般把这种方法与其他方法结合起来使用。
编辑ppt
21
(4)系统抽样
• 系统抽样(也称等距抽样):将总体N个单位按某 种顺序排列,按规则确定一个随机起点,再每隔一 定间隔逐个抽取样本单位的抽样方法。
– 普查一般需要规定统一的标准时点。例如,第5次人口 普查的标准时间为2000年11月1日0时。
– 普查数据的准确性、标准化程度均较高 ;
– 普查的调查项目较少,适用范围较狭窄,调查资料缺乏
深度。
总体
编辑ppt
12
➢ 抽样调查(sampling survey)
1.从总体中随机抽取一部分单位作为样本进行 调查,并根据样本调查结果来推断总体特征
编辑ppt
8
2.1.2数据的直接来源(原始数据)
1. 调查数据
– 通过调查方法获得的数据 – 通常是对社会现象而言 – 通常取自有限总体
2. 实验数据
– 通过实验方法得到的数据 – 通常是对自然现象而言 – 也被广泛运用到社会科学中
如心理学、教育学、社会学、经济学、管理学等
编辑ppt
9
2.2 调查数据
抽样方法
概率抽样
非概率抽样
简 单
系
分整
随 统 层群
机 抽 抽抽 抽 样 样 样样
方判自雪 便断愿球 抽抽抽抽 样样样样
编辑ppt
15
➢ 概率抽样
(1)简单随机抽样(simple random sampling)。从有限总体抽取样本时,如果总体 中每一个体都有同等机会被选入样本,这种抽样 称为简单随机抽样,得到的样本称为随机样本 (random sample)。
的数据收集方法
2. 具有经济性、时 效性强、适应面广、 准确性高等特点
一次失败的抽样调查!
☺ ☺
☺ ☺☺
☺☺
总体
随机样本
☺☺
编辑ppt
13
➢统计报表(statistical report forms)
1、统计报表是依照国家有关法规的规定,自上而下地统一布 置、自下而上地逐级提供基本统计数据的一种调查方式。
2、统计报表要以一定的原始记录为基础,按照统一的表格形 式、统一的指标项目、统一的报送时间和报送程序进行填报。 ✓ 按填报范围不同可分为全面报表和非全面报表 ✓ 按报送周期不同可分为日报、月报、季报、年报等。 ✓ 按填报内容和实施范围不同可分为国家、部门和地方统 计报表
编辑ppt
14
2.2.2抽样调查的常用方法