第2章 数据的收集

合集下载

第二章 数据收集与整理

第二章  数据收集与整理

《统计学》习题(2013版)第二章数据收集与数据整理一、判断题1.观测单位就是统计数据的提供单位。

2.普查是全面调查,抽样调查是非全面调查,所以普查比抽样调查准确。

3.无论是概率抽样还是非概率抽样,误差都是可以计算的。

4.偶然性误差只存在于抽样调查,观测性误差则可能存在于任何统计调查。

5.为了尽可能多地收集统计数据信息,所以问卷应尽可能地长。

6.统计分组应使组间差异尽量小。

7.凡是离散型变量都适合编制单项式数列。

8.各组的频数或频率都是可以直接比较的。

二、单项选择题1.最常用的统计调查方式是()。

A.普查B.重点调查C.抽样调查D.科学推算2.调查小学男生的身高,则身高是()。

A.观测标志B.观测单位C.调查对象D.变量值3.抽样调查中不可避免的误差是()。

A.系统性误差B.偶然性误差C.观测性误差D.登记性误差4.在组距式数列中,对组限值的处理原则是()。

A.上组限不在内、下组限在内B.下组限不在内、上组限在内C.上下组限均不在内D.上下组限均在内5.最常见的变量分布类型是()。

A.正J型分布B.U型分布C.钟型分布D.反J型分布三、计算分析题某生产车间55名工人日加工零件数如下:(单位:件)117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 140 108 150 118 123 126 133 134 127 123 118 141 112 112 134 127 123 119 113 120 123 127 143 135 137 114 120 128 124 115 139 128 124 121 110 140 118要求:(1)编制频数分布数列和频率分布数列;(2)编制向上、向下累计频数分布数列和累计频率分布数列;(3)绘制直方图、折线图、曲线图和累计分布曲线图(可利用Excel);(4)说明工人日加工零件数的分布特征。

统计学第二章 统计数据的收集、整理与显示试题及答案

统计学第二章   统计数据的收集、整理与显示试题及答案

第二章统计数据的收集、整理与显示二、单项选择题1、人口普查的调查单位是(C )。

A、每一户B、所有的户C、每一个人D、所有的人2、对一批商品进行质量检验,最适宜采用的调查方法是(B )。

A、全面调查B、抽样调查C、典型调查D、重点调查3、下列调查中,调查单位与填报单位一致的是(D )。

A、企业设备调查B、人口普查C、农村耕畜调查D、工业企业生产经营现状调查4、抽样调查与重点调查的主要区别是(D )。

A、作用不同B、组织方式不同C、灵活程度不同D、选取调查单位的方法不同5、先对总体中的个体按主要标志加以分类,再以随机原则从各类中抽取一定的单位进行调查,这种抽样调查形式属于( D )。

A、简单随机抽样B、等距抽样C、整群抽样D、类型抽样6、对某省饮食业从业人员的健康状况进行调查,调查单位是该省饮食业的(D )。

A、全部网点B、每个网点C、所有从业人员D、每个从业人员7、调查时限是指(B )。

A、调查资料所属的时间B、进行调查工作的期限C、调查工作登记的时间D、调查资料的报送时间8、对某市全部商业企业职工的生活状况进行调查,调查对象是(B )。

A、该市全部商业企业B、该市全部商业企业的职工C、该市每一个商业企业D、该市商业企业的每一名职工9、作为一个调查单位(D )。

A、只能调查一个统计标志B、只能调查一个统计指标C、可以调查多个统计指标D、可以调查多个统计标志10、某市规定2018年工业经济活动成果年报呈报时间是2019年1月31日,则调查期限为( B )。

A、一天B、一个月C、一年D、一年零一个月11、统计分组对总体而言是( B )A、将总体区分为性质相同的若干部分B、将总体区分为性质不同的若干部分C、将总体单位区分为性质相同的若干部分D、将总体单位区分为性质不相同的若干部分12、按某一标志分组的结果表现为( B )A、组内差异性,组间同质性B、组内同质性,组间差异性C、组内同质性,组间同质性D、组内差异性,组间差异性13、设对某地区的人口按年龄分组如下:不满周岁,1—3岁,4—6岁,7—12岁,……60—64岁,65—79岁,80—99岁,100岁以上,最后一组的组中值近拟为( C )A、110岁B、104岁C、104.5岁D、105岁14、为充分利用所得到的原始资料以取得大量统计指标,在统计整理时关键是要( C )A、进行各种汇总B、进行各种计算C、充分利用分组法D、对原始资料进行分析15、按变量的性质和数据的多少划分,变量数列可分为( C )。

统计学 第二章 统计数据的搜集、整理和显示

统计学 第二章 统计数据的搜集、整理和显示

(二)实验方式
所谓实验方式,就是运用自然科学的试验 法,通过观测人为安排条件下试验产生的各种 结果并加以记录的方式来获取数据,或通过人 为安排条件下的试验来探求某个或某些因素对 所研究事物的数量影响程度和作用方式,凭借 实验结果来揭示所考察因素与所研究事物之间 的数量因果关系。
1、实验的原则
运用实验方式需要遵循下列两个原则:均衡分散
1、普查
普查是根据特定的统计研究目的而专门组织的 一次性的全面调查,用以收集所研究现象总体的全 面资料(即总体中的所有个体都是观测单位)。 普查的组织方式一般有两种:一是建立专门的 普查机构,配备一定数量的普查人员,对观测单位 直接进行登记。如我国历次的人口普查等。二是利 用观测单位的原始记录和核算资料,颁发调查表, 由观测单位按要求填报。如物资库存普查等。
重点调查的单位可以是一些企业、行业、 也可以是一些地区、城市。此种调查方式的优点是, 所投入的人力、物力少,而又较快地搜集到统计 信息资料。一般来讲,在调查任务只要求掌握基 本情况,而部分单位又能比较集中反映研究项目 和指标时,就可以采用重点调查。
在下列问题中为了得到数据,采用什么调查? • 为了买校服,了解每个学生衣服的尺寸。 • 商检人员在某超市检查出售的饮料的合格率。 • 对占全市工业总产值五分之一的六个大型企 业进行调查,以了解全市工业总产值的基本 情况。
观测性误差
数 据 收 集 误 差
也叫登记性误差或调查性误差,它 是在调查观测的各个环节因工作粗 心或被观测者不愿很好配合而造成 的所收集数据与实际情况不符的误 差,包括计量错误、记录错误、计 算错误、抄写错误、汇总错误、计 算机输入误差等工作误差,以及被 调查者不愿或难以提供真实情况的 误差,有时还存在调查人员弄虚作 假的误差和各种人为因素干扰的误 差。 这部分误差通常是人为造成的,通 过对统计调查资料的严密审核,是 可以发现并加以更正的。观测性误 差则可能存在于任何统计调查。 因样本不能完全代表总体而产生 的估计结果与总体真实数量特征 不符的误差。根据样本不能完全 代表总体的原因不同,代表性误 差又分为系统性代表性误差和偶 然性代表性误差两种。

第二章统计数据的收集

第二章统计数据的收集

第二章统计数据的收集第一节统计数据收集的方式和方法第二节统计调查方案设计第三节统计调查问卷设计[教学目的]1、了解统计数据收集的基本要求和种类。

2、掌握各种统计调查方法的特点及其应用条件。

3、掌握统计调查方案的基本内容。

4、学会统计调查问卷设计的基本技术。

[教学重点与难点]:各种统计调查方式的特点及其应用条件。

[教学时数]:4课时教学内容:§1、统计数据收集的方式和方法一、统计数据收集的基本要求和种类(一)统计数据收集的基本要求1.概念统计调查是根据统计研究的目的和要求,有组织、有计划地对被研究现象进行系统地搜集统计资料的工作过程。

2.意义统计调查是统计工作的基础,是整理和分析的前提,是保证统计资料质量的首要环节。

3.基本要求:准确、及时准确:提供的统计调查资料要符合客观实际情况。

具体指:反映真实,杜绝虚报、瞒报;数字完整,没有遗漏;计算准确,不出差错。

及时:即时效性。

要求按统计调查方案中规定的时间尽快提供调查资料。

准确与及时的关系:相辅相成的整体。

既要准中求快,又要快中保准,反对准而不快、快而不准。

(二)统计数据收集的种类在对实际问题的研究中,往往需要利用统计数据,那么应从哪里获得必要的统计数据呢?从统计数据本身的来源看,统计数据最初都是来源于直接的调查或试验。

但从使用者的角度看,统计数据主要来源于两种渠道:一是来源于直接的调查和科学试验,对使用者来说,这是统计数据的直接来源,称为第一手或直接的统计数据;二是来源于别人调查或试验的数据,对使用者来说,这是统计数据的间接来源,称为第二手或间接的统计数据。

直接数据按照来源的不同分为调查数据和实验数据。

1、调查数据是直接通过调查或观测而收集到的数据。

2、实验数据是在实验中通过控制实验对象和实验条件,对实验结果进行观测记录而收集到的数据。

二、统计数据的调查方式(一)统计调查组织形式的种类1、按调查对象包括的范围分为全面调查和非全面调查两大类。

统计学第二章统计调查

统计学第二章统计调查

上一页 下一页
统计数据收集的种类
按收集对象的范围大小分为 按收集时间是否连续分为
按收集的组织形式分为
按收集的方式不同分为
实验方式 调查方式
非全面调查 全面调查
经常性调查 一次性调查 统计报表 专门调查
统计报表 普查
重点调查
抽样调查等
全面调查
调查 范围

非全面调查


调查
连续(经常性)调查
查 形
时间
• 时期现象:指标据反映的起止日期。 • 时点现象:就是规定的统一标准时点。 • 数据收集期限:完成数据收集工作的起止时间。
包括收集资料和报送资料整个工作所需时间。
数据 所属 时间 {客观 时间}
等于
数据 资料 所属 时间
数据 收集 期限 {主观 时间}
等于
数据 收集 工作 时间
起讫时间(一段时期内的数据)
统计报表过多会增加基层负担 有可能由于虚报瞒报而影响统计资料质量
单位
• 观测标志(项目):
• 是根据数据收集目的所确定。包括品质标志 和数量标志。
• 拟定数据收集项目应注意: • 1、观测标志必须是数据收集目的所需要的并
且是确实可取得资料的。 • 2、观测标志必须相互联系,便于统计分析和
核对资料的差错。 • 3、观测标志的含义必须明确,不能 有两个或
以上的解释。 • 4、观测标志的表达形式要明确。用文字还是
①方案设计
②搜集数据
③数据处理
④报告写作
⑤验收
注:6 月 30 日前完成方案设计,问卷的定稿印刷发放
7 月 25 日前完成问卷收回与审核,并制定数据处理方案(数据库框架)
ห้องสมุดไป่ตู้

统计学第二章数据搜集整理

统计学第二章数据搜集整理

普查的规定
• • • • 规定统一的调查项目 规定统一的标准时点 规定统一的普查周期 例如:第六次人口普查,调查表,性别、年龄、 民族、受教育程度、行业、职业、迁移流动、社 会保障、婚姻生育、死亡、住房情况等 • 截止时间,标准时点是2010年11月1日零时 • 人口普查的周期是10年,2000年,2010年
频率
fi
fi
fi :第i组频数
32
(2)频率的性质 (A )
0
fi
1 fi
(B ) (3)频数密度与频率密度(消除异距分组对频数影响) (A) (2.7) 频数密度=频数/组距 (B) (2.8) 频率密度=频率/组距 各组频数密度与各组组距乘积之和等于总体单位数,各 组频率密度与各组组距乘积之和等于1.
29
组数的确定(H.A.Struges经验公 式)

n = 1 + 3.3logN
N – 24 – 44 – 89 – 170 – 359 n 5 6 7 8 9
(斯特杰斯)
• • 15 • 25 • 45 • 90 • 180 • 组距=
30
四、频数(次数)分布
1.频数分布的基本理论
(1)频数分布的定义 在统计分组的基础上,将总体所有单位按某一标志 归类排列,并计算其相应出现的次数。 频数分布是统计整理的重要形式,通过对零乱的、 分散的原始资料进行有次序的整理,形成一系列反映 总体各组之间单位分布状况的数列,即分布数列。
10
• 概率抽样的特点: 1、样本单位按随机原则抽取,排除了主观因素对 选样的影响。 2、根据部分调查的实际资料对调查对象总体的数 量特征作出估计。 3、抽样误差可以事先计算并加以控制。 • 抽样调查的适用场合

第二章 数据的收集方法(1)

第二章 数据的收集方法(1)

市场研究
一致性如何?( 一致性如何 (COHERENCE) )
多个资料来源的多边检核准可以从一致性的角度来考察二手资料 的可靠性,从而了解所收集的二手资料与其他对相同问题调查所 得到的数据的一致性状况。二手资料可能存在不少难以发现的问 题,要完全识别这些问题是很不容易的,最好的办法是再找10个 以上可以用作比较根据的资料来源。在理想的情况下,使用不同 方法的两组资料来源最后得到的是同样结果的资料。但一般情况 下,两组资料都会有些差别,为此要找出各自的可能偏差以减少 两者之间的不一致性,最后决定哪一组资料是更可靠的。
内部资料
内部资料是可在组织或机构的内部得到的资料。例如,公司的销售 量或顾客光顾情况、营销活动、价格信息、分销商报告和反馈、顾客 的反馈信息等等。实际上,几乎所有大公司的信息系统都是以日常收 集到的内部资料为基础,然后再通过外部资料加以扩展的。这种内部 资料的形式又分成两类。一类是已整理好可以直接利用的。例如,一 些大公司内部的管理决策支持系统提供的日常资料。另一类是虽已存 在,但还需要花相当的力量去处理才能为调研者利用的资料。例如, 销售的发货票中所含的信息就需要进一步加工提取后才能使用。在收 集外部二手资料之前,先分析内部的二手资料是很有帮助的。
市场研究
《科学验证:国酒茅台有益健康》 茅台酒能护肝?
市场研究
怎样收集的?( 怎样收集的 (HOW) )
样本的收集方法是评价二手资料质量的另一个重要标 准。事实上,收集资料所用的一整套方法的缺失往往 影响二手资料质量的最终评价。在二手资料收集方法 的评估中,需要了解问卷、访问方式、样本的性质、 样本量、回收率、拒访率、实施的组织管理情况以及 其他任何有可能影响调查结果的方法。如果上述环节 的信息都能获取,使用者对于资料来源的质量就心中 有数了。对这些环节的考察的关键是这些方法中是否 可能造成结果的系统偏差。

第2章 统计数据的收集整理与显示

第2章 统计数据的收集整理与显示

A:您至今未买电脑的原因是什么?(单选不可以,多 选可以) (a)买不起(b)没有用(c)不懂(d)其它
(3) 无论多/单选题,任一个备选答案都不能有多 重含义。 A.您选择信息专业的目的是:
(a)自己喜欢,好就业(b)„„
(4) 无论多/单选题,备选答案之间不能有包含关 系。 A.您上大学的目的是:
例2.1 某车间50个工人看管机床台数资料如下:
3 6 2 4 3 2 6 4 3 2 4 2 5 2 6 2 3 5 4 3 2 3 6 5 4 2 4 3 2 2 3 5 4 5 6 2 2 6 4 3 2 6 3 4 5 4 5 2 3 5
试对数据进行分组。 解:由于机器台数属于离散型变量,因此使用单项式分 组方法。将原始资料按变量值升序排列,然后将相同变 量值分为一组,最后将资料分成若干组。
2.按数量标志分组 数值型数据:主要是按照数值进行分组。 例:对学生成绩分组,可分为60分以下、60~70分、 70~80分、80~90分、90分以上5个组。
单项式分组 按数量标志分组的方法: 组距式分组
单项式分组:把每一个变量值作为一组。 适用条件:通常只适于离散变量且变量值较少的情况
表2-2 变量编码表
NUM SEX JOB A11 A12 A13 A14 A15 A21 A22 A23 A24
001
002
1
1
1
210来自001
1
1
1
0
1
1
1
1
0
0
0
1
0
编码表说明:
NUM- 编码 SEX- 性别 jOB- 职务 A11~A15代表第一题中5个选项,选中者输入1, 未选中者输入0。 A21~A24代表第二题中4个选项,选中者输入1, 未选中者输入0。

第二章统计数据资料的搜集与整理

第二章统计数据资料的搜集与整理
应用条件:大型、国有企业来说,具有 时间快、成本低的优点;大量的小型、 非国有经济单位,则难以全面采用统计 报表调查
分类:
按报送范围: 全面报表——要求调查对象中的每一个 单位均要填报 非全面报表——只要求一部分调查单位 填报 按报送日期: 月报、季报、年报 月报内容简单、时效性强 年报内容比较全面
(二)报告法
基层单位根据上级的要求,以各种原始 记录与核算资料为基础,搜集各种资料, 逐级上报给有关部门
统计报表制度
(三)观察与实验
调查者通过直接的观察或实验获得数据 的一种方法
1.直接观察法
是指就调查对象的行动和意识,调查人 员边观察边记录以收集信息的方法
由于调查人员不是强行介入,受访者无 需任何反应,因而常能够在被观测者不 觉察的情况下获得信息资料
第二章 统计数据资料的搜集与整理
第一节 统计数据资料的来源
一、统计数据资料的来源渠道 直接来源
是通过直接的调查获得的原始数据, 一般称之为第一手或直接的统计数据 主要通过统计调查获得 间接来源 是别人调查的数据,并将这些数据进 行加工和汇总后公布的数据,通常称之 为第二手或间接的统计数据
二、统计数据资料的间接来源
内容:
表式 由国家统计部门根据研究的任务 与目的而专门设计制定的统计报表表格, 用于搜集统计资料。是统计报表制度的 主体
填表说明 是对统计报表的统计范围、 指标等做出的规定,具体有填报范围、 指标解释、分类目录、其他有关事项的 规定
(四)重点调查
概念:是在调查对象中选择一部分重点 单位进行的一种非全面调查。
市场调查和社会调查常用方法
2.邮寄调查
是通过邮寄或宣传媒体等方式将调查表 或调查问卷送至被调查者手中,由被调 查者填写,然后将调查表寄回或投放到 指定收集点的一种调查方法

【统计学 精】第二章 统计数据的搜集和整理

【统计学 精】第二章   统计数据的搜集和整理
• 无限总体的调查。 • 破坏性的产品质量检验。 • 总体单位数过大。 • 没必要全面调查,如城乡居民家计调查、民意测 验等。 • 特殊情况,如战备物资调查、矿产调查等
(2)对普查资料进行必要的修正。
4、典型调查
• 这是一种专门组织的非全面调查。它根据调查的目的,在对所研 究的对象进行初步分析的基础上,有意识地选取若干(一个或少 数几个)具有代表性的单位进行调查和研究,借以认识事物发展 变化的规律。
• 重点调查适用的条件:

当统计调查的任务只要求了解调查对象的基本情况,而
调查对象中确实存在重点单位时,比较适宜进行重点调查。
• 例如,为了掌握全国钢铁生产的基本情况,可以选出鞍钢、宝钢、首钢、 马钢、武钢等几个大型钢铁企业调查,以便对钢铁产量有个大致的了解。
3、抽样调查
•抽样调查是一种非全面调查,是实际中应用最广 。 泛的一种调查方式
(3) 是运用概率的估计方法 。
• 例如:通过抽样推断得出,厦大学生的平均 月支出在(420,470)元上的可靠性为90%。
(4)抽样推断的误差可以事先计算,并加以控制。
• 抽样调查的优越性: 第一,经济性强。 第二,时效性高。 第三,适应面广。 第四,准确性大。
抽样调查的适用范围 (1)一些不可能或不必要进行全面检查的社会 现象。
性和时效性。
三、统计分组
(一)统计分组的概念和种类
• 1、定义:统计分组根据统计研究的目的和客 观现象的内在特点,按照某个标志或几个标 志把研究的总体划分为若干性质不同的部分 (或组)的一种统计方法。
统计分组
• 2.兼有“分”和“合”的双重含义: •对于现象总体,是 “分”;对于单位, 是“合”。 • 对于分组标志,是“分”,对于其他标 志,是“合”。

数据分析基础课程 第2章 数据的收集

数据分析基础课程 第2章  数据的收集

2.2.2 二手数据 二手数据也称为次级数据,是指那些从同行或一些媒体上获得的、经过加工整理的数据,比如国家统计 局定期发布的各种数据,从报纸、电视上获取的各种数据。 1.导入Access数据 (1)在Excel中单击“数据”|“自Access”按钮,如图2-5所示。
图2-5 导入Access数据
义的语言或概念。
(5)简明性原则,即表述问题的语言应该尽可能简单明确,不要冗长和啰唆。
(6)客观性原则,即表述问题的语言要客观,不要有诱导性或倾向性语言。
(7)非否定性原则,即要避免使用否定句形式表述问题。 (8)可能性原则,即必须符合被调查者回答问题的能力。凡是超越被调查者理解能力、记 忆能力、计算能力、回答能力的问题,都不应该提出。 (9)自愿性原则,即必须考虑被调查者是否自愿真实回答问题。凡被调查者不可能自愿真 实回答的问题,都不应该正面提出。
6.报告法
报告法是通过报告单位根据一定的原始记录和台账,根据统计表的格式和要求,按照隶属关 系,逐级向有关部门提供统计资料的一种调查方法。
7.自动生成
在大数据时代,数据的产生方式呈现多样化,如从传
感器、摄像头自动收集的数据,电子商务在线交易日志数 据、应用服务器日志数据等自动保存的数据都是自动生成 的数据。
图2-8 选择显示方式和放置位置
(5)单击“确定”按钮,导入的结果如图2-9所示。
图2-9 导入的结果
2.导入网站表格数据
(1)在Excel中单击“数据”|“自网站”按钮,如
图2-10所示。 (2)输入或复制并粘贴网址。
图2-10 导入网站数据
图2-11 选择导入的表格
导入的结果如图2-12所示。
目录/Contents
第二章 数据的收集

应用统计学第2章 数据的搜集与整理

应用统计学第2章 数据的搜集与整理
第2章
掌握数掌握数据的测量尺度及常用类型; 了解统计数据搜集的意义; 掌握统计分组、分配数列的编制方法; 掌握数据图表展示方法。
本章教学目的
第2章 数据的搜集与整理
第2章
统计分组、分配数列的编制方法数据图表展示方法
本章重点和难点
第2章 数据的搜集与整理
第2章
2.4 分配数列
第2章
1.列表法
2.4 分配数列
2.4.3 品质分配数列的表示方法
第2章
2.图示法(1)条形图。条形图是指用宽度相同、高度不同的条形来表示数据变化的图形。条形图可以横向展示,也可以纵向展示,纵向展示时又称柱形图。
2.4.3 品质分配数列的表示方法
2.4 分配数列
第2章
2.图示法(2)饼图。饼图是用圆形及圆形面积的大小来表示数据数值大小的图形。饼图通常用来表示研究总体中各个组成部分的比例分布,对于结构性的研究问题非常实用。
2.5.2 统计表的分类
2.5 统计表
第2章
2.分组表 统计表的主词按照某种标志进行分组后所形成的表称为分组表,利用分组表可以展示统计总体不同现象的特征,说明各个分组之间的内部结构和相互关系,如表2-13所示。
2.5.2 统计表的分类
2.5 统计表
第2章
3.复合表统计表的主词按照两个或两个以上的标志进行分组的表称为复合表,如表2-14所示。
2.1.1 数据的测量尺度
第2章
2.1 数据的测量尺度与常用类型
第2章
1.绝对数、相对数和平均数绝对数是数据最基本的表现形式,是其他数据指标形成的基础。相对数反映了研究对象的相对水平,由两个相互联系的绝对数的对比而得到。平均数反映了研究对象的总体表现水平,是一个抽象了的研究对象总体各单位在某一数量标志下的表现差异,表示研究对象的总体各单位的一般水平,而不是某个单位的具体水平。

第二章统计数据的搜集与整理

第二章统计数据的搜集与整理

第⼆章统计数据的搜集与整理第⼆章统计数据的搜集与整理(⼀)教学⽬的通过本章的学习,了解统计数据搜集与整理的基本理论与⽅法,掌握各种⽅法的特性。

(⼆)基本要求要求灵活运⽤各种数据搜集的⽅式⽅法,并对所得数据进⾏加⼯整理,为以后各章学习打下基础。

(三)教学要点1、数据搜集的⽅式⽅法;2、统计调查⽅案的设计;3、统计分组;4、变量数列的编制;5、统计数据的显⽰。

(四)教学时数9课时(五)教学内容本章共分四节:第⼀节数据的计量与类型⼀、数据的计量尺度在计量学的⼀般分类⽅法中,依据对事物计量的精确程度,可将所采⽤的计量尺度由低级到⾼级、由粗略到精确分为四个层次,即名类尺度、顺序尺度、区间尺度和⽐尺度。

1.定类尺度定类尺度(Nominal scale,亦称分类尺度、列名尺度等)是这样⼀种品质标志,按照它可对研究客体进⾏平⾏的分类或分组,使同类同质,异类异质。

例如,按照性别将⼈⼝分为男、⼥两类;按照经济性质将企业分为国有、集体、私营、混合制企业等。

这⾥的“性别”和“经济性质”就是两种名类尺度。

名类尺度是最粗略、计量层次最低的计量尺度,利⽤它只可测度事物之间的类别差,⽽不能了解各类之间的其他差别。

名类尺度计量的结果表现为某种类别,但为了便于统计处理,例如为了计算和识别,也可⽤不同数字或编码表⽰不同类别。

⽐如⽤1表⽰男,0表⽰⼥;⽤1表⽰国有企业,2表⽰集体企业,3表⽰私营企业,等等。

这些数字只是不同类别的代码,决不意味着它区分了⼤⼩,更不能进⾏任何数学运算。

名类尺度能对事物做最基本的测度,是其他计量尺度的基础。

2.定序尺度定序尺度(Ordinal scale,亦称序数尺度、顺位尺度等)是这样⼀种品质标志,利⽤它不仅能将事物分成不同的类别,还可确定这些类别的等级差别或序列差别。

例如“产品等级”就是⼀种测度产品质量好坏的顺序尺度,它可将产品分为⼀等品、⼆等品、三等品、次品等;“考试成绩”也是⼀种顺序尺度,它可将成绩分为优、良、中、及格、不及格等;“对某⼀事物的态度”作为⼀种顺序尺度,可将⼈们的态度分为⾮常同意、同意、保持中⽴、不同意、⾮常不同意,等等。

统计学——以excel为分析工具2第二章数据的搜集习题答案

统计学——以excel为分析工具2第二章数据的搜集习题答案

【练习题】一、名词解释:统计调查;统计报表;普查;重点调查;典型调查;抽样调查答:(1)统计调查:统计数据的直接来源主要有两个渠道:一是调查或观察;二是实验。

调查是取得社会经济数据的重要手段,其中有统计部门进行的统计调查。

(2)统计报表:统计报表是按照国家有关法规规定,自上而下统一布置,自下而上逐级填报的一种调查组织方式。

(3)普查:普查是为某一特定目的而专门组织的一次性全面调查方式,如人口普查、工业普查、农业普查等。

(4)重点调查:重点调查只从全部总体单位中选择少数重点单位进行调查,这些重点单位尽管在全部总体单位中出现的频数极少,但其某一数量标志却在所要研究的数量标志值总量中占有很大的比重。

(5)典型调查:典型调查是从全部总体单位中选择一个或几个有代表性的单位进行深入细致调查的一种调查组织方式。

(6)抽样调查:抽样调查是按照一定的概率从总体中抽取一部分单位构成样本,并根据样本信息推断总体数量特征的一种非全面调查。

这是一种应用最为广泛的调查组织方式。

二、简答1、区分普查、抽样调查、典型调查和重点调查?答:1.普查是为某一特定目的而专门组织的一次性全面调查方式,如人口普查、工业普查、农业普查等。

普查主要用于搜集处于某一时点状态上的社会经济现象的数量,具有特定目的、特定对象,旨在搜集有关国情国力的基本统计数据,为国家制定有关政策或措施提供依据。

2.抽样调查是按照一定的概率从总体中抽取一部分单位构成样本,并根据样本信息推断总体数量特征的一种非全面调查。

4.重点调查只从全部总体单位中选择少数重点单位进行调查,这些重点单位尽管在全部总体单位中出现的频数极少,但其某一数量标志却在所要研究的数量标志值总量中占有很大的比重。

5.典型调查。

典型调查是从全部总体单位中选择一个或几个有代表性的单位进行深入细致调查的一种调查组织方式。

典型调查的目的是通过典型单位具体生动、形象的资料来描述或揭示事物的本质或规律,因此所选择的典型单位应能反映所研究问题的本质属性或特征。

贾俊平统计学第二章 数据的搜集

贾俊平统计学第二章 数据的搜集

2 - 21
方便抽样
1. 调查过程中由调查员依据方便的原则,自行 调查过程中由调查员依据方便的原则, 确定入抽样本的单位
调查员在街头、 公园 、 调查员在街头 、 公园、 商店等公共场所进行拦 截调查 厂家在出售产品柜台前对路过顾客进行的调查
2. 优点:容易实施,调查的成本低 优点:容易实施, 3. 缺点:样本单位的确定带有随意性 ,样本无 缺点:样本单位的确定带有随意性, 法代表有明确定义的总体, 法代表有明确定义的总体, 调查结果不宜推 断总体
速度快, 速度快,能在短时间内完成调 适合于样本单位十分分散的情况
3. 局限
如果被调查者没有电话, 如果被调查者没有电话,调查将无法实施 访问的时间不能太长 使用的问卷需要简单 被访者不愿意接受调查时, 被访者不愿意接受调查时,难以说服
2 - 32
观察式调查
1. 就调查对象的行动和意识 , 调查人员边 就调查对象的行动和意识, 观察边记录以收集所需信息 2. 调查人员不是强行介入 3. 能够在被调查者不察觉的情况下获得资 料
2 - 17
整群抽样
(cluster sampling) sampling)
1. 将总体中若干个单位合并为组 ( 群 ), 抽样时直接 将总体中若干个单位合并为组( ),抽样时直接 抽取群, 抽取群 , 然后对中选群中的所有单位全部实施 调查 2. 特点
抽样时只需群的抽样框, 抽样时只需群的抽样框,可简化工作量 调查的地点相对集中,节省调查费用, 调查的地点相对集中,节省调查费用,方便调查的 实施 缺点是估计的精度较差
2 - 30
面访式问卷调查
1. 调查员与 被调查者面对面提问、 被调查 调查员与被调查者面对面提问 、 者回答的一种调查方式 2. 优点

管理统计学 第2版 第二章 统计数据的收集整理与显示

管理统计学 第2版 第二章 统计数据的收集整理与显示

(4)系统抽样
首先将总体中各 单位按一定顺序 排列,根据样本 容量要求确定抽 选间隔,然后随 机确定起点,每 隔一定的间隔抽 取一个单位的一 种抽样方式。是 纯随机抽样的变

最主要的优势就 是经济性。最大 的缺陷在于总体 单位的排列上。 一些总体单位数 可能包含隐蔽的 形态或者是“不 合格样本”,调 查者可能疏忽, 把它们抽选为样
• 普查需要规定标准的时点:如第五次人口普查规定的标准时间 为2010年11月1日零时为标准时间。
统计报表
• 统计报表是按照国家有关的规定,自上而下同一布置,自下而上逐级 提供统计资料的调查组织方式。
• 统计报表是我国特有的一种统计调查方式,是建立在各基层单位原始 记录的基础上的一种统计调查方式,由于统计报表是逐级上报和汇总 的,有利于各级部门了解本地区、本部门或本行的的社会和经济发展 现状。
2.1 统计数据的收集
数据的来源
• 间接来源 研究者直接从公开出版物或通过网络渠道获取
所需数据,如《中国统计年鉴》、《中国统计摘 要》、《中国社会统计年鉴》 • 直接来源
研究者直接通过调查取得研究所需数据资料
2.1 统计数据的收集
普查
常用的统计 调查方式
抽样调查
重点调查
典型调查
简单随 机抽样
分层抽样
抽样调查
• 抽样调查是取得数据资料的最主要的一种方式,它是按照 随机原则从总体中抽取部分单位组成样本,对样本指标进 行测定,根据样本指标推断总体指标的一种非全面调查。
抽样调查的具体组织形式 抽样调查
简单随 机抽样
分层抽样
等距抽 样
整群抽样
(1)简单随机抽样
从总体N个单位中任意抽取n个单位作为样本, 使每个可能的样本被抽中的概率相等的一种 抽样方式

统计学第二章

统计学第二章

第二章统计数据的收集、整理与显示2.1统计数据的收集一、统计数据的来源1、直接来源(原始来源):分为实验和统计调查(直接观察、报告、采访、登记)2、间接来源(二手资料):出版物、网络二、统计调查组织方式1、分类①按调查单位的范围大小分:全面调查和非全面调查②按调查时间是否连续分:经常性调查和一次性调查③按调查组织方式分:统计报表和专门调查。

其中专门调查又分为普查、重点调查、典型调查、抽样调查2、统计报表制度:按照国家统一规定的各项要求,自下而上地定期向国家和主管部门报送基本统计资料的一种报告制度①优点:能保证统计资料的全面性和连续性;能保证统计资料的统一性和及时性;能满足各级部门对统计资料的需要②缺点:统计报表过多会增加基层负担;有可能由于虚假瞒报而影响统计资料质量3、普查:是指国家为详尽了解某项重要的国情国力而专门组织的一次性全面调查(主要用于搜集时点资料)①作用:可以为抽样调查提供抽样框;可以收集统计报表所不能提供的反映重大国情国力的基本统计信息②局限:由于需要大量的人力、物力、财力,不宜经常进行4、重点调查:是指为了解总体基本情况,在调查对象中只选择一部分重点单位进行调查的一种非全面调查组织方式。

(这些单位数目不多,但其标志值在总体标志总量中占有较大比重,能反映总体的基本情况)①作用:能以较少的投入和较快的速度取得总体基本情况及变动趋势的资料②局限:只适用于客观存在重点单位的情况5、典型调查:是指在对调查对象有一定了解的基础上,有意识的选择少数典型单位进行调查的一种非全面调查方式。

(指在数量表现上具有普遍意义呵呵代表性的总体单位,可以用来推断总体的数量)①作用:一定条件下能估计总体指标数值;可以用来研究新生事物②缺陷:不能确定推断的把握程度,无法计算和控制推断误差6、抽样调查:是指按照随机原则从调查对象中抽取一部分样本单位进行调查,再用样本资料推断把握总体的数量特征的一种非全面调查组织方式。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
零人口
18
零面积
统计测量尺度的作用:
第一,决定数据的整理、显示方法
第二,决定数据的分析方法
第三,决定计算机的处理方法
19
90 80 70 60 50 40 30 20 10 0
定类变量
条形图 品质变量
定序变量
圆形图
20
条形图
圆形图
14 0
12 0
定距变量 定比变量
10 0
直方图
80
60
40
20
定序测量 顺序性差异 大学本科、硕 士研究生、博 士研究生 (定序测量)
博士研究生
文盲半文盲 对受教育程度的 度量方法
25
对数量差异的度量,要注意层次
博士研究生
顺序性差异、 定比测量 绝对差异距离、 0年、6年、9年、 相对差异 12年、16年、
19年、22年 定距测量 顺序性差异、 (定比测量)
Valid
频数表
1975 1976 1977 1978 1979 1980 1981 Total
Frequency 1 7 26 119 79 21 3 256
Percent .4 2.7 10.2 46.5 30.9 8.2 1.2 100.0
典型的数据分析方法(部分)
集中趋势 定类变量 定序变量 定距变量 定比变量
对不起, 打扰了!
– 非标准式访问事先一般不制 作问卷
49
邮寄调查 (mail survey)
1. 也称邮寄问卷调查 2. 是一种标准化调查 3. 调查者与被调查者没有直接的语言交流,信息的 传递依赖于问卷 4. 通过某种方式将调查表或问卷送至某调查者手中, 由被调查者填写,然后将问卷寄回指定收集点 5. 问卷或表格的发放方式有邮寄、宣传媒介传送、 专门场所分发三种
二手数据 间接 来源
源于其他人调查或试验已 得的数据。包括各级统计 部门公开出版或公报及尚 未公开的数据;各种报刊、 网站等媒介上发布的各类 数据信息;各专业组织、 协会和市场调查单位等搜 集的数据资料。包括企业 29 内部和外部提供的。
按计量尺度的结果来看,数据分为两种类型
品质型数据
定性数据
说明事物的品质特征表现的具体类别,不能用数 值表示。由定类尺度和定序尺度计量形成,所以 又可分为分类数据和顺序数据。
绝对差异距离
定序测量 顺序性差异
文盲半文盲
对受教育程度的度 量方法
26
对于指标体系,要注意统一性
实际值 标准值 总资产贡献率 15% 10.7% 资本保值增值率 130% 120% 资产负债率 60% 60% 全员劳动生产率 20000元 16500元 成本费用利润率 4.8% 3.71% 流动资产周转率 1.8次 1.52次 产品销售率 97% 90% 环保等级 优秀 良好 ? 27
数量型数据
定量数据
说明现象的数量特征表现的,能够而且必须用数 值表现。如收入、身高、体重等。按照计量尺度 的不同又可分为定距数据和定比数据。按其表现 形式又可分为绝对(或区间)数据和比率型数据 30
数据类型与统计方法
数据类型与统计方法
定类数据
定序数据
定距数据
定比数据
品质型数据 非参数方法
数量型数据 参数方法
47
数据的收集方法
数据的收集方法
询问调查
访 问 调 查
观察实验
个 别 深 访 观 实
邮 寄 调 查
电 话 调 查
电 脑 辅 助
座 谈 会


48
访问调查 (personal interview)
• 1. 调查者与被调查者通过 面对面地交谈而获得资料 • 2. 有标准式访问和非标准 式访问
– 标准式访问通常按事先设计 好的问卷进行
定比变量或指标有绝对意义 上的零点,既可以加减运算, 也可以乘除运算。
16
定比尺度
(概念要点)
• • • • • 1. 2. 3. 4. 5. 对事物的准确测度 与定距尺度处于同一层次 数据表现为“数值” 有绝对零点 具有 或 的数学特性
零高度
零资产
真正的零: 一无所有
零重量 零体积
零产量
42
统计调查的组织方式
典型调查
总体单位
调查单位
对典型单位进行调 查,典型单位的选 择并不一定按规模 43
统计调查的组织方式
抽样调查
(sampling survey)
按照 随机原则 从调查对象中抽 取一部分样本单位进行调查,再用 样本资料推断把握总体的数量特征 的一种非全面调查组织方式 指样本单位的抽 取不受主观因素 及其他系统性因 素的影响,每个 总体单位都有均 等的被抽中机会
44
特 点 优 点
按随机原则抽取样本单位 目的是推断总体的数量特征 抽样误差可以事先计算并控制 能用较少的人力、物力和时间 达到全面调查的目的 调查资料的准确性较高、受人 为干扰的可能性较小
统计调查的组织方式
抽样调查
总体单位
调查单位
按随机原则选择调 查单位,各单位被 选中的机会相同。 45
我国统计调查方法体系改革的目标 模式是:
面的差异进行测量
对 宗教、种族、民族、性别、
定类测量
对某动物公园的评价:
对于人的主观态 度,定序尺度可 能是最好的方法
(定距以上的尺度不一定合适) 24
对数量差异的度量,要注意层次
顺序性差异、 文盲半文盲、 定比测量 绝对差异距离、 小学、初中、 高中、大专、 相对差异 顺序性差异、 定距测量 绝对差异距离
41
统计调查的组织方式
在对调查对象有一定了解的基础上, 典型调查 有意识地选择少数典型单位 进行调 查的一种非全面调估计总体指 标数值 可以补充全面调查的不足 可以用来研究新生事物
指在数量表现 上具有普遍意 义和代表性的 总体单位
局 不能确定推断的把握程度, 限 无法计算和控制推断误差
STATISTICS
第2章 统计数据的收集
1
工大经院 统计学
第二章 统计数据的收集
STAT
★ 第一节 数据的计量与类型
第二节 数据的收集
第三节 数据的调查方案与设计
2
统计研究目的 统计设计
客观 现象 数量 表现
统 计 调 查
统 计 整 理
推 断 分 析 描 述 分 析
统计 总体 数量 特征
3
统计研究的程序
普查 重点调查 典型调查 抽样调查
35
统计调查的组织方式
统计报表制度 (statistical report forms) 能保证统计资料的全面性和连续性 能保证统计资料的统一性和及时性 优点 能满足各级部门对统计资料的需要 局限
指按照国家统一规定的各项 要求,自下而上地定期向国家 和主管部门报送基本统计资料 的一种报告制度
要求: 准确、及时、
全面、系统
指直接从各调查 单位搜集的用来 反映个体特征的 数据资料
统计调查是整个统计认识活动的基础, 决定着统计认识过程及其结果的成败
34
统计调查的种类
非全面调查 全面调查
按调查单位的范围大小分为
按调查时间是否连续分为 按调查的组织方式不同分为
统计报表 专门调查
经常性调查
一次性调查
第一节 数据的计量与类型 ★ 一、数据的计量尺度
二、数据的类型
4
测量:用仪器确定空间、时间、温
度、速度、功能等的有关数值。
统计测量:运用某种方法使自然或
社会经济现象量化。 分类、 标识
测量结果:形成变量或指标
5
分类、标识即统计测量过程
自然或 社会经 济现象 按性质不同分类 变量 或指标
按数量不同分类
建立以周期性普查为基础,以经 常性的抽样调查为主体,以必要 的统计报表、重点调查、综合分 析等为补充,搜集、整理基本统 计资料的统计调查方法体系模式
46
工大经院 统计学
第二节 数据的收集
STAT
★ 一、数据的直接来源 ★ (一)数据的调查方式 ★ (二)数据的搜集方法
二、数据的间接来源
三、统计数据的质量
0 19 75 .0 19 76 .0 19 77 .0 19 78 .0 19 79 .0 19 80 .0 19 81 .0
出生
出生 Valid Percent .4 2.7 10.2 46.5 30.9 8.2 1.2 100.0 Cum ulative Percent .4 3.1 13.3 59.8 90.6 98.8 21 100.0
定 序 尺 度
按现象顺序差异进行的辨别 与区分。测量结果形成定序 变量或定序指标。 定序变量或指标确切的值是 以文字表述的,也可以用数 值标识,也仅起标签作用。 定序变量或指标各类别间有 高低优劣之分,不能随意排 列。
10
定序尺度
(概念要点)
1. 2. 3. 4. 5. 对事物分类的同时给出各类别的顺序 比定类尺度精确 未测量出类别之间的准确差值 数据表现为“类别”,但有序 具有>或<的数学特性
一个指标体 系中的指标 应属于相同 的测量尺度
工大经院 统计学
第一节 数据的计量与类型
STAT
★ 一、数据的计量尺度 ★ 二、数据的类型
28
站在数据使用者的角度,按照数据来源分类 一手数据 直接 来源
主要两个渠道:专门组织 的观察或调查和试验。 自然科学领域中,试验是 获取数据的主要手段。 社会经济生活中,调查或 观测是取得数据的重要方 法。
众数
离散趋势
异众比
相关回归
品质相关
假设检验
Q检验 2检验 Z、t检验
非参数统计
中位数 均值 异众比 标准差 等级相关 相关回归
相关文档
最新文档