统计学第二章数据收集、整理与显示
统计学:统计数据的收集、整理与显示习题与答案
一、单选题1、抽样调查中,抽取样本必须遵循什么原则。
()A.随机原则B.随意原则C.对等原则D.可比原则正确答案:A解析:随机抽样也叫概率抽样,即总体中的个体有一个事先已知的概率被抽中。
2、某市工商企业2017年生产经营成果的年报呈报时间规定在2018年1月31日,则调查期限为()。
A.一个月B.一年C.一日D.一年零一个月正确答案:A解析:调查期限:调查工作进行的起迄时间。
3、次数分布的类型主要取决于()。
A.变量是连续还是离散B.统计总体所处的条件C.社会经济现象的性质D.分组标志的选择正确答案:C解析:社会经济现象的性质决定了社会经济现象呈现何种分布。
4、以下有关典型调查的表述不正确的是()。
A.必须同其他调查结果结合起来使用B.不容易受人们主观认识上的影响C.可以检验全面调查数据的真实性D.能够补充全面调查资料的不足正确答案:B5、重点调查中重点单位是指()。
A.标志总量在总体中有很大比重的单位B.具有反映事物属性差异的品质标志的单位C.能用以推算总体标志总量的单位D.具有典型意义或代表性的单位正确答案:A二、多选题1、采用类型抽样的组织形式是()。
A.最符合随机原则B.需要对总体各单位进行分组C.适用于总体各单位标志值差异较大的总体D.组内是进行全面调查正确答案:B、C解析:类型抽样是将总体全部单位按有关标志分成若干层,然后按照随机原则从每层中分别抽取样本单位组成样本,适合于差异大的总体,能使样本结构更接近于总体结构,提高样本的代表性。
2、在组距数列中,组中值是()。
A.在开放式分组中,可参照相邻组的组距来确定B.上限和下限之间的中点数值C.在开放式分组中无法确定D.就是组平均数正确答案:A、B解析:组中值是下限与上限之间的中点值,是在假定各组内均匀分布时的一个近似值。
闭口组的组中值是上限与下限的简单算术平均数;开口组组中值的确定,一般以其相邻组的组距的来调整3、对于离散型变量数列()。
统计学第二章 统计数据的收集、整理与显示试题及答案
第二章统计数据的收集、整理与显示二、单项选择题1、人口普查的调查单位是(C )。
A、每一户B、所有的户C、每一个人D、所有的人2、对一批商品进行质量检验,最适宜采用的调查方法是(B )。
A、全面调查B、抽样调查C、典型调查D、重点调查3、下列调查中,调查单位与填报单位一致的是(D )。
A、企业设备调查B、人口普查C、农村耕畜调查D、工业企业生产经营现状调查4、抽样调查与重点调查的主要区别是(D )。
A、作用不同B、组织方式不同C、灵活程度不同D、选取调查单位的方法不同5、先对总体中的个体按主要标志加以分类,再以随机原则从各类中抽取一定的单位进行调查,这种抽样调查形式属于( D )。
A、简单随机抽样B、等距抽样C、整群抽样D、类型抽样6、对某省饮食业从业人员的健康状况进行调查,调查单位是该省饮食业的(D )。
A、全部网点B、每个网点C、所有从业人员D、每个从业人员7、调查时限是指(B )。
A、调查资料所属的时间B、进行调查工作的期限C、调查工作登记的时间D、调查资料的报送时间8、对某市全部商业企业职工的生活状况进行调查,调查对象是(B )。
A、该市全部商业企业B、该市全部商业企业的职工C、该市每一个商业企业D、该市商业企业的每一名职工9、作为一个调查单位(D )。
A、只能调查一个统计标志B、只能调查一个统计指标C、可以调查多个统计指标D、可以调查多个统计标志10、某市规定2018年工业经济活动成果年报呈报时间是2019年1月31日,则调查期限为( B )。
A、一天B、一个月C、一年D、一年零一个月11、统计分组对总体而言是( B )A、将总体区分为性质相同的若干部分B、将总体区分为性质不同的若干部分C、将总体单位区分为性质相同的若干部分D、将总体单位区分为性质不相同的若干部分12、按某一标志分组的结果表现为( B )A、组内差异性,组间同质性B、组内同质性,组间差异性C、组内同质性,组间同质性D、组内差异性,组间差异性13、设对某地区的人口按年龄分组如下:不满周岁,1—3岁,4—6岁,7—12岁,……60—64岁,65—79岁,80—99岁,100岁以上,最后一组的组中值近拟为( C )A、110岁B、104岁C、104.5岁D、105岁14、为充分利用所得到的原始资料以取得大量统计指标,在统计整理时关键是要( C )A、进行各种汇总B、进行各种计算C、充分利用分组法D、对原始资料进行分析15、按变量的性质和数据的多少划分,变量数列可分为( C )。
统计学 第二章 统计数据的搜集、整理和显示
(二)实验方式
所谓实验方式,就是运用自然科学的试验 法,通过观测人为安排条件下试验产生的各种 结果并加以记录的方式来获取数据,或通过人 为安排条件下的试验来探求某个或某些因素对 所研究事物的数量影响程度和作用方式,凭借 实验结果来揭示所考察因素与所研究事物之间 的数量因果关系。
1、实验的原则
运用实验方式需要遵循下列两个原则:均衡分散
1、普查
普查是根据特定的统计研究目的而专门组织的 一次性的全面调查,用以收集所研究现象总体的全 面资料(即总体中的所有个体都是观测单位)。 普查的组织方式一般有两种:一是建立专门的 普查机构,配备一定数量的普查人员,对观测单位 直接进行登记。如我国历次的人口普查等。二是利 用观测单位的原始记录和核算资料,颁发调查表, 由观测单位按要求填报。如物资库存普查等。
重点调查的单位可以是一些企业、行业、 也可以是一些地区、城市。此种调查方式的优点是, 所投入的人力、物力少,而又较快地搜集到统计 信息资料。一般来讲,在调查任务只要求掌握基 本情况,而部分单位又能比较集中反映研究项目 和指标时,就可以采用重点调查。
在下列问题中为了得到数据,采用什么调查? • 为了买校服,了解每个学生衣服的尺寸。 • 商检人员在某超市检查出售的饮料的合格率。 • 对占全市工业总产值五分之一的六个大型企 业进行调查,以了解全市工业总产值的基本 情况。
观测性误差
数 据 收 集 误 差
也叫登记性误差或调查性误差,它 是在调查观测的各个环节因工作粗 心或被观测者不愿很好配合而造成 的所收集数据与实际情况不符的误 差,包括计量错误、记录错误、计 算错误、抄写错误、汇总错误、计 算机输入误差等工作误差,以及被 调查者不愿或难以提供真实情况的 误差,有时还存在调查人员弄虚作 假的误差和各种人为因素干扰的误 差。 这部分误差通常是人为造成的,通 过对统计调查资料的严密审核,是 可以发现并加以更正的。观测性误 差则可能存在于任何统计调查。 因样本不能完全代表总体而产生 的估计结果与总体真实数量特征 不符的误差。根据样本不能完全 代表总体的原因不同,代表性误 差又分为系统性代表性误差和偶 然性代表性误差两种。
西南财经大学向蓉美、王青华《统计学》第三版——第2章:统计数据的收集、整理与显示
– 调查内容详细、提供重要国情国力资料、数 据的规范化程度较高
提供抽样框
总
– 特别注意
体
• 必须规定标准时间 • 在规定时间内统一进行
• 基本内容和指标解释统一并相对稳定
• 需要PPT配套视频,请加VX:1033604968 11
Statistics
2.统计报表 –概念 • 按照国家有关法规的规定、自上而下地统一 布置、自下而上地逐级提供基本统计数据。 –特点 • 全面性、稳定性、连续性、可比性 • 曾经是我国数据收集的主要方式 • 耗费大、数据质量差等等。
3
Statistics
§2.1.2 统计调查方案
调查方案的内容
调
调查
调查
查
对象
项目
其
目
调查
和调
的
单位
查表
他
4
Statistics
1.确定调查目的
调查要达到的具体目标 回答“为什么调查?” 调查之前必须明确
5
Statistics
2.确定调查对象和调查单位
调查对象:调查研究的总体或调查范围 调查单位:需要对之进行调查的单位。可以是调查
12
Statistics
第二次全国经济普查的标准时点是2008年12月31日,时
期资料为2008年度。
第六次quanguo人口普查
主要目的:人口普查是一项重大的国情国力调查。组织开
展第六次全国人口普查,将查清十年来我国人口在数量、结构、
分布和居住环境等方面的变化情况,为科学制定国民经济和社
会发展规划,统筹安排人民的物质和文化生活,实现可持续发
重点单位——标志值在总体标志总量中占有 较大比重的单位
统计学第二章统计调查
上一页 下一页
统计数据收集的种类
按收集对象的范围大小分为 按收集时间是否连续分为
按收集的组织形式分为
按收集的方式不同分为
实验方式 调查方式
非全面调查 全面调查
经常性调查 一次性调查 统计报表 专门调查
统计报表 普查
重点调查
抽样调查等
全面调查
调查 范围
统
非全面调查
计
调
调查
连续(经常性)调查
查 形
时间
• 时期现象:指标据反映的起止日期。 • 时点现象:就是规定的统一标准时点。 • 数据收集期限:完成数据收集工作的起止时间。
包括收集资料和报送资料整个工作所需时间。
数据 所属 时间 {客观 时间}
等于
数据 资料 所属 时间
数据 收集 期限 {主观 时间}
等于
数据 收集 工作 时间
起讫时间(一段时期内的数据)
统计报表过多会增加基层负担 有可能由于虚报瞒报而影响统计资料质量
单位
• 观测标志(项目):
• 是根据数据收集目的所确定。包括品质标志 和数量标志。
• 拟定数据收集项目应注意: • 1、观测标志必须是数据收集目的所需要的并
且是确实可取得资料的。 • 2、观测标志必须相互联系,便于统计分析和
核对资料的差错。 • 3、观测标志的含义必须明确,不能 有两个或
以上的解释。 • 4、观测标志的表达形式要明确。用文字还是
①方案设计
②搜集数据
③数据处理
④报告写作
⑤验收
注:6 月 30 日前完成方案设计,问卷的定稿印刷发放
7 月 25 日前完成问卷收回与审核,并制定数据处理方案(数据库框架)
ห้องสมุดไป่ตู้
统计学第二章数据搜集整理
普查的规定
• • • • 规定统一的调查项目 规定统一的标准时点 规定统一的普查周期 例如:第六次人口普查,调查表,性别、年龄、 民族、受教育程度、行业、职业、迁移流动、社 会保障、婚姻生育、死亡、住房情况等 • 截止时间,标准时点是2010年11月1日零时 • 人口普查的周期是10年,2000年,2010年
频率
fi
fi
fi :第i组频数
32
(2)频率的性质 (A )
0
fi
1 fi
(B ) (3)频数密度与频率密度(消除异距分组对频数影响) (A) (2.7) 频数密度=频数/组距 (B) (2.8) 频率密度=频率/组距 各组频数密度与各组组距乘积之和等于总体单位数,各 组频率密度与各组组距乘积之和等于1.
29
组数的确定(H.A.Struges经验公 式)
•
n = 1 + 3.3logN
N – 24 – 44 – 89 – 170 – 359 n 5 6 7 8 9
(斯特杰斯)
• • 15 • 25 • 45 • 90 • 180 • 组距=
30
四、频数(次数)分布
1.频数分布的基本理论
(1)频数分布的定义 在统计分组的基础上,将总体所有单位按某一标志 归类排列,并计算其相应出现的次数。 频数分布是统计整理的重要形式,通过对零乱的、 分散的原始资料进行有次序的整理,形成一系列反映 总体各组之间单位分布状况的数列,即分布数列。
10
• 概率抽样的特点: 1、样本单位按随机原则抽取,排除了主观因素对 选样的影响。 2、根据部分调查的实际资料对调查对象总体的数 量特征作出估计。 3、抽样误差可以事先计算并加以控制。 • 抽样调查的适用场合
统计学(4)
.
第一节 数据的收集
统计报表
按实施 范围分
按调查 范围分
按主管 系统分
按填报 单位分
按报送 方式分
国部地 全 非 基 专 基 综 电 书 家门方 面 全本 业 层 合 讯 面 统统统 统 面统 统 报 报 报 报 计计计 计 统计 计 表 表 表 表 报报报 报 计 报 表 表表表 表 报表 报
明确规定调查资料的起止时间; 调查资料登记时间:是指对调查单位进行调查并取得调
查资料的时间; 调查工作期限:是指从调查工作开始到调查工作结束所
经历的全部时间。 2.调查空间: 调查单位应在什么地点接受调查。
.
第一节 数据的收集
(五)制定调查的组织实施计划 调查的组织计划,是指为确保实施调查的具体工作计划。 调查的组织实施计划应包括以下内容: ➢ 建立调查工作的组织领导机构,做好人员的配备与分工; ➢ 做好调查前的准备工作。如宣传教育、人员培训、文件
重点单位:是指这些单位的标志总量在总体标志总量中占 有绝大比重的单位。
选取重点单位的原则:根据调查任务和调查对象的基本情 况确定选取的重点单位及数量;也要注意选取管理比较健全、 业务能力强、统计工作基础好的单位为重点单位。
特点:调查单位少;调查对象的标志值比较集中于某些单 位的场合。
注意:重点单位的选择是客观的。只适用于客观存在着重 点单位的情况。
注:1.资料来源于《世界概况》,由美国中央情报局(CIA出版)最权威报道; 2.中国2010年人均GDP为4283美元,居世界182个国家的95位。
.
第一节 数据的收集
1.定类尺度(类别尺度、列名尺度) 是对统计客体类别差异所作的反映,是最粗略、计量层次 最低的测量尺度。
《统计学》教学课件 第二章 统计数据收集、整理与呈现
全面调查 非全面调查
普查、统计报表制度、抽 样调查、重点调查和典型 调查等是常见的统计调查 方式,其中普查即全面调 查,其余的为非全面调查。
1.普查 普查是根据特定研究目的而专门组织的一次性的全 面调查,以收集研究对象的全面资料。
目前,我国组织实施的普查主要包括人口普查、经济普查和 农业普查三种。
缺然点后:通过典细型致单分析位典的型选单位取以受认人识总为成功经验、找出失败 现(一3)定突的出倾选典向式性。,突出且选典典型式是调指查选结择总体教中训的或先观进察单新位生、事后物进的单情位况或。新生事 果物不作宜为典用型以单推位,算进全行面深入数细据致。的调查。
2.报告法
3.采访法
又称凭证法,指要求调查 由调查人员对被调查者进
对象以原始记录、台帐和 行采访,根据被调查者的
核算资料为依据,向有关 答复来收集数据的方法,
单位提供统计资料的方法。 包括面谈访问、电话访问、
邮寄访问 和网络访问等。
4.登记法 指当事人根据有关法制法规规定,在开展某些活动或 发生某事时,主动到有关机构进行登记,填写有关表 格,提供有关统计信息。
④滚雪球抽样。是一种针对稀疏总体进行的抽样调查,抽选样本时 先找到几个符合条件的调查单位,然后通过这些调查单位找到更多 符合条件的调查单位,以此类推,样本如同滚雪球般由小变大,直 至达到要求的样本数为止。
⑤流动总体抽样。流动总体抽样是采用“捕获—放回—再捕获”的方式 来估计总体。
4.重点调查
重点调查也是一种非全面调查,是对数据收集对象总体 中的部分重点单位进行观测的统计调查方式。
频数(人) 频数(%)
30岁以下
39.3
30-40岁
37.9
40-50岁
统计学第二章统计数据的收集、整理与显示习题
第二章统计数据的收集、整理与显示习题一、填空:1.统计数据收集是根据统计研究预定的目的和任务,运用科学的,有计划、有组织地反映客观现实的统计资料的过程。
2.搜集统计数据的方法有:(1)直接观察法,(2),(3)(4)。
3.统计调查按搜集资料的组织方式不同,可以分为普查、、、。
4.我国现行的统计调查体系是:以必要的周期性的普查为基础,经常性的为主体,同时辅之以、科学推算和部分全面报表综合运用的统计调查方法体系。
5.统计调查的方案一般包括如下几项内容:(1)明确调查目的,(2),(3)(4)(5)(6)(7)。
6.数据整理是对统计调查所搜集到的各种数据进行,或是对已有的综合统计资料进行再整理。
7.数据整理的程序包括:(1)统计资料的审核,(2),(3)或绘制统计图,(4)统计资料的积累、保管和公布。
8.根据统计研究的目的和客观现象的内在特点,按(或几个标志)把被研究的总体划分为若干个的组,称为统计分组。
9.统计分组,必须遵循两个原则:和。
10.统计上规定,凡是总体某一个单位的变量值是相邻两组的界限值,这一个单位归入作为的那一组内,即所谓“上限在不内”原则。
11.统计分组必须先对所研究现象的作出全面、深刻的分析,确定所研究现象的属性及其内部差别,而后才能够选择出反映事物本质特征的分组标志。
二、单选题1.统计调查对象是()A.总体各单位标志值B.总体单位C.现象总体D.统计指标2.我国统计调查体系中,作为“主体”的是()A.经常性抽样调查B.必要的统计报表C.重点调查及估计推算D.周期性普查3.要对某企业生产设备的实际生产能力进行调查,则该企业的“生产设备”是()A.调查对象B.调查单位C.调查项目D.报告单位4.对银行职工进行调查,调查对象是()A.所有银行B.银行所有职工C.每个银行D.银行每个职工5.全国人口普查中,总体单位是()A.每一个人B.每一个家庭C.每个银行D.银行每个职工6.报告单位亦称填报单位,它是()A.调查项目的承担者B.负责向上级报告调查内容的单位C.构成调查对象的每一个单位D.与调查单位相一致7.城镇家庭生活水平调查一般采用()A.重点调查B.典型调查C.普查D.抽样调查8.在统计资料的整理工作中,对原始资料的审核,重点是审核原始资料的()A.资料的准确性与完整性B.资料的完整性与代表性C.资料的准确性与及时性D.资料的准确性与全面性9.按某一标志分组的结果表现为()A.组内同质性、组间同质性B.组内同质性、组间差异性C.组内差异性、组间同质性D.组内差异性、组间差异性10.在统计分组时,若某个标志值刚好等于相邻两组上下限数值时()A.将此数值归入上限所在组B.将此数值归入下限所在组C.归入这两组中任意一组均可D.另设一组,归入其中11.在变量数列中,频率是指()A.各组分布次数相互之比B.各组的比率相互之比C.各组单位数与总体单位数之比D.各组的单位数12.当某一总体内最大变量值与最小变量值一定时,意味着()A.组距一定B.组数一定C.全距一定D.组限一定13.把保定市所有商店按商品销售额分组()A.只能进行单项式分组B.只能进行组距式分组C.既可以进行单项式分组,也可以进行组距式分组D.无法进行分组14. 统计表的构成,从形式上看包括()A.总标题和数字资料B.主词和宾词C.总标题、横行和纵栏标题三部分D.总标题、横行标题、纵栏标题和指标数值15. 统计表的构成,从内容上看,包括()A.总标题和指标数值B.主词和宾词C.总标题、横行和纵栏标题三部分D.总标题、横行标题、纵栏标题和指标数值16.编制单项数列,作为分组依据的变量是:甲、离散型变量;乙、连续型变量。
【统计学 精】第二章 统计数据的搜集和整理
(2)对普查资料进行必要的修正。
4、典型调查
• 这是一种专门组织的非全面调查。它根据调查的目的,在对所研 究的对象进行初步分析的基础上,有意识地选取若干(一个或少 数几个)具有代表性的单位进行调查和研究,借以认识事物发展 变化的规律。
• 重点调查适用的条件:
•
当统计调查的任务只要求了解调查对象的基本情况,而
调查对象中确实存在重点单位时,比较适宜进行重点调查。
• 例如,为了掌握全国钢铁生产的基本情况,可以选出鞍钢、宝钢、首钢、 马钢、武钢等几个大型钢铁企业调查,以便对钢铁产量有个大致的了解。
3、抽样调查
•抽样调查是一种非全面调查,是实际中应用最广 。 泛的一种调查方式
(3) 是运用概率的估计方法 。
• 例如:通过抽样推断得出,厦大学生的平均 月支出在(420,470)元上的可靠性为90%。
(4)抽样推断的误差可以事先计算,并加以控制。
• 抽样调查的优越性: 第一,经济性强。 第二,时效性高。 第三,适应面广。 第四,准确性大。
抽样调查的适用范围 (1)一些不可能或不必要进行全面检查的社会 现象。
性和时效性。
三、统计分组
(一)统计分组的概念和种类
• 1、定义:统计分组根据统计研究的目的和客 观现象的内在特点,按照某个标志或几个标 志把研究的总体划分为若干性质不同的部分 (或组)的一种统计方法。
统计分组
• 2.兼有“分”和“合”的双重含义: •对于现象总体,是 “分”;对于单位, 是“合”。 • 对于分组标志,是“分”,对于其他标 志,是“合”。
第二章+统计资料的收集、整理与显示
特点
目的是推断总体的数量特征;
抽样误差可以事先计算并控制;
能用较少的人力、物力和时间达到全面调查
作用
的目的; 调查资料的准确性较高、受人为干扰的可能 性较小。
抽样调查应用范围:
1.不能或难以进行全面调查的总体的数量特征。 如无限总体、范围过大的有限总体等,以及具有破坏性的 产品质量检测等; 2.发展变化比较稳定和有规律性而不必进行全面调查的现象总 体的数量特征。
事物发展的一般规律。 行的典型调查。
5、抽样调查 抽样调查是一种专门组织的非全面调查,它是按照随机原 则从调查对象中抽取一部分样本单位进行调查,再用样本指标 推断总体的数量特征的一种调查组织方式。
随 机 原 则
样本单位的抽取不受主观因素及其他 系统性因素的影响,每个总体单位都有均 等的被抽中机会
5、抽样调查 按随机原则抽取样本单位;
3、重点调查 能以较少的投入和较快的速度取得总体基
作用
本情况及变动趋势的资料;
对重点单位的选择不带有主观性
局限
只适用于客观存在着重点单位的情况
4、典型调查 典型调查也是专门组织的一种非全面调查,它是根据调 查研究的目的和任务,在对调查对象有一定了解的基础上,
有意识地选择少数典型单位 进行调查的一种调查组织方式。
统计调查的种类
按调查单位的范围大小分为 按调查时间是否连续分为 按调查的组织方式不同分为 统计报表 专门调查
非全面调查
全面调查
经常性调查 一次性调查
普查
重点调查
典型调查
抽样调查
2、统计调查的种类 (1)按组织形式分为: ①统计报表: 根据统计法规的规定,按一定的表式和要求,自上而下
统一部署,自下而上逐级提供统计资料的一种统计调查方法。
应用统计学第2章 数据的搜集与整理
掌握数掌握数据的测量尺度及常用类型; 了解统计数据搜集的意义; 掌握统计分组、分配数列的编制方法; 掌握数据图表展示方法。
本章教学目的
第2章 数据的搜集与整理
第2章
统计分组、分配数列的编制方法数据图表展示方法
本章重点和难点
第2章 数据的搜集与整理
第2章
2.4 分配数列
第2章
1.列表法
2.4 分配数列
2.4.3 品质分配数列的表示方法
第2章
2.图示法(1)条形图。条形图是指用宽度相同、高度不同的条形来表示数据变化的图形。条形图可以横向展示,也可以纵向展示,纵向展示时又称柱形图。
2.4.3 品质分配数列的表示方法
2.4 分配数列
第2章
2.图示法(2)饼图。饼图是用圆形及圆形面积的大小来表示数据数值大小的图形。饼图通常用来表示研究总体中各个组成部分的比例分布,对于结构性的研究问题非常实用。
2.5.2 统计表的分类
2.5 统计表
第2章
2.分组表 统计表的主词按照某种标志进行分组后所形成的表称为分组表,利用分组表可以展示统计总体不同现象的特征,说明各个分组之间的内部结构和相互关系,如表2-13所示。
2.5.2 统计表的分类
2.5 统计表
第2章
3.复合表统计表的主词按照两个或两个以上的标志进行分组的表称为复合表,如表2-14所示。
2.1.1 数据的测量尺度
第2章
2.1 数据的测量尺度与常用类型
第2章
1.绝对数、相对数和平均数绝对数是数据最基本的表现形式,是其他数据指标形成的基础。相对数反映了研究对象的相对水平,由两个相互联系的绝对数的对比而得到。平均数反映了研究对象的总体表现水平,是一个抽象了的研究对象总体各单位在某一数量标志下的表现差异,表示研究对象的总体各单位的一般水平,而不是某个单位的具体水平。
第二章统计数据的搜集与整理
第⼆章统计数据的搜集与整理第⼆章统计数据的搜集与整理(⼀)教学⽬的通过本章的学习,了解统计数据搜集与整理的基本理论与⽅法,掌握各种⽅法的特性。
(⼆)基本要求要求灵活运⽤各种数据搜集的⽅式⽅法,并对所得数据进⾏加⼯整理,为以后各章学习打下基础。
(三)教学要点1、数据搜集的⽅式⽅法;2、统计调查⽅案的设计;3、统计分组;4、变量数列的编制;5、统计数据的显⽰。
(四)教学时数9课时(五)教学内容本章共分四节:第⼀节数据的计量与类型⼀、数据的计量尺度在计量学的⼀般分类⽅法中,依据对事物计量的精确程度,可将所采⽤的计量尺度由低级到⾼级、由粗略到精确分为四个层次,即名类尺度、顺序尺度、区间尺度和⽐尺度。
1.定类尺度定类尺度(Nominal scale,亦称分类尺度、列名尺度等)是这样⼀种品质标志,按照它可对研究客体进⾏平⾏的分类或分组,使同类同质,异类异质。
例如,按照性别将⼈⼝分为男、⼥两类;按照经济性质将企业分为国有、集体、私营、混合制企业等。
这⾥的“性别”和“经济性质”就是两种名类尺度。
名类尺度是最粗略、计量层次最低的计量尺度,利⽤它只可测度事物之间的类别差,⽽不能了解各类之间的其他差别。
名类尺度计量的结果表现为某种类别,但为了便于统计处理,例如为了计算和识别,也可⽤不同数字或编码表⽰不同类别。
⽐如⽤1表⽰男,0表⽰⼥;⽤1表⽰国有企业,2表⽰集体企业,3表⽰私营企业,等等。
这些数字只是不同类别的代码,决不意味着它区分了⼤⼩,更不能进⾏任何数学运算。
名类尺度能对事物做最基本的测度,是其他计量尺度的基础。
2.定序尺度定序尺度(Ordinal scale,亦称序数尺度、顺位尺度等)是这样⼀种品质标志,利⽤它不仅能将事物分成不同的类别,还可确定这些类别的等级差别或序列差别。
例如“产品等级”就是⼀种测度产品质量好坏的顺序尺度,它可将产品分为⼀等品、⼆等品、三等品、次品等;“考试成绩”也是⼀种顺序尺度,它可将成绩分为优、良、中、及格、不及格等;“对某⼀事物的态度”作为⼀种顺序尺度,可将⼈们的态度分为⾮常同意、同意、保持中⽴、不同意、⾮常不同意,等等。
2020年10月自考《统计学》2020第二章 数据的整理与展示1
科技论文篇数 58573 6858 1369 7262 6801 12027 294 9714 14248 139884 24304 127234 5075 355070
page10
分类数据的整理与展示
数
据
的
整
顺序数据的整理与展示
理
与
展
示
数值数据的整理与展示
品质数据
分类整理
品质数值型数据
分组整理
11
60 ~ 70
15
30
70 ~ 80
18
36
80 ~ 90
10
20
90 ~ 100
2
4
合计
50
100
向上累计
频数
5 20 38 48 50
频率(%)
10 40 76 96 100
—
—
向下累计
频数
50 45 30 12 2
频率(%)
100 90 60 24 4
—
—
2/4/2021
page20
四、次数分布的主要类型
某班学生英语成绩频数分布表
成绩分布 59 69 79 89 100
频数 0 1 6 8 5
2/4/2021
page28
(三)列联表
列联表是将观测数据按两个或更多属性(定性变量)分类 时所列出的频数表。列联表又称交互分类表,所谓交互分 类,是指同时依据两个变量的值,将所研究的个案分类。 交互分类的目的是将两变量分组,然后比较各组的分布状 况,以寻找变量间的关系。
统计整理步骤:
1.设计和制订统计资料的汇总方案。 2.对原始资料进行审核和检查。 3.用一定的组织形式和方法,对原始资料进行分组、汇总和计算。 4.对整理好的资料再一次进行审核,以便及时发现和纠正汇总过程中的各种 差错。
管理统计学 第2版 第二章 统计数据的收集整理与显示
(4)系统抽样
首先将总体中各 单位按一定顺序 排列,根据样本 容量要求确定抽 选间隔,然后随 机确定起点,每 隔一定的间隔抽 取一个单位的一 种抽样方式。是 纯随机抽样的变
种
最主要的优势就 是经济性。最大 的缺陷在于总体 单位的排列上。 一些总体单位数 可能包含隐蔽的 形态或者是“不 合格样本”,调 查者可能疏忽, 把它们抽选为样
• 普查需要规定标准的时点:如第五次人口普查规定的标准时间 为2010年11月1日零时为标准时间。
统计报表
• 统计报表是按照国家有关的规定,自上而下同一布置,自下而上逐级 提供统计资料的调查组织方式。
• 统计报表是我国特有的一种统计调查方式,是建立在各基层单位原始 记录的基础上的一种统计调查方式,由于统计报表是逐级上报和汇总 的,有利于各级部门了解本地区、本部门或本行的的社会和经济发展 现状。
2.1 统计数据的收集
数据的来源
• 间接来源 研究者直接从公开出版物或通过网络渠道获取
所需数据,如《中国统计年鉴》、《中国统计摘 要》、《中国社会统计年鉴》 • 直接来源
研究者直接通过调查取得研究所需数据资料
2.1 统计数据的收集
普查
常用的统计 调查方式
抽样调查
重点调查
典型调查
简单随 机抽样
分层抽样
抽样调查
• 抽样调查是取得数据资料的最主要的一种方式,它是按照 随机原则从总体中抽取部分单位组成样本,对样本指标进 行测定,根据样本指标推断总体指标的一种非全面调查。
抽样调查的具体组织形式 抽样调查
简单随 机抽样
分层抽样
等距抽 样
整群抽样
(1)简单随机抽样
从总体N个单位中任意抽取n个单位作为样本, 使每个可能的样本被抽中的概率相等的一种 抽样方式
统计学第二章
第二章统计数据的收集、整理与显示2.1统计数据的收集一、统计数据的来源1、直接来源(原始来源):分为实验和统计调查(直接观察、报告、采访、登记)2、间接来源(二手资料):出版物、网络二、统计调查组织方式1、分类①按调查单位的范围大小分:全面调查和非全面调查②按调查时间是否连续分:经常性调查和一次性调查③按调查组织方式分:统计报表和专门调查。
其中专门调查又分为普查、重点调查、典型调查、抽样调查2、统计报表制度:按照国家统一规定的各项要求,自下而上地定期向国家和主管部门报送基本统计资料的一种报告制度①优点:能保证统计资料的全面性和连续性;能保证统计资料的统一性和及时性;能满足各级部门对统计资料的需要②缺点:统计报表过多会增加基层负担;有可能由于虚假瞒报而影响统计资料质量3、普查:是指国家为详尽了解某项重要的国情国力而专门组织的一次性全面调查(主要用于搜集时点资料)①作用:可以为抽样调查提供抽样框;可以收集统计报表所不能提供的反映重大国情国力的基本统计信息②局限:由于需要大量的人力、物力、财力,不宜经常进行4、重点调查:是指为了解总体基本情况,在调查对象中只选择一部分重点单位进行调查的一种非全面调查组织方式。
(这些单位数目不多,但其标志值在总体标志总量中占有较大比重,能反映总体的基本情况)①作用:能以较少的投入和较快的速度取得总体基本情况及变动趋势的资料②局限:只适用于客观存在重点单位的情况5、典型调查:是指在对调查对象有一定了解的基础上,有意识的选择少数典型单位进行调查的一种非全面调查方式。
(指在数量表现上具有普遍意义呵呵代表性的总体单位,可以用来推断总体的数量)①作用:一定条件下能估计总体指标数值;可以用来研究新生事物②缺陷:不能确定推断的把握程度,无法计算和控制推断误差6、抽样调查:是指按照随机原则从调查对象中抽取一部分样本单位进行调查,再用样本资料推断把握总体的数量特征的一种非全面调查组织方式。
统计学基础2 3
一、绝对数和相对数
(一)绝对数
绝对数(亦称总量指标)是统计资料经过汇总整理后得到的反映总体规模和水平的总和指标。
作用(1)反映一个国家的国情和国力,一个地区或一个企业的人力、物力、财力。
(2)是进行经济核算和经济活动分析的基础。
(3)是计算相对指标和平均指标的基础。
分类:按反映总体的பைடு நூலகம்容分:变量总值/单位总数
3.在确定集中趋势指标的过程中,算术平均数比中位数和众数使用了更多的数据信息。
4.对于钟形分布且数据量很大时,三种集中趋势指标有如下三种数量关系:
应用平均指标的原则
1.必须是同质的量方可平均;
2.总平均数与组平均数结合分析;
3.集中趋势与离散趋势结合分析.
三、离散趋势的测定
标志变异指标是反映变量分布离散趋势、与平均指标相匹配的指标。
统计分组
对于定性数据就是依据属性的不同将数据划分成若干组,对于定量数据就是依据属性数值的不同将数据划分成若干组。
组内同质性,组间差异性。
频数分布编制
分组的关键
变量的选择,选择与研究的问题有关的变量。
组限的确定。应遵循穷尽和互斥原则。
定性数列编制:
组限的确定一般比较简单。
定量变量编制:
分为单项数列和组距数列两种形式。
3.确定组限
应能把现象的不同类型划分出来。
要考虑到数据是连续性变量还是离散型变量。
无法确定实际数据的取值范围,或者数据中存在极端数值,可采用开口组的形式。
4.确定组中值:(上限+下限)/2,开口组
二、统计数据的展示
当统计数据比较多时,就应该制作表格或者图形进行展示,使数据的重要特性能从表格或者图形中直观地反映出来,这样可提高分析数据和解释数据的效率。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章数据搜集、整理与显示Ⅰ.学习目的本章阐述统计数据搜集、整理与显示的理论与方法,通过学习,要求:1.了解统计数据的类型及其搜集方法;2.了解普查、统计报表、抽样调查、重点调查等各种统计调查组织形式的特点及其适用场合;3.掌握统计分组方法;4能够编制分布数列;5.能够运用各种统计图表。
Ⅱ.课程内容要点第一节数据的搜集一、数据搜集数据是人们对现象进行调查研究所搜集、整理、分析和解释的事实和数字,是对客观现象进行计量的结果。
数据搜集就是根据统计研究预定的目的和任务,运用相应的科学的调查方法与手段,有计划、有组织地搜集资料的过程。
数据的计量尺度有四种定类尺度是按照某种属性对客观事物进行平行分类或分组的一种测度,定类尺度的值是以文字表述的,可以用数值标识,但仅起标签作用。
定序尺度是把各类事物按一定特征的大小、高低、强弱等顺序排列起来,构成定序数据。
它是对事物之间等级或顺序差别的一种测度。
定序尺度不仅可以测度类别差,还可以测度次序差,并可比较大小,但其序号仍不能进行加减乘除计算。
定距尺度是对事物类别或次序之间间距进行的一种测度。
定距尺度不仅能区分事物的类别、进行排序、比较大小,而且可以精确地计量大小的差异,可以进行加减运算,没有绝对零点。
定比尺度是对事物之间比值的一种测度,定比尺度能区分类别、排序、比较大小、求出大小差异、可采用加减乘除运算,具有绝对零点。
从不同方面数据划分为不同类型。
根据数据反映的现象的特征不同,可以归结为两类:品质数据(亦称定性数据)和数量数据(亦称定量数据)。
品质数据是由定距尺度和定比尺度计量所形成的数据,数量数据是由定距尺度和定比尺度计量所形成的数据。
根据数据反映的现象的时间不同,可以将数据分为横截面数据和时间序列数据。
横截面数据是指在同一时间对同一总体内不同单位的数量进行观察而获得的数据。
时间序列数据是指在不同时间对同一总体的数量表现进行观察而获得的数据。
根据数据的搜集方法,可以将数据分为观察数据和实验数据。
根据数据的来源渠道,可以将数据分为直接数据和间接数据。
二、数据搜集的方法数据搜集的方法有直接观察法、报告法(通讯法)、采访法、登记法和实验设计调查法。
三、统计调查的形式普查是一种非经常性的全面调查,通过普查可以掌握大量、详细、全面的资料。
统计报表制度是依照国家有关法规自上而下地统一布置,按照统一的表式、统一的项目、统一的报送时间和程序,自下而上地逐级地定期地提供统计资料的一种调查方式。
抽样调查是按随机原则从调查对象中抽取一部分单位作为样本进行观察,然后根据所获得的样本数据,对调查对象总体特征作出科学推断。
重点调查是在调查对象中,只选择一部分重点单位进行的非全面调查。
重点调查的前提是必须存在重点单位。
典型调查是从众多的调查研究对象中,有意识地选择若干个具有代表性的典型单位进行深入、周密、系统地调查研究。
典型调查有解剖麻雀型和划类选典型两种类型。
四、统计调查体系统计调查体系是指若干相互联系的统计调查方法所构成的整体。
我国统计调查体系的目标模式是:建立以必要的周期性的普查为基础,经常性的抽样调查为主体,同时辅之以重点调查、科学推算和部分全面报表综合运用的统计调查方法体系。
五、数据搜集方案的设计数据搜集方案的设计包括6个内容:明确调查目的、确定调查对象和调查单位、确定调查项目、调查表格和问卷的设计、确定调查时间和确定调查的组织实施计划。
六、统计数据的主要来源统计数据来源于登记、调查和实验,对于应用统计数据进行分析的人员而言,统计数据的主要来源是直接来源和间接来源两个渠道。
第二节 数据的整理一、统计数据的整理统计数据的整理是将搜集到的各种原始数据条理化、系统化,使之符合统计分析与推断要求。
通过整理可以大大简化数据,更有效地显示和提供所包含的统计信息。
二、统计分组统计分组是根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组。
从分组的性质来看,分组兼有分和合双重含义。
统计分组应遵循穷尽与互斥两个原则。
统计分组可以按照不同的标志进行分类。
统计分组按某一分组的标志的多少和组合情况分为简单分组和复合分组;按分组的标志的性质不同,分为品质分组(或称属性分组)和数量分组(或称变量分组);按分组的作用和任务不同,分为类型分组、结构分组和分析分组。
三、频数分布1、频数分布由两个要素构成,一个是总体按某标志所分的组,另一个是各组所出现的单位数或各组单位数占总体全部单位数的比值,即频数或频率。
2、频数分布的类型。
频数分布主要有如下分类,即:⎪⎩⎪⎨⎧⎩⎨⎧不等距变量数列等距变量数列组距式变量数列单项式变量数列变量数列中,各组数量界限的确定必须能反映事物质的差别,采用适当的分组形式,确定相宜的组距、组限。
对于组距式分组,须计算组距、组数、组中值。
开口组的组距视同相邻组的组距。
3、频率的两个性质(1)任何频率都是界于0和1之间的一个分数,即:1 ≤i if f ∑≤ 1(2)各组频率之和等于1,即: 1i iff ∑∑= 4、频数密度与频率密度为消除异距分组所造成的影响须计算频数密度。
频数密度=频数/组距,频率密度=频率/组距5、向上累计频数(或频率)分布,其方法是先列出各组的上限,然后由标志值低的组向标志值高的组依次累计。
向下累计频数(或频率)分布,其方法是先列出各组的下限,然后由标志值高的组向标志值低的组依次累计。
累计频率的特点:(1)第一组的累计频率等于第一组本身的频率;(2)最后一组的累计频率等于1。
6、频数分布的类型有三种:钟型分布、U 型分布和J 型分布。
第三节 数据的显示一、统计表统计表是由总标题,横行标题、纵栏标题、(线条)和指标数值四部分组成;从内容上看,统计表是由主词和宾词两部分构成。
主词是统计表要说明的总体或总体分成的多个组,宾词是说明主词的统计指标。
1、统计表按照主词是否分组及分组的情况可以分为三种:简单表、简单分组表、复合分组表。
简单表是指主词未经任何分组的统计表。
简单分组表是指主词按一个标志分组的统计表。
复合分组表是指主词按两个或两个以上标志重叠分组的统计表。
2、根据宾词分类,统计表也分为三种:简单排列、平行排列和重叠排列。
简单排列指宾词不加任何分组、按一定顺序排列在统计表上。
平行排列指宾词栏中各分组标志彼此分开,平行排列。
重叠排列:指统计指标同时有层次地按两个或两个以上标志分组,各种分组层叠在一起,宾词的栏数等于各种分组的组数连乘积。
二、统计图统计图是指利用各种图形来表现统计资料的形式。
它是以点、线、面积、体积和角度等说明、表现数据的统计手法。
统计图一般可分为几何图、象形图和统计地图三类。
最常用的是几何图。
三、统计分析报告统计分析报告是指对统计资料经过系统整理并进行了深入分析之后,将所得的分析研究结果,用文字报告(结合相应图表及模型)的形式表达,以供有关方面参考或使用的书面资料。
Ⅲ. 考核知识点与考核要求一、统计数据的计量与类型(一)识记:四种数据计量尺度的含义;数据两种类型的含义。
(二)领会:四种数据计量尺度的区别和特征。
二、统计调查、统计调查体系及各种调查形式(一)识记:调查对象、调查单位、填报单位和调查时间概念的含义。
(二)领会:调查对象、调查单位和报告单位相互之间的关系;调查时间和调查时限的含义。
(三)应用:从某个具体的统计研究目的搜集实际资料的需要出发,设计调查方案和问卷。
三、统计分组的原则与方法(一)识记:统计分组的含义;统计分组的种类;组中值等的含义。
(二)领会:统计分组的作用、选择分组标志的重要性及基本要求;按数量标志分组的目的;单项式分组及组距式分组的划分条件及表现形式。
统计分组的种类;在连续组距式分组中,当一个单位的变量值是相邻两组的界限值时的统计处理原则。
(三)应用:能够根据研究目的和客观现象的特点选择适当的分组方法进行统计分组。
四、频数分布的理论和方法(一)识记:频数分布的两个要素;频率、频数密度、频数密度、累计频数和累计频率概念的含义及其特点。
(二)领会:频数分布的作用、累计频数及累计频率的计算及作用。
(三)应用:利用实际资料进行频(次)数频数分布,并向上、向下累计。
五、统计数据的显示(一)识记:统计表与统计图的概念、结构、内容及种类。
(二)领会:统计表按主词结构分类和按宾词设计分类方法及这两种分类的区别;不同的统计表与统计图的适用条件。
(三)应用:根据具体资料按规则编制统计表并绘制统计图。
Ⅳ.习题详解一、选择题1.B2.A3.A4.B5.A6.D7.ABD8.CD9.ACDE 10.ABDE二、问答与计算题1.答:抽样调查的理论依据是概率论、数理统计,抽样分布理论指明了样本指标和相应的总体指标之间存在的内在联系,且其误差的分布是有规律可循的。
实施抽样调查,样本是按随机原则抽取的,排除了主观因素的影响,保证样本对总体的代表性。
所以,以样本资料推断总体数量特征是有科学依据的。
2.答:分组应遵循“互斥原则”,即总体任何一个单位只能归属于某一组,而不能同时归属于几个组。
这种分组方法违背“互斥原则”,例如,某一观众是少女,她可以分在“女”组,又可以分在“少”组,所以,这种分组方法不合适。
3.答:统计分组应遵循的原则是穷尽原则和互斥原则。
设20个企业的产值利润率分别是:单位:%6 2 9 4 25 4 10 27 9 812 8 17 16 10 18 14 24 11 9具体分组如下:产值利润率的取值范围从0——30%,使20个企业都有组可归,这就遵循了分组的“穷尽原则”。
其中有两个企业的产值利润率为10%,该数值同时作为相邻两组的界限值,统计上规定“上限不在内”,把这两个企业列在第2组,这就遵循了“互斥原则”。
4.解:(1)(2)。