统计学 第2章 统计数据的收集整理与显示(第二部分)
第2章统计数据的搜集与整理精品PPT课件
▪ 优点:应用范围广、结果正确、直接
▪ 缺点:成本高、研究时间长。
统计学
2-15
统计调查的组织方式
►统计报表
▪ 依据国家统计局或国家各行政管理的规定,自上而下 地统一布置,以一定的原始记录为依据,按照统一的 表式、指标、时间和程序自下而上地逐级提供基本统 计资料的调查方式。
►专门调查
▪ 普查
▪ 抽样调查
▪ 重点调查
►重点单位是指在全体中虽然数目不多,所占比不 大,但调查标志值却占较大比重。
▪ 典型调查
►有意识地选择有典型意义或具有代表性的单位。
统计学
2-16
统计报表
►是我国定期搜集基本统计资料的一种重要形式。 ►特点
▪ 来源于基层单位的原始记录 ▪ 项目稳定,有利于资料积累和动态比较
►种类
▪ 国家、部门和地方统计报表 ▪ 全面统计报表和非全面统计报表 ▪ 定期报表和年报 ▪ 基层表表和综合报表 ▪ 电讯报表和书面报表
►统计调查方法
▪ 现场观察法、报告法、问卷法、访谈法、实验 采集法等。
►统计调查的组织方式
▪ 统计报表 ▪ 专门调查
统计学
2-12
抽样调查方案
►确定调查目的(为什么调查) ►确定调查对象和调查单位
▪ 有许多性质相同的调查单位组成的现象总体。 ▪ 调查单位:所要研究的个体。
►确定调查项目:调查中所要调查单位的特征。 ►设计调查表与问卷设计 ►选择调查方法 ►确定调查时间和调查期限 ►制定调查的组织实施计划
统计学
2-13
统计调查方法
► 现场观察法
▪ 带有明确的目的到现场,直接观察获得数据信息。 ▪ 优点:准确;缺点:成本大
► 报告法(通讯法)
统计学第二章 统计数据的收集、整理与显示试题及答案
第二章统计数据的收集、整理与显示二、单项选择题1、人口普查的调查单位是(C )。
A、每一户B、所有的户C、每一个人D、所有的人2、对一批商品进行质量检验,最适宜采用的调查方法是(B )。
A、全面调查B、抽样调查C、典型调查D、重点调查3、下列调查中,调查单位与填报单位一致的是(D )。
A、企业设备调查B、人口普查C、农村耕畜调查D、工业企业生产经营现状调查4、抽样调查与重点调查的主要区别是(D )。
A、作用不同B、组织方式不同C、灵活程度不同D、选取调查单位的方法不同5、先对总体中的个体按主要标志加以分类,再以随机原则从各类中抽取一定的单位进行调查,这种抽样调查形式属于( D )。
A、简单随机抽样B、等距抽样C、整群抽样D、类型抽样6、对某省饮食业从业人员的健康状况进行调查,调查单位是该省饮食业的(D )。
A、全部网点B、每个网点C、所有从业人员D、每个从业人员7、调查时限是指(B )。
A、调查资料所属的时间B、进行调查工作的期限C、调查工作登记的时间D、调查资料的报送时间8、对某市全部商业企业职工的生活状况进行调查,调查对象是(B )。
A、该市全部商业企业B、该市全部商业企业的职工C、该市每一个商业企业D、该市商业企业的每一名职工9、作为一个调查单位(D )。
A、只能调查一个统计标志B、只能调查一个统计指标C、可以调查多个统计指标D、可以调查多个统计标志10、某市规定2018年工业经济活动成果年报呈报时间是2019年1月31日,则调查期限为( B )。
A、一天B、一个月C、一年D、一年零一个月11、统计分组对总体而言是( B )A、将总体区分为性质相同的若干部分B、将总体区分为性质不同的若干部分C、将总体单位区分为性质相同的若干部分D、将总体单位区分为性质不相同的若干部分12、按某一标志分组的结果表现为( B )A、组内差异性,组间同质性B、组内同质性,组间差异性C、组内同质性,组间同质性D、组内差异性,组间差异性13、设对某地区的人口按年龄分组如下:不满周岁,1—3岁,4—6岁,7—12岁,……60—64岁,65—79岁,80—99岁,100岁以上,最后一组的组中值近拟为( C )A、110岁B、104岁C、104.5岁D、105岁14、为充分利用所得到的原始资料以取得大量统计指标,在统计整理时关键是要( C )A、进行各种汇总B、进行各种计算C、充分利用分组法D、对原始资料进行分析15、按变量的性质和数据的多少划分,变量数列可分为( C )。
统计学 第二章 统计数据的搜集、整理和显示
(二)实验方式
所谓实验方式,就是运用自然科学的试验 法,通过观测人为安排条件下试验产生的各种 结果并加以记录的方式来获取数据,或通过人 为安排条件下的试验来探求某个或某些因素对 所研究事物的数量影响程度和作用方式,凭借 实验结果来揭示所考察因素与所研究事物之间 的数量因果关系。
1、实验的原则
运用实验方式需要遵循下列两个原则:均衡分散
1、普查
普查是根据特定的统计研究目的而专门组织的 一次性的全面调查,用以收集所研究现象总体的全 面资料(即总体中的所有个体都是观测单位)。 普查的组织方式一般有两种:一是建立专门的 普查机构,配备一定数量的普查人员,对观测单位 直接进行登记。如我国历次的人口普查等。二是利 用观测单位的原始记录和核算资料,颁发调查表, 由观测单位按要求填报。如物资库存普查等。
重点调查的单位可以是一些企业、行业、 也可以是一些地区、城市。此种调查方式的优点是, 所投入的人力、物力少,而又较快地搜集到统计 信息资料。一般来讲,在调查任务只要求掌握基 本情况,而部分单位又能比较集中反映研究项目 和指标时,就可以采用重点调查。
在下列问题中为了得到数据,采用什么调查? • 为了买校服,了解每个学生衣服的尺寸。 • 商检人员在某超市检查出售的饮料的合格率。 • 对占全市工业总产值五分之一的六个大型企 业进行调查,以了解全市工业总产值的基本 情况。
观测性误差
数 据 收 集 误 差
也叫登记性误差或调查性误差,它 是在调查观测的各个环节因工作粗 心或被观测者不愿很好配合而造成 的所收集数据与实际情况不符的误 差,包括计量错误、记录错误、计 算错误、抄写错误、汇总错误、计 算机输入误差等工作误差,以及被 调查者不愿或难以提供真实情况的 误差,有时还存在调查人员弄虚作 假的误差和各种人为因素干扰的误 差。 这部分误差通常是人为造成的,通 过对统计调查资料的严密审核,是 可以发现并加以更正的。观测性误 差则可能存在于任何统计调查。 因样本不能完全代表总体而产生 的估计结果与总体真实数量特征 不符的误差。根据样本不能完全 代表总体的原因不同,代表性误 差又分为系统性代表性误差和偶 然性代表性误差两种。
西南财经大学向蓉美、王青华《统计学》第三版——第2章:统计数据的收集、整理与显示
– 调查内容详细、提供重要国情国力资料、数 据的规范化程度较高
提供抽样框
总
– 特别注意
体
• 必须规定标准时间 • 在规定时间内统一进行
• 基本内容和指标解释统一并相对稳定
• 需要PPT配套视频,请加VX:1033604968 11
Statistics
2.统计报表 –概念 • 按照国家有关法规的规定、自上而下地统一 布置、自下而上地逐级提供基本统计数据。 –特点 • 全面性、稳定性、连续性、可比性 • 曾经是我国数据收集的主要方式 • 耗费大、数据质量差等等。
3
Statistics
§2.1.2 统计调查方案
调查方案的内容
调
调查
调查
查
对象
项目
其
目
调查
和调
的
单位
查表
他
4
Statistics
1.确定调查目的
调查要达到的具体目标 回答“为什么调查?” 调查之前必须明确
5
Statistics
2.确定调查对象和调查单位
调查对象:调查研究的总体或调查范围 调查单位:需要对之进行调查的单位。可以是调查
12
Statistics
第二次全国经济普查的标准时点是2008年12月31日,时
期资料为2008年度。
第六次quanguo人口普查
主要目的:人口普查是一项重大的国情国力调查。组织开
展第六次全国人口普查,将查清十年来我国人口在数量、结构、
分布和居住环境等方面的变化情况,为科学制定国民经济和社
会发展规划,统筹安排人民的物质和文化生活,实现可持续发
重点单位——标志值在总体标志总量中占有 较大比重的单位
统计学填空题整理
统计学填空题整理 Revised by Hanlin on 10 January 2021第一章思考题及练习题1、统计工作与统计资料的关系是过程和成果的关系。
2、统计工作与统计学的关系是实践和理论的关系。
3、统计活动具有、、、和的职能。
4、统计指标反映的是现象总体的数量特征,数量标志反映的是个体的数量特征。
5、在人口总体中,个体是“个人”,“文化程度”是品质标志。
6、统计研究过程的各个阶段,运用着各种专门的方法,如大量观察法、统计分组法、综合指标法、统计模型法和统计推断法等。
7、统计标志是总体中各个体所共同具有的属性或特征的名称。
它分为指标名称和指标数值两种。
8、要了解一个企业的产品质量情况,总体是企业的所有产品、个体是单个产品。
9、性别是品质标志,标志表现则具体为不变标志或可变标志两种结果。
10、一件商品的价格在标志分类上属于数量标志。
11、一项完整的统计指标应该由指标名称、具体数据、计量单位、计算方法、时间限制和空间限制等构成。
12、统计指标按所反映的数量特点不同,可以分为和。
13、反映社会经济现象相对水平或工作质量的指标称为指标。
14、统计活动过程通常被划分为统计调查、统计整理和统计分析三个阶段。
15、经过 300 余年的发展,形成了今天的统计学。
16、古典统计学时期有两大学派,它们分别是国势学派和政治算术学派。
17、《关于死之表的自然和政治观察》一书的作者是,他第一次编制了“生命表”。
18、提出了着名的误差理论和“平均人”思想。
19、统计研究的数量性是指通过数来反映事物的量的、量的、量的和量的。
20、统计学包括和两部分内容。
21、总体中所包含的个体数量的多少称为总体容量;样本中所包含的个体数量的多少称为样本容量。
22、总体中的一个组或类,可被称为一个研究域或。
23、从总体中随机抽取的一部分个体所组成的集合称为样本。
24、统计理论与方法,事实上就是关于样本的理论和方法。
25、总体的三大特征是大量性、同质性和差异性。
统计学第二章数据搜集整理
普查的规定
• • • • 规定统一的调查项目 规定统一的标准时点 规定统一的普查周期 例如:第六次人口普查,调查表,性别、年龄、 民族、受教育程度、行业、职业、迁移流动、社 会保障、婚姻生育、死亡、住房情况等 • 截止时间,标准时点是2010年11月1日零时 • 人口普查的周期是10年,2000年,2010年
频率
fi
fi
fi :第i组频数
32
(2)频率的性质 (A )
0
fi
1 fi
(B ) (3)频数密度与频率密度(消除异距分组对频数影响) (A) (2.7) 频数密度=频数/组距 (B) (2.8) 频率密度=频率/组距 各组频数密度与各组组距乘积之和等于总体单位数,各 组频率密度与各组组距乘积之和等于1.
29
组数的确定(H.A.Struges经验公 式)
•
n = 1 + 3.3logN
N – 24 – 44 – 89 – 170 – 359 n 5 6 7 8 9
(斯特杰斯)
• • 15 • 25 • 45 • 90 • 180 • 组距=
30
四、频数(次数)分布
1.频数分布的基本理论
(1)频数分布的定义 在统计分组的基础上,将总体所有单位按某一标志 归类排列,并计算其相应出现的次数。 频数分布是统计整理的重要形式,通过对零乱的、 分散的原始资料进行有次序的整理,形成一系列反映 总体各组之间单位分布状况的数列,即分布数列。
10
• 概率抽样的特点: 1、样本单位按随机原则抽取,排除了主观因素对 选样的影响。 2、根据部分调查的实际资料对调查对象总体的数 量特征作出估计。 3、抽样误差可以事先计算并加以控制。 • 抽样调查的适用场合
统计学PPT课件
二、统计学的产生和发 展
3 古典概率论
古典概率论对统计学的贡献可归纳为以下几点:
(1) 总结了古典概率论的研究成果,初步奠定了数理统计学的 理论基础。 (2) 把大数定律作为概率论与政治算术的桥梁。 (3) 提出应以自然科学的方法研究社会现象,为数理统计的产 生提供了必要的理论依据。
统计活动、统计资料和统计学相互依存、相互联系,共同构成一个完 整的整体,这就是人们所说的统计。
二、统计学的产生和发 展
进入资本主义社会以后,随着社会生产力的发展,人们对 统计数据资料的需求增多,专业的统计机构和研究组织逐渐出 现,统计初步发展为社会分工中的一个独立部门。
到了 17世纪中叶,统计学应运而生。
三、统计学的应用
(二) 统计学在经济领域的应用
统计学最初产生于对经济现象的研究。至今,经济领域仍然是统计 学最重要的研究领域。统计学在经济领域的应用形成了经济统计学。经 济学在研究经济现象及其发展变化的规律性时,除要进行规范性的理论 分析外,还离不开对现实经济活动的实证研究。经济学家只有通过对现 实经济活动的运行条件、运行过程和运行结果的数量分析,才能得出真 正符合客观实际的规律性结论。经济现象是人类参与的活动,其影响因 素异常复杂。对社会经济现象规律性的认识,只能被动地对实际的经济 关系和经济活动的运行情况进行观测。因此,无论是宏观经济学研究还 是微观经济学分析,都需要大量地运用统计方法,通过各种调查方法来 收集实际的经济统计数据,并分析其数量规律性。
《不列颠百科全书》将统计学定义为收集、分析、表 述和解释数据的科学。
一、统计的含义
统计学(4)
.
第一节 数据的收集
统计报表
按实施 范围分
按调查 范围分
按主管 系统分
按填报 单位分
按报送 方式分
国部地 全 非 基 专 基 综 电 书 家门方 面 全本 业 层 合 讯 面 统统统 统 面统 统 报 报 报 报 计计计 计 统计 计 表 表 表 表 报报报 报 计 报 表 表表表 表 报表 报
明确规定调查资料的起止时间; 调查资料登记时间:是指对调查单位进行调查并取得调
查资料的时间; 调查工作期限:是指从调查工作开始到调查工作结束所
经历的全部时间。 2.调查空间: 调查单位应在什么地点接受调查。
.
第一节 数据的收集
(五)制定调查的组织实施计划 调查的组织计划,是指为确保实施调查的具体工作计划。 调查的组织实施计划应包括以下内容: ➢ 建立调查工作的组织领导机构,做好人员的配备与分工; ➢ 做好调查前的准备工作。如宣传教育、人员培训、文件
重点单位:是指这些单位的标志总量在总体标志总量中占 有绝大比重的单位。
选取重点单位的原则:根据调查任务和调查对象的基本情 况确定选取的重点单位及数量;也要注意选取管理比较健全、 业务能力强、统计工作基础好的单位为重点单位。
特点:调查单位少;调查对象的标志值比较集中于某些单 位的场合。
注意:重点单位的选择是客观的。只适用于客观存在着重 点单位的情况。
注:1.资料来源于《世界概况》,由美国中央情报局(CIA出版)最权威报道; 2.中国2010年人均GDP为4283美元,居世界182个国家的95位。
.
第一节 数据的收集
1.定类尺度(类别尺度、列名尺度) 是对统计客体类别差异所作的反映,是最粗略、计量层次 最低的测量尺度。
《统计学》教学课件 第二章 统计数据收集、整理与呈现
全面调查 非全面调查
普查、统计报表制度、抽 样调查、重点调查和典型 调查等是常见的统计调查 方式,其中普查即全面调 查,其余的为非全面调查。
1.普查 普查是根据特定研究目的而专门组织的一次性的全 面调查,以收集研究对象的全面资料。
目前,我国组织实施的普查主要包括人口普查、经济普查和 农业普查三种。
缺然点后:通过典细型致单分析位典的型选单位取以受认人识总为成功经验、找出失败 现(一3)定突的出倾选典向式性。,突出且选典典型式是调指查选结择总体教中训的或先观进察单新位生、事后物进的单情位况或。新生事 果物不作宜为典用型以单推位,算进全行面深入数细据致。的调查。
2.报告法
3.采访法
又称凭证法,指要求调查 由调查人员对被调查者进
对象以原始记录、台帐和 行采访,根据被调查者的
核算资料为依据,向有关 答复来收集数据的方法,
单位提供统计资料的方法。 包括面谈访问、电话访问、
邮寄访问 和网络访问等。
4.登记法 指当事人根据有关法制法规规定,在开展某些活动或 发生某事时,主动到有关机构进行登记,填写有关表 格,提供有关统计信息。
④滚雪球抽样。是一种针对稀疏总体进行的抽样调查,抽选样本时 先找到几个符合条件的调查单位,然后通过这些调查单位找到更多 符合条件的调查单位,以此类推,样本如同滚雪球般由小变大,直 至达到要求的样本数为止。
⑤流动总体抽样。流动总体抽样是采用“捕获—放回—再捕获”的方式 来估计总体。
4.重点调查
重点调查也是一种非全面调查,是对数据收集对象总体 中的部分重点单位进行观测的统计调查方式。
频数(人) 频数(%)
30岁以下
39.3
30-40岁
37.9
40-50岁
统计学课后答案
第一章绪论1.社会经济统计学的研究对象是:(A)A社会经济现象的数量方面B.统计工作C.社会经济内在规律D.统计方法2.考察全国的工业企业的情况时,以下标志中属于不变标志的有(A)A.产业的分类B.职工人数C.劳动生产效率D.所有制3.要考察全国居民的人均住房面积,其统计总体是(A)A.全国所有居民户B.全国的住宅C.各省市自治区D.某一居民户4.最早使用"统计学"这一术语的是(B)A.政治算术学派B.国势学派C.社会统计学D.数理统计学派第二章统计数据的收集,整理和显示1.统计的调查对象是(C)A.总体各单位标志值B.总体单位C.现象总体D.统计指标2.我国统计调查体系中,作为主体的是(A)A.经常性抽查调查B.必要的统计报表C.重点调查及估计推算等D.周期性普查3.要对某企业生产设备的实际生产能力进行调查,则企业的“生产设备”是(A)A.调查对象B.调查单位C.调查项目D.报告单位4.下面那些现象事宜采用非全面调查?(ABCD)A.企业经营管理中出现的新情况B.某型号日光灯耐用时数检查C.某地区居民储蓄存款D.某地区森林的木材积蓄量5.抽查调查(abd)A.是一种非全面调查B.是一种非连续性的调查C.可以消除抽样误差D.应遵循随机原则6.洛伦茨曲线(BC)A.是一种向下累计曲线B.可用于反映财富的分布曲线C.用以衡量收入分配公平与否D.越接近对角线基尼系数越大第三章数据分布特征的描述1.由变量数列计算加权算术平均数时,直接体现权数的实质的是(D)A.总体单位数的多少B.各组单位数的多少C.各组变量值的大小D.各组频率的大小2.若你正在筹划一次聚会,想知道该准备多少瓶饮料,你最希望得到所以客人需要饮料数量(a)A.均值B.中位数C.众数D.四分位数3.2004年某地区甲、乙两类职工的月平均收入分别为1060和3350 元,标准差分别为230元和680元,则职工平均收入的代表性(B)A.甲类较大B.乙类较大C.两类相同D.在两类之间缺乏可比性4.假如学生测验成绩记录为优。
【统计学 精】第二章 统计数据的搜集和整理
(2)对普查资料进行必要的修正。
4、典型调查
• 这是一种专门组织的非全面调查。它根据调查的目的,在对所研 究的对象进行初步分析的基础上,有意识地选取若干(一个或少 数几个)具有代表性的单位进行调查和研究,借以认识事物发展 变化的规律。
• 重点调查适用的条件:
•
当统计调查的任务只要求了解调查对象的基本情况,而
调查对象中确实存在重点单位时,比较适宜进行重点调查。
• 例如,为了掌握全国钢铁生产的基本情况,可以选出鞍钢、宝钢、首钢、 马钢、武钢等几个大型钢铁企业调查,以便对钢铁产量有个大致的了解。
3、抽样调查
•抽样调查是一种非全面调查,是实际中应用最广 。 泛的一种调查方式
(3) 是运用概率的估计方法 。
• 例如:通过抽样推断得出,厦大学生的平均 月支出在(420,470)元上的可靠性为90%。
(4)抽样推断的误差可以事先计算,并加以控制。
• 抽样调查的优越性: 第一,经济性强。 第二,时效性高。 第三,适应面广。 第四,准确性大。
抽样调查的适用范围 (1)一些不可能或不必要进行全面检查的社会 现象。
性和时效性。
三、统计分组
(一)统计分组的概念和种类
• 1、定义:统计分组根据统计研究的目的和客 观现象的内在特点,按照某个标志或几个标 志把研究的总体划分为若干性质不同的部分 (或组)的一种统计方法。
统计分组
• 2.兼有“分”和“合”的双重含义: •对于现象总体,是 “分”;对于单位, 是“合”。 • 对于分组标志,是“分”,对于其他标 志,是“合”。
第二章统计数据的搜集与整理
第⼆章统计数据的搜集与整理第⼆章统计数据的搜集与整理(⼀)教学⽬的通过本章的学习,了解统计数据搜集与整理的基本理论与⽅法,掌握各种⽅法的特性。
(⼆)基本要求要求灵活运⽤各种数据搜集的⽅式⽅法,并对所得数据进⾏加⼯整理,为以后各章学习打下基础。
(三)教学要点1、数据搜集的⽅式⽅法;2、统计调查⽅案的设计;3、统计分组;4、变量数列的编制;5、统计数据的显⽰。
(四)教学时数9课时(五)教学内容本章共分四节:第⼀节数据的计量与类型⼀、数据的计量尺度在计量学的⼀般分类⽅法中,依据对事物计量的精确程度,可将所采⽤的计量尺度由低级到⾼级、由粗略到精确分为四个层次,即名类尺度、顺序尺度、区间尺度和⽐尺度。
1.定类尺度定类尺度(Nominal scale,亦称分类尺度、列名尺度等)是这样⼀种品质标志,按照它可对研究客体进⾏平⾏的分类或分组,使同类同质,异类异质。
例如,按照性别将⼈⼝分为男、⼥两类;按照经济性质将企业分为国有、集体、私营、混合制企业等。
这⾥的“性别”和“经济性质”就是两种名类尺度。
名类尺度是最粗略、计量层次最低的计量尺度,利⽤它只可测度事物之间的类别差,⽽不能了解各类之间的其他差别。
名类尺度计量的结果表现为某种类别,但为了便于统计处理,例如为了计算和识别,也可⽤不同数字或编码表⽰不同类别。
⽐如⽤1表⽰男,0表⽰⼥;⽤1表⽰国有企业,2表⽰集体企业,3表⽰私营企业,等等。
这些数字只是不同类别的代码,决不意味着它区分了⼤⼩,更不能进⾏任何数学运算。
名类尺度能对事物做最基本的测度,是其他计量尺度的基础。
2.定序尺度定序尺度(Ordinal scale,亦称序数尺度、顺位尺度等)是这样⼀种品质标志,利⽤它不仅能将事物分成不同的类别,还可确定这些类别的等级差别或序列差别。
例如“产品等级”就是⼀种测度产品质量好坏的顺序尺度,它可将产品分为⼀等品、⼆等品、三等品、次品等;“考试成绩”也是⼀种顺序尺度,它可将成绩分为优、良、中、及格、不及格等;“对某⼀事物的态度”作为⼀种顺序尺度,可将⼈们的态度分为⾮常同意、同意、保持中⽴、不同意、⾮常不同意,等等。
贾俊平统计学第二章 数据的搜集
2 - 21
方便抽样
1. 调查过程中由调查员依据方便的原则,自行 调查过程中由调查员依据方便的原则, 确定入抽样本的单位
调查员在街头、 公园 、 调查员在街头 、 公园、 商店等公共场所进行拦 截调查 厂家在出售产品柜台前对路过顾客进行的调查
2. 优点:容易实施,调查的成本低 优点:容易实施, 3. 缺点:样本单位的确定带有随意性 ,样本无 缺点:样本单位的确定带有随意性, 法代表有明确定义的总体, 法代表有明确定义的总体, 调查结果不宜推 断总体
速度快, 速度快,能在短时间内完成调 适合于样本单位十分分散的情况
3. 局限
如果被调查者没有电话, 如果被调查者没有电话,调查将无法实施 访问的时间不能太长 使用的问卷需要简单 被访者不愿意接受调查时, 被访者不愿意接受调查时,难以说服
2 - 32
观察式调查
1. 就调查对象的行动和意识 , 调查人员边 就调查对象的行动和意识, 观察边记录以收集所需信息 2. 调查人员不是强行介入 3. 能够在被调查者不察觉的情况下获得资 料
2 - 17
整群抽样
(cluster sampling) sampling)
1. 将总体中若干个单位合并为组 ( 群 ), 抽样时直接 将总体中若干个单位合并为组( ),抽样时直接 抽取群, 抽取群 , 然后对中选群中的所有单位全部实施 调查 2. 特点
抽样时只需群的抽样框, 抽样时只需群的抽样框,可简化工作量 调查的地点相对集中,节省调查费用, 调查的地点相对集中,节省调查费用,方便调查的 实施 缺点是估计的精度较差
2 - 30
面访式问卷调查
1. 调查员与 被调查者面对面提问、 被调查 调查员与被调查者面对面提问 、 者回答的一种调查方式 2. 优点
统计学-数据的收集与整理
以搜集某些不能或不宜用报表搜集的统计 资料。对国情国力的调查一般用普查,如人口、工业和
农业普查。
❖ 普查的特点:全面调查;非经常性调查。
❖ 我国的普查制度:
每逢末尾数字为“0”的年份进行人口普查; “1”或“6”的年份基本统计单位普查;“逢3、逢8的年份经济普查; “5”的年份工业普查;“7”的年份进行农业普查。
❖ 本报告研究的内容较敏感,在调查过程中,由于涉及标会 运作中的核心内容,实践小组受到当地标会保护势力的威 胁,几度要求收缴所有调研资料,但我们依靠勇敢和智慧 将大量的调查结果保留了下来,即本文所用到的珍贵数据 及图片材料。
❖ 数据整理分析……(统计分组、统计表、统计图)
统计研究的过程
统计设计
实际问题
3. 调查项目一经确定,不能随意改变或增减,以免影响 汇总总和,降低资料质量。
❖ 普查的组织形式:
▪ 专门组织普查机构并配普查人员直接登记(人口普查); ▪ 利用原始资料由调查单位自填表格(物资库存普查)
第一节 统计数据的搜集
三、统计调查的各种形式:2、统计报表制度:
❖ 统计报表是依照国家有关法规(《中华人民共和 国统计法》),自上而下的统一布置,以一定的 原始记录为依据,按照统一的表式,统一的指标 项目,统一的报送时间和报送程序,自下而上地 逐级地定期提供统计数据的一种调查方式。是搜集
国民经济和社会发展状况统计数据的主要方式。
❖主要特点:
① 资料来源建立在基层单位的各种原始记录的基础 上,基层单位可利用其资料;
② 逐级上报和汇总,各级领导能了解其辖区的情况 ③ 属于经常性调查,项目相对稳定,利于积累资料,
管理统计学 第2版 第二章 统计数据的收集整理与显示
(4)系统抽样
首先将总体中各 单位按一定顺序 排列,根据样本 容量要求确定抽 选间隔,然后随 机确定起点,每 隔一定的间隔抽 取一个单位的一 种抽样方式。是 纯随机抽样的变
种
最主要的优势就 是经济性。最大 的缺陷在于总体 单位的排列上。 一些总体单位数 可能包含隐蔽的 形态或者是“不 合格样本”,调 查者可能疏忽, 把它们抽选为样
• 普查需要规定标准的时点:如第五次人口普查规定的标准时间 为2010年11月1日零时为标准时间。
统计报表
• 统计报表是按照国家有关的规定,自上而下同一布置,自下而上逐级 提供统计资料的调查组织方式。
• 统计报表是我国特有的一种统计调查方式,是建立在各基层单位原始 记录的基础上的一种统计调查方式,由于统计报表是逐级上报和汇总 的,有利于各级部门了解本地区、本部门或本行的的社会和经济发展 现状。
2.1 统计数据的收集
数据的来源
• 间接来源 研究者直接从公开出版物或通过网络渠道获取
所需数据,如《中国统计年鉴》、《中国统计摘 要》、《中国社会统计年鉴》 • 直接来源
研究者直接通过调查取得研究所需数据资料
2.1 统计数据的收集
普查
常用的统计 调查方式
抽样调查
重点调查
典型调查
简单随 机抽样
分层抽样
抽样调查
• 抽样调查是取得数据资料的最主要的一种方式,它是按照 随机原则从总体中抽取部分单位组成样本,对样本指标进 行测定,根据样本指标推断总体指标的一种非全面调查。
抽样调查的具体组织形式 抽样调查
简单随 机抽样
分层抽样
等距抽 样
整群抽样
(1)简单随机抽样
从总体N个单位中任意抽取n个单位作为样本, 使每个可能的样本被抽中的概率相等的一种 抽样方式
统计学第二章
第二章统计数据的收集、整理与显示2.1统计数据的收集一、统计数据的来源1、直接来源(原始来源):分为实验和统计调查(直接观察、报告、采访、登记)2、间接来源(二手资料):出版物、网络二、统计调查组织方式1、分类①按调查单位的范围大小分:全面调查和非全面调查②按调查时间是否连续分:经常性调查和一次性调查③按调查组织方式分:统计报表和专门调查。
其中专门调查又分为普查、重点调查、典型调查、抽样调查2、统计报表制度:按照国家统一规定的各项要求,自下而上地定期向国家和主管部门报送基本统计资料的一种报告制度①优点:能保证统计资料的全面性和连续性;能保证统计资料的统一性和及时性;能满足各级部门对统计资料的需要②缺点:统计报表过多会增加基层负担;有可能由于虚假瞒报而影响统计资料质量3、普查:是指国家为详尽了解某项重要的国情国力而专门组织的一次性全面调查(主要用于搜集时点资料)①作用:可以为抽样调查提供抽样框;可以收集统计报表所不能提供的反映重大国情国力的基本统计信息②局限:由于需要大量的人力、物力、财力,不宜经常进行4、重点调查:是指为了解总体基本情况,在调查对象中只选择一部分重点单位进行调查的一种非全面调查组织方式。
(这些单位数目不多,但其标志值在总体标志总量中占有较大比重,能反映总体的基本情况)①作用:能以较少的投入和较快的速度取得总体基本情况及变动趋势的资料②局限:只适用于客观存在重点单位的情况5、典型调查:是指在对调查对象有一定了解的基础上,有意识的选择少数典型单位进行调查的一种非全面调查方式。
(指在数量表现上具有普遍意义呵呵代表性的总体单位,可以用来推断总体的数量)①作用:一定条件下能估计总体指标数值;可以用来研究新生事物②缺陷:不能确定推断的把握程度,无法计算和控制推断误差6、抽样调查:是指按照随机原则从调查对象中抽取一部分样本单位进行调查,再用样本资料推断把握总体的数量特征的一种非全面调查组织方式。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.曲线图
当变量数列的组数无限增多时,折线便近似地表现为一条平
滑曲线。
乡 镇 数
12 10 8 15 6 10 4 2 0 700 800 900 5 25
20
频 率 (%)
0 1000 1100 1200 1300 1400 1500 1600 1700
财政收入
11
累计分布(曲线)图
向上累计频数(频率)分布图
直角坐标系下,将各组组距的上限与相应的累 计频数(频率)构成坐标点,依次用折线(光滑曲线) 相连 向下累计频数(频率)分布图 直角坐标系下,将各组组距的下限与相应的累 计频数(频率)构成坐标点,依次用折线(光滑曲线) 相连 以分组变量为横轴,累计频数(频率)为纵轴。 组的次数(频率)越少,曲线越平缓,相反,越陡 峭。
税收按税种分组 工 商 税 税 1999 年总额 8 885.44 562.23 423.50 639.00 172.41 10 682.58 速度(%) 2000 年总额 ( 以 上 年 为 100) 10 366.09 750.48 465.31 827.41 172.22 12 581.51 116.7 纵栏 标题
27
遵循的固定法则。一般而言,数据量大时,分组数 可多些(组距可以小些),数据较少时,分组数应 少些(组距大些)。 经验公式:组数=1+3.3logN 组距=全距/组数
21
注意:所算得的组距可能是一个分数,不方便应用,
此时,须采用它最接近的那个整数。 通常,为了分布列一目了然,人们还要人为的把这 些数字改得更为“整齐”一些。 常见用作组距的形如1,5,10,15,20,25,30等一些“整 5”“整10”的数字。
4
从内容看,包括: 主词栏:要说明的总体及其组成部分。主词位于表 的左方。 宾词栏:说明总体数量特征的各个统计指标。宾词 位于表的右方。 实际使用中,若必要,主宾词可变化位臵或者合并排列。 此外,统计表还有:
补充资料、注解、资料来源、填表单位、填表 人等。
5
我国各项税收收入情况表 单位:亿元
10
20
30
40
50
60
70 80
19
3.J型分布
J型分布有两种类型: 一种呈正J型分布,次数随变量增大而增多; 另一种呈反J型分布,次数随变量增大而减少。
正J型图
反J型图
20
注意:
对数据做组距式整理的步骤: (1)将数据按大小做排序整理; (2)指定初始分组数和组距。 初始分组数的选多少(组距选多大)没有一个可供
7
3.统计表设计(要求简练、明确、实用、美观,利于比较)
(1)横线外粗内细,左右两侧开口 (2)标题(简要准确) (3)合计栏 (4)数值格式(小数位、缺失值) (5)计量单位 (6)注释或资料来源。
8
二、统计图
常用:直方图、折线图、曲线图、饼图、散点图、雷达图等。
1.直方图
直方图是用直方形宽度和高度表示次数分布的图形。 绘制直方图时,横轴表示各组组限,纵轴表示次数或频率。
横 行 标 题
关
133.5
109.9 129.5 99.9 117.8
农 业 各 税 国有企业所得税 集体企业所得税 合 计
指 标 数 值
资料来源: 《中国统计年鉴 2001 年》 。
主词栏
宾词栏
6
2.统计表分类(例子见教材表2-4至表2-8)
(1)按主词结构分类,根据是否分组和分组程度,分为: 简单表(主词未分组) (一览表) 简单分组表(主词仅按一个标志分组) 复合分组表(单向、交叉) (2)按宾词设计分类,可分为: 宾词简单排列(宾词不做分组,按一定顺序排列) 分组平行排列(宾词栏中各组彼此分开,平行排列) 分组层叠排列(指标同时有层次地按两个或两个以上 标志分组,各分组层叠在一起) (3)主词分组与宾词分组的区别: 主词分组划分总体,具有独立意义; 宾词分组不划分总体,从属于主词要求,详细描述主词 数量特征。
钟型分布特征:“两头小,中间大”。即靠近中间 变量值分布次数多,靠近两边的变量值分布的次数 少,其曲线图宛如一口钟 。很多现象服从或近似服 从该分布。
(Ⅰ)对称
(Ⅱ)正偏 (右偏)
(Ⅲ)负偏 (左偏)
18
2.U型分布
50 死 亡 30 率 (‰) 20 10 0 年龄 40
U 型分布的形状与钟型分布相反: 靠近中间的变量值分布次数少, 靠近两端的变量值分布次数多, 形成“两头大,中间小”的 特征。 如人口死亡率与年龄关系。
15
据此可以计算基尼系数
100
80
基尼系数=A/(A+B)
绝对平等线
60
A
40
B
绝对不平等线
实际分配曲线 (洛伦茨曲线)
20
0 0 20 40 60 80 100
16
六、频(次)数分布图类型
各种不同性质的社会经济现象,其次数分布类型大
致有三种:钟型分布、U 型分布和 J 型分布。
17
1.钟型分布
乡 镇 数
12
10
频 率 2 (%) 0
25 15
8
6 10 4 5
2
0
800-900 900-1000 1000-1100 1100-1200 1200-1300 1300-1400 1400-1500 1500以上
0
根据表2-3绘制
财政收入
9
2.折线图
在直方图基础上,用折线将各组次数高度坐标连接而成;也
3
一、统计表
1.定义和结构
定义: 整理统计数据,并按一定方式排列得到的表格。 结构: 从表式看,包括: 总标题:统计表名,扼要说明表的内容,指出时间 和范围。臵于表格正上方。 横行标题:横行名,位于表格左方。 纵栏标题:纵栏名,臵于表格上方。 横行标题和纵栏标题共同说明表格中统计数据内容 指标数值:位于横行和纵栏交叉处,说明总体及其 组成部分的数量特征,为统计表格核心内容。
12
累计分布(曲线)图
向上累计分布曲线呈上升状,向下累计分布曲线呈下降状。
% 100
80
向上累计图: 70分以下有 22.5%
60 40 20 0 50 60 70 80 90
向下累计图: 90分以上有 20%
成绩 100
13
累计分布曲线应用
累计频数(或频率)分布曲线,可用于研究社
会财富、土地和工资收入的分配是否均等 (平等、公平?)。
这种累计分布曲线图最早由美国的洛伦茨
(M.O.lorenz)提出,故称洛伦茨曲线图。
14
其绘制方法为:
1.将分配对象和接受分配者的数量均变为结构相对数,并 进行向上累计。 2.纵轴和横轴均为百分比尺度。 纵轴自下而上,用以测定分配对象(如财富、土地或 收入等); 横轴由左向右,用以测定接受分配者(如人口)。 3.根据计算得出的分配对象和接受对象的累计百分数,标 出相应的绘示点,连接各点并使之平滑化,所得曲线即洛 伦茨曲线(向上累计图)。
24
第一次统计学作业
1、某地区人口数据如下表,请在空白处填写组距、 组中值、频率、上限以下累计频数。
25
2、现有某地区50户居民的月人均可支配收入数据资料 如下(单位:元):
26
要求: (1)试根据上述资料作等距式分组,编制次(频)
数分布和频率分布数列; (2)编制向上和向下累计频数、频率数列; (3)用频率分布列绘制直方图、折线图和向上、向 下累计图; (4)根据图形说明居民月人均可支配收入分布的特 征。
五、累计频数与累计频率◇
累计频数(或频率):可以采用向上累计频数
(或频率),也采用向下累计频数(或频率)。 向上累计频数(或频率)分布。 方法是:先列出各组上限,然后由标 志值低的组向标志值高的组依次累计。 向上累计频数表明某组上限以下的各 组单位数之和; 向上累计频率表明某组上限以下的各 组单位数之和占总体单位数比重。
22
课堂习题
某地区20个企业,某年产品销售利率指标按大小顺
序排列如下(%):
6.5 16.2 19.5 22.5
9.6 18.2 19.7 24.3
11.3 18.6 20.6 24.9
13.8 15.4 18.6 19.2 20.9 21.9 28.6 29.5
23
如果拟定组距为10,组数为3。 现在对组限做不同的设计。
1000-1100
1100-1200 1200-1300 1300-1400 1400-1500 1500-1600 1600-1700
8
11 11 7 4 2 1
14
25 36 43 47 49 50
16
22 22 14 8 4 2
28
50 72 86 94 98 100
1000-1100
1100-1200 1200-1300 1300-1400 1400-1500 1500-1600 1600-1700
8
11 11 7 4 2 1
44
36 25 14 7 3 1
16
22 22 14 8 4 2
88
72 50 28 14 6 2
合计
50
—
100
—
合计
50
—
100
—
2
第三节 统计数据显示
一 统计表
二 统计图
统计表和统计图是显示统计数据的两种方式。 利用统计表和统计图显示数据,比单纯的枯燥 数据更直观、生动。 正确使用统计表和统计图,是做好统计分析的 基本技能。
可用组中值与次数交点连接而成。两个终点要与横轴相交。 折线图下围成的面积与直方图相等,表示的频数分布一致。