《统计学》第二章 统计数据的搜集、整理(1)
第2章统计数据的搜集与整理精品PPT课件
▪ 优点:应用范围广、结果正确、直接
▪ 缺点:成本高、研究时间长。
统计学
2-15
统计调查的组织方式
►统计报表
▪ 依据国家统计局或国家各行政管理的规定,自上而下 地统一布置,以一定的原始记录为依据,按照统一的 表式、指标、时间和程序自下而上地逐级提供基本统 计资料的调查方式。
►专门调查
▪ 普查
▪ 抽样调查
▪ 重点调查
►重点单位是指在全体中虽然数目不多,所占比不 大,但调查标志值却占较大比重。
▪ 典型调查
►有意识地选择有典型意义或具有代表性的单位。
统计学
2-16
统计报表
►是我国定期搜集基本统计资料的一种重要形式。 ►特点
▪ 来源于基层单位的原始记录 ▪ 项目稳定,有利于资料积累和动态比较
►种类
▪ 国家、部门和地方统计报表 ▪ 全面统计报表和非全面统计报表 ▪ 定期报表和年报 ▪ 基层表表和综合报表 ▪ 电讯报表和书面报表
►统计调查方法
▪ 现场观察法、报告法、问卷法、访谈法、实验 采集法等。
►统计调查的组织方式
▪ 统计报表 ▪ 专门调查
统计学
2-12
抽样调查方案
►确定调查目的(为什么调查) ►确定调查对象和调查单位
▪ 有许多性质相同的调查单位组成的现象总体。 ▪ 调查单位:所要研究的个体。
►确定调查项目:调查中所要调查单位的特征。 ►设计调查表与问卷设计 ►选择调查方法 ►确定调查时间和调查期限 ►制定调查的组织实施计划
统计学
2-13
统计调查方法
► 现场观察法
▪ 带有明确的目的到现场,直接观察获得数据信息。 ▪ 优点:准确;缺点:成本大
► 报告法(通讯法)
统计学 第二章 数据搜集整理显示
统计学
5
第一节 统计数据的搜集
(三)统计数据的搜集方法 采访法
根据被调查者的答复来搜集统计资料,分为口头询问法 和被调查者自填法。采访方式多样,可以直接面对面的调 查,也可以通过电话、网络进行调查。
登记法
由有关的组织机构发出通告,规定当事人在某事发生后 到该机构进行登记,填写材料。
统计学
25
第二节 数据整理
复合分组:
第一产业(大农业) 第二产业 工业 国有工业 非国有工业 建筑业 国有建筑业 非国有建筑业 第三产业 流通部门 服务部门
统计学
26
第二节 数据整理
类型分组:
把复杂的现象总体划分为若干个不同性质的部分。例如, 我国全社会消费品零售额分为国有及国有控股商业零售额 、集体商业零售额、私营及个体商业零售额和其他类型商 业零售额。
统计学
10
第一节 统计数据的搜集
二、统计调查的组织形式
统计报表的特点:
报表资料的来源是基于各个基层单位的原始记录基础上
的,基层单位可以利用资料。
便于领导部门了解本地区、部门的经济和社会发展状况。 属于经常性调查,调查项目相对稳定,有利于资料积累,
并进行动态对比分析。
统计学
11
第一节 统计数据的搜集
第二章>>第一节
统计学
13
第一节 统计数据的搜集 最大抽样效果原则:
1、在既定调查费用的约束下,使抽样误差最小
2、在给定调查精确度要求的条件下,使调查费
用最少。
一般来说,调查费用与精确程度是相矛盾的。通常要求 的是在给定的误差条件下,选择费用最省的抽样设计方 案。
第二章>>第一节
统计学第2章 统计数据的搜集、整理和显示
第二节 数据整理
三、统计指标
(二)统计指标的分类
1. 数量(总量)指标
作用:反映现象的总规模、总水平或工作总量 以绝对数表示(国内生产总值、人口总数、工资总额等) 分类 总体单位数、总体标志总量 时期指标、时点指标 实物指标、价值指标和劳动量指标
第二节 数据整理
三、统计指标
搜集数据的两条途径:统计调查 + 实验 统计调查 —— 调查数据;实验 —— 实验数据 1. 确定调查目的 2. 确定调查对象和调查单位 3. 确定调查项目 4. 调查表格和问卷设计(一览表、单一表,要求简明扼要) 5. 确定调查时间(调查时间、调查期限) 6. 确定调查的组织实施计划
(三)统计调查的方案设计
上限不在内
等距分组与异距分组
等距分组
各组的标志值变动都限于相同的范围 优点:便于计算、绘制统计图 适用场合
异距分组
第一,标志值分布很不均匀的场合 第二,标志值相等的量具有不同意义的场合 第三,标志值按一定比例发展变化的场合
品质分组 单项式分组 间断组距式分组 数量分组 组限 连续组距式分组 组距式分组 等距式分组
6组:530 530 530 540 620 620 620 620 720 720 7组:720 720 630 630 630 630 620 620 620 620
8组:650 650 650 650 650 650 650 650 650 650
提问:从上述资料中,同学们能否直接看出该车间总的生产完成
类型分组
“日产量”分组
500以下 500 500以上 合计
统计学 第二章 统计数据的搜集、整理和显示
(二)实验方式
所谓实验方式,就是运用自然科学的试验 法,通过观测人为安排条件下试验产生的各种 结果并加以记录的方式来获取数据,或通过人 为安排条件下的试验来探求某个或某些因素对 所研究事物的数量影响程度和作用方式,凭借 实验结果来揭示所考察因素与所研究事物之间 的数量因果关系。
1、实验的原则
运用实验方式需要遵循下列两个原则:均衡分散
1、普查
普查是根据特定的统计研究目的而专门组织的 一次性的全面调查,用以收集所研究现象总体的全 面资料(即总体中的所有个体都是观测单位)。 普查的组织方式一般有两种:一是建立专门的 普查机构,配备一定数量的普查人员,对观测单位 直接进行登记。如我国历次的人口普查等。二是利 用观测单位的原始记录和核算资料,颁发调查表, 由观测单位按要求填报。如物资库存普查等。
重点调查的单位可以是一些企业、行业、 也可以是一些地区、城市。此种调查方式的优点是, 所投入的人力、物力少,而又较快地搜集到统计 信息资料。一般来讲,在调查任务只要求掌握基 本情况,而部分单位又能比较集中反映研究项目 和指标时,就可以采用重点调查。
在下列问题中为了得到数据,采用什么调查? • 为了买校服,了解每个学生衣服的尺寸。 • 商检人员在某超市检查出售的饮料的合格率。 • 对占全市工业总产值五分之一的六个大型企 业进行调查,以了解全市工业总产值的基本 情况。
观测性误差
数 据 收 集 误 差
也叫登记性误差或调查性误差,它 是在调查观测的各个环节因工作粗 心或被观测者不愿很好配合而造成 的所收集数据与实际情况不符的误 差,包括计量错误、记录错误、计 算错误、抄写错误、汇总错误、计 算机输入误差等工作误差,以及被 调查者不愿或难以提供真实情况的 误差,有时还存在调查人员弄虚作 假的误差和各种人为因素干扰的误 差。 这部分误差通常是人为造成的,通 过对统计调查资料的严密审核,是 可以发现并加以更正的。观测性误 差则可能存在于任何统计调查。 因样本不能完全代表总体而产生 的估计结果与总体真实数量特征 不符的误差。根据样本不能完全 代表总体的原因不同,代表性误 差又分为系统性代表性误差和偶 然性代表性误差两种。
统计学第二章数据的收集与整理
如果调查城镇居民家庭中工人收入状况 此时,调查单位是城镇居民家庭中的工人,而报告单位则是城
镇居民家庭
• 三、确定调查项目
• 调查内容:
• 校风,考风,教风.每个方 面又选择了若干代表性的 问题来呼应等25个选择题
次级资料也称为第二手资料,是已经存在的经他人整理 分析过的资料。如期刊、报纸、广播、电视以及因特网上的资料, 各级政府机构公布的资料,企业内部记录和报告等。
举例:数据集01、数据集02
间接来源
• 1. 公开出版物:《 中国统计年鉴》、《中国 统计摘要》、《中国金融统计年鉴》、《中国工 业经济统计年鉴》、《中国农村统计年鉴》、 《中国人口统计年鉴》、《中国市场统计年鉴》、 《世界经济年鉴》、《国外经济统计资料》、 《世界发展报告》……
分组
统计分组是根据统计研究的目的,选择某一标志作为分组的依据, 将总体分成若干个不同的组。经统计分组后,各组组内的个体的性质是相 同的,不同组的个体的性质是不同的。统计分组是数据资料整理的核心 对总体而言是“分”,即将总体分为性质相异的若干组成部分;对个体而 言是“合”,即将性质相同的个体组合起来。
如学生按成绩 进行分组 60以下 60—70 70—80 80—90 90以上
组距分组
1. 以变量值变化的一个区间为一组(主要考虑 连续变量分组,此时相邻组的组限必须是重 叠的)
2. 适合于变量值较多的情况 3. 必须遵循“不重不漏”的原则 4. 可采用等距分组,也可采用不等距分组 5 单变量值分组是组距分组的特例
如发生甲流,要研究其病毒机理,只需找一组甲流患者进行临床研究
资料审定
统计学第二章数据搜集整理
普查的规定
• • • • 规定统一的调查项目 规定统一的标准时点 规定统一的普查周期 例如:第六次人口普查,调查表,性别、年龄、 民族、受教育程度、行业、职业、迁移流动、社 会保障、婚姻生育、死亡、住房情况等 • 截止时间,标准时点是2010年11月1日零时 • 人口普查的周期是10年,2000年,2010年
频率
fi
fi
fi :第i组频数
32
(2)频率的性质 (A )
0
fi
1 fi
(B ) (3)频数密度与频率密度(消除异距分组对频数影响) (A) (2.7) 频数密度=频数/组距 (B) (2.8) 频率密度=频率/组距 各组频数密度与各组组距乘积之和等于总体单位数,各 组频率密度与各组组距乘积之和等于1.
29
组数的确定(H.A.Struges经验公 式)
•
n = 1 + 3.3logN
N – 24 – 44 – 89 – 170 – 359 n 5 6 7 8 9
(斯特杰斯)
• • 15 • 25 • 45 • 90 • 180 • 组距=
30
四、频数(次数)分布
1.频数分布的基本理论
(1)频数分布的定义 在统计分组的基础上,将总体所有单位按某一标志 归类排列,并计算其相应出现的次数。 频数分布是统计整理的重要形式,通过对零乱的、 分散的原始资料进行有次序的整理,形成一系列反映 总体各组之间单位分布状况的数列,即分布数列。
10
• 概率抽样的特点: 1、样本单位按随机原则抽取,排除了主观因素对 选样的影响。 2、根据部分调查的实际资料对调查对象总体的数 量特征作出估计。 3、抽样误差可以事先计算并加以控制。 • 抽样调查的适用场合
《统计学》教学课件 第二章 统计数据收集、整理与呈现
全面调查 非全面调查
普查、统计报表制度、抽 样调查、重点调查和典型 调查等是常见的统计调查 方式,其中普查即全面调 查,其余的为非全面调查。
1.普查 普查是根据特定研究目的而专门组织的一次性的全 面调查,以收集研究对象的全面资料。
目前,我国组织实施的普查主要包括人口普查、经济普查和 农业普查三种。
缺然点后:通过典细型致单分析位典的型选单位取以受认人识总为成功经验、找出失败 现(一3)定突的出倾选典向式性。,突出且选典典型式是调指查选结择总体教中训的或先观进察单新位生、事后物进的单情位况或。新生事 果物不作宜为典用型以单推位,算进全行面深入数细据致。的调查。
2.报告法
3.采访法
又称凭证法,指要求调查 由调查人员对被调查者进
对象以原始记录、台帐和 行采访,根据被调查者的
核算资料为依据,向有关 答复来收集数据的方法,
单位提供统计资料的方法。 包括面谈访问、电话访问、
邮寄访问 和网络访问等。
4.登记法 指当事人根据有关法制法规规定,在开展某些活动或 发生某事时,主动到有关机构进行登记,填写有关表 格,提供有关统计信息。
④滚雪球抽样。是一种针对稀疏总体进行的抽样调查,抽选样本时 先找到几个符合条件的调查单位,然后通过这些调查单位找到更多 符合条件的调查单位,以此类推,样本如同滚雪球般由小变大,直 至达到要求的样本数为止。
⑤流动总体抽样。流动总体抽样是采用“捕获—放回—再捕获”的方式 来估计总体。
4.重点调查
重点调查也是一种非全面调查,是对数据收集对象总体 中的部分重点单位进行观测的统计调查方式。
频数(人) 频数(%)
30岁以下
39.3
30-40岁
37.9
40-50岁
【统计学 精】第二章 统计数据的搜集和整理
• 例如:通过抽样推断得出,厦大学生的平均 月支出在(420,470)元上的可靠性为90%。
(4)抽样推断的误差可以事先计算,并加以控制。
• 抽样调查的优越性: 第一,经济性强。 第二,时效性高。 第三,适应面广。 第四,准确性大。
抽样调查的适用范围 (1)一些不可能或不必要进行全面检查的社会 现象。
2。重点调查
• 重点调查是指在调查对象中,只选择一 部分重点单位进行的非全面调查。
重点单位 • 所谓
,这些单位在全部单位中只是一部分,但它们
在所研究现象的标志总量中却占有绝大的比重,在总体中具有举足轻重 的作用。
• 重点单位即,所要调查的数量特征占较大比重的少数单位,对这些单位 进行调查,能够从数量上反映整个总体在该标志总量方面的基本情况。
• 在典型调查中,科学地选择代表性较高的典型单位,利 用个典型单位的典型资料来推算全面数据,能取得较理 想的调查效果。
• 无限总体的调查。 • 破坏性的产品质量检验。 • 总体单位数过大。 • 没必要全面调查,如城乡居民家计调查、民意测 验等。 • 特殊情况,如战备物资调查、矿产调查等
(2)对普查资料进行必要的修正。
4、典型调查
• 这是一种专门组织的非全面调查。它根据调查的目的,在对所研 究的对象进行初步分析的基础上,有意识地选取若干(一个或少 数几个)具有代表性的单位进行调查和研究,借以认识事物发展 变化的规律。
一第、一统节计统资计料数搜据集的来概源述
(一)统计数据搜集的概念
• 1、定义:统计数据搜集是根据统计研究预定的目的和任务,运用
科学的调查方法与手段,有计划、有组织地向客观实际采集数据的过程。
• 2、资料类型
统计学第二章 统计数据的搜集、整理和显示
(二)经常性调查与一次性调查
• 统计调查按时间标志可分为连续性(经常 性)和不连续性(一次性)调查两大类。 • 1、连续性(经常性)调查:是指随着研究 现象的变化,连续不断地进行调查登记。 如统计报表制度。 • 2、不连续性(一次性)调查:是指间隔一 段较长的时间对事物的变化进行一次性调 查,如普查、典型调查。
三、数据的搜集方法
(一)访问调查 (二)电话调查 (三)邮寄调查 (四)座谈会 (五)个别深度访问 (六)网上调查
第三节 数据整理
一、数据的预处理 (一)数据的审核 对调查资料进行审核是统计整理的第一 步,包括以下内容: 1、审核资料的完整性和及时性 2、审核资料的正确性: 审核资料的正确性,是检查所填报的资料 是否准确可靠。常用的审核方法有两种:逻辑 检查和计算检查 3、历史资料的审核
(二)资料审核后的订正
ቤተ መጻሕፍቲ ባይዱ
普查的组织形式:组织普查机构或利用调查单位 的原始记录和核算资料。
2)全面统计报表制度 • 概念: 全面统计报表制度是依照国家有关法规, 自上而下地统一布置,以一定的原始记录为依据 ,按照统一的表式,统一的指标项目,统一的报 送时间和报送程序,自下而上地逐级地定期提供 统计资料的一种调查方式。 • 全面统计报表的实施范围,是调查对象的全部单 位均要填报。 • 统计报表的主要特点:
四、 现有统计资料的主要来源 • 1.统计年鉴 • 2.有关期刊 • 3.有关网站
第二节 统计数据
一、数据类型 (一)数据的计量尺度 根据对研究对象计量的不同精确程度,人们 将计量尺度由低到高、由粗略到精确分为四个层 次:定类尺度、定序尺度、定距尺度和定比尺度。 (二)数据类型 1、横截面数据。是指在同一时间对同一总体内不 同单位的数量进行观察而获得的数据。 2、时间序列数据。是指在不同时间对同一总体的 数量表现进行观察而获得的数据。
第二章统计数据的搜集与整理
第⼆章统计数据的搜集与整理第⼆章统计数据的搜集与整理(⼀)教学⽬的通过本章的学习,了解统计数据搜集与整理的基本理论与⽅法,掌握各种⽅法的特性。
(⼆)基本要求要求灵活运⽤各种数据搜集的⽅式⽅法,并对所得数据进⾏加⼯整理,为以后各章学习打下基础。
(三)教学要点1、数据搜集的⽅式⽅法;2、统计调查⽅案的设计;3、统计分组;4、变量数列的编制;5、统计数据的显⽰。
(四)教学时数9课时(五)教学内容本章共分四节:第⼀节数据的计量与类型⼀、数据的计量尺度在计量学的⼀般分类⽅法中,依据对事物计量的精确程度,可将所采⽤的计量尺度由低级到⾼级、由粗略到精确分为四个层次,即名类尺度、顺序尺度、区间尺度和⽐尺度。
1.定类尺度定类尺度(Nominal scale,亦称分类尺度、列名尺度等)是这样⼀种品质标志,按照它可对研究客体进⾏平⾏的分类或分组,使同类同质,异类异质。
例如,按照性别将⼈⼝分为男、⼥两类;按照经济性质将企业分为国有、集体、私营、混合制企业等。
这⾥的“性别”和“经济性质”就是两种名类尺度。
名类尺度是最粗略、计量层次最低的计量尺度,利⽤它只可测度事物之间的类别差,⽽不能了解各类之间的其他差别。
名类尺度计量的结果表现为某种类别,但为了便于统计处理,例如为了计算和识别,也可⽤不同数字或编码表⽰不同类别。
⽐如⽤1表⽰男,0表⽰⼥;⽤1表⽰国有企业,2表⽰集体企业,3表⽰私营企业,等等。
这些数字只是不同类别的代码,决不意味着它区分了⼤⼩,更不能进⾏任何数学运算。
名类尺度能对事物做最基本的测度,是其他计量尺度的基础。
2.定序尺度定序尺度(Ordinal scale,亦称序数尺度、顺位尺度等)是这样⼀种品质标志,利⽤它不仅能将事物分成不同的类别,还可确定这些类别的等级差别或序列差别。
例如“产品等级”就是⼀种测度产品质量好坏的顺序尺度,它可将产品分为⼀等品、⼆等品、三等品、次品等;“考试成绩”也是⼀种顺序尺度,它可将成绩分为优、良、中、及格、不及格等;“对某⼀事物的态度”作为⼀种顺序尺度,可将⼈们的态度分为⾮常同意、同意、保持中⽴、不同意、⾮常不同意,等等。
黄良文《统计学》课后习题(统计数据的搜集与整理)【圣才出品】
黄良文《统计学》课后习题第2章统计数据的搜集与整理2.1选择题(1)统计调查对象是()。
A.总体各单位标志值B.总体单位C.现象总体D.统计指标【答案】C【解析】调查对象是指需要调查的现象总体,该总体是由许多性质相同的调查单位组成的。
(2)统计调查方法体系中,作为“基础”的是()。
A.经常性抽样调查B.必要的统计报表C.重点调查及估计推算等D.周期性普查【答案】D【解析】为适应社会主义市场经济的要求,目前,我国建立起了以必要的周期性的普查为基础,经常性的抽样调查为主体,同时辅之以重点调查、科学推算和部分全面报表综合运用的统计调查方法体系。
(3)要对某企业的生产设备的实际生产能力进行调查,则该企业的“生产设备”是()。
A.调查对象B.调查单位C.调查项目D.报告单位【答案】A【解析】调查对象是指需要调查的现象总体,该总体是由许多性质相同的调查单位组成的。
调查对象是该企业的“生产设备”;调查单位是每一个生产设备;调查项目是实际生产能力;报告单位是该企业。
(4)下面哪些现象适宜采用非全面调查?()A.企业经营管理中出现的新问题B.某型号日光灯耐用时数检查C.一个地区新增加的人口数D.某地区森林的木材积蓄量【答案】ABD【解析】全面调查是对被研究总体的所有单位一一进行调查;非全面调查是选取被研究现象总体中的一部分单位进行调查。
ABD三项属于一些不可能或没必要进行全面调查的社会现象,应采用抽样调查的方式进行调查。
2.2有人说抽样调查“以样本资料推断总体数量特征”缺乏科学依据,你认为呢?答:抽样调查是一种非全面调查,包括概率抽样和非概率抽样。
概率抽样是按随机原则从调查对象中抽取一部分单位作为样本进行观察,然后根据样本数据去推算调查总体的数量特征。
对于一些不可能或没必要进行全面调查的社会现象,如对于一些破坏性的试验,以及对普查资料进行必要的修正时,都可采用抽样调查。
由于抽样调查的样本单位按随机原则抽取,保证每个单位有相等的机会被抽取,排除了主观因素对选样的影响;以样本数据推算总体数量特征,不可避免地会产生误差。
统计学ch2统计数据收集和整理
01
表格是展示数据的重要工具,可以清晰地呈现多维度的数据 信息。
02
设计表格时,应遵循简洁明了的原则,避免过于复杂和混乱 。
03
表格中应包含必要的统计指标和数据,并标注好单位和时间 等关键信息。
图形展示
图形展示能够直观地呈现数据的分布和变化趋势,帮助人们更好地理解和分析数据。
常用的图形包括折线图、柱状图、饼图等,选择合适的图形可以更好地突出数据的 特征和规律。
确保数据没有遗漏,所有 相关的信息都已收集。
完整性保障
采取措施确保数据收集过 程中不出现遗漏,如制定 详细的收集计划和流程。
数据补充
对于缺失的数据,采取合 理的方法进行补充或估算。
数据代表性
样本选择
选择具有代表性的样本,以确保数据能够反映总体特 征。
权重调整
根据不同数据源或不同特征的数据,调整其权重,以 提高数据的代表性。
根据调查目的和范围,确定合适的样本量 和抽样方法,以提高调查的代表性和准确 性。
02
数据整理
数据筛选与处理
01
02
03
04
缺失数据处理
对于缺失的数据,可以采用插 值、回归等方法进行填补,或
者直接删除。
异常值处理
识别并处理异常值,如使用 IQR(四分位距)方法或Z分数
方法。
数据清洗
去除或更正错误、不一致或无 效的数据。
对收集到的数据进行整理、分类、统计和分 析,得出有价值的信息。
人口普查数据收集与整理
确定普查目的
明确普查目标,如了解人口数量、性别比例、年龄结构等。
设计普查方案
制定普查计划,包括普查时间、范围、方式等。
组织普查实施
组织专业人员开展普查工作,确保数据采集的准确性和完整性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.非全面调查 : 对调查对象其中的一部分单 非全面调查: 非全面调查 位进行调查。 1) 抽样调查 ) 抽样调查sampling, 是从调查对象中抽 , 取一部分单位作为样本进行观察,然后根据 所获得的样本数据,对调查对象总体特征作 出具有一定可靠程度的推算或对总体进行了 解。 A)特点: 特点: 特点 第一,按随机原则抽取样本。 , 第二, 第二 , 根据部分调查的实际资料对调查对象 总体的数量特征作出估计(统计推断)。 第三, 第三,抽样误差可以事先计算并加以控制。
2.统计表的结构 统计表的结构(P41,表2-5) 统计表的结构 , 1) 从表式上看 ) 从表式上看,表格包括总标题、 横行标题、纵栏标题和指标数值四 个部分。 2 ) 从内容上看,统计表由主词栏和 2) 从内容上看 宾词栏两个部分组成。
(二)统计表的分类
1.按主词的结构分类 按主词的结构分类 1)简单表list 2)分组表 3)复合表 2. 按宾词设计分类 1)宾词简单排列表 2)宾词分组平行排列表。
(一)全面调查与非全面调查
1.全面调查是对调查对象的所有单位 全面调查是对调查对象的所有单位 一一进行调查。 一一进行调查。 1)普查 )普查census 普查是专门组织的一种全面调查,它 普查 主要是用以调查某些不能或不宜用定 期的全面报表搜集的统计资料。
普查的主要特点: 普查的主要特点: 第一,它是一次性(非连续性)的调 查,一般间隔较长时间。 第二,它是一种全面调查,可获得大 量详细、全面的资料。 例如,人口普查,经济普查
(二)统计分组的方法
1.品质分组的方法 品质分组的方法 2.数量分组的方法 数量分组的方法 1)应注意的问题: )应注意的问题: A)分组时各组数量界限的确定必须能反 映事物质的差别。 B)应根据被研究的现象总体的数量特征, 采用适当的分组形式,确定相宜的组距、 组限。
2)单项式分组与组距式分组 ) A)单项式分组 B)组距式分组: 连续型变量或者变动范围较大的离散型 变量,适宜采用组距式分组。 3)间断组距式分组和连续组距式分组 ) 主要概念: 主要概念:下限和上限、组距、组限 间断组距式分组: 间断组距式分组 : 组限不相连的组距式 分组
B)适用范围: 适用范围: 适用范围 第一,不可能或不必要进行全面调 第一 查的社会现象。例如,破坏性的产 品质量检查 第二,对普查资料进行必要的修正。 第二
2)重点调查 ) 重点调查:是指在调查对象中,只选 重点调查 择一部分重点单位进行的非全面调查。 3)典型调查 ) 典型调查是一种专门组织的非全面调 典型调查 查。根据调查的目的,在对所研究的 对象进行初步分析的基础上,有意识 地选取若干具有代表性的单位进行调 查和研究,借以认识事物发展变化的 规律。
一般来说,如果一个量是由许多微小 的独立随机因素影响的结果,那么就 可以认为这个量具有正态分布(中心 极限定理)。从理论上看,正态分布 具有很多良好的性质 ,许多概率分布 可以用它来近似;还有一些常用的概 率分布是由它直接导出的,例如对数 正态分布、t分布、F分布等。
2、U型分布 、 型分布
50
3.累计频数分布特点 累计频数分布特点 4.累计频数(频率)分布图P47,2-6 累计频数(频率)分布图 累计频数 , 累计频数(频率)分布图分为向上累 计频数(频率)分布图和向下累计频 数(频率)分布图。 以分组变量为横轴,以累计频数(频 率)为纵轴。
四、频数分布的类型
1.钟型分布:bell-shaped distribution 钟型分布: 钟型分布
正态分布Normal Distribution
Gaussian distribution 在高斯Gauss的一切科学贡献中,其对人类 文明影响最大者,就是这一项。 正态分布有极其广泛的实际背景,生产与科 学实验中很多随机变量的概率分布都可以近 似地用正态分布来描述。 例如,在生产条件不变的情况下,产品的强 力、抗压强度、口径、长度等指标;同一种 生物体的身长、体重等指标;同一种种子的 重量;测量同一物体的误差;弹着点沿某一 方向的偏差;某个地区的年降水量;以及理 想气体分子的速度分量,等等。
第二章 统计数据的搜 集、整理和显示
第一节 第二节 第三节 第四节 统计数据的搜集 数据整理 频数分布 数据显示
第一节 统计数据的 搜集
一、统计数据搜集的基本理论
(一)定义
1.根据统计研究 根据统计研究预定的目的要求和 根据统计研究 任务,运用相应的科学的调查方法 与手段,有计划、有组织地向客观 实际搜集数字(原始)资料。 2.搜集数据的途径:调查与实验 搜集数据的途径: 搜集数据的途径
4)等距分组与异距分组 ) 等距分组: 等距分组 : 标志值在各组保持相等的 组距,即各组的标志值变动都限于相 同的范围。 异距分组: 异距分组:各组的组距不相等。
5)组距与组中值的计算 ) 连续式分组的组距计算公式: distance组距=本组上限–本组下限 间断式分组的组距计算公式: 组距=本组上限–本组下限+1 开口组的组距:以相邻组的组距为本 组的组距。 上限 + 下限 组中值 = 2
(一)统计分组的概念与种类
1.统计分组的概念 统计分组的概念 组内一致性, 组内一致性,组间差异性 2.统计分组的原则 统计分组的原则 穷尽原则:不漏 互斥原则:不重
3.统计分组的种类 统计分组的种类 1)按分组标志的多少 标志的多少,可分为简单 标志的多少 分组和复合分组。 2)按分组的标志的性质 标志的性质不同,分为 标志的性质 品质分组(或称属性分组)和数量分 组(或称变量分组)。 3)按分组的作用和任务 作用和任务不同,分为 作用和任务 类型分组、结构分组和分析分组。
(二)连续性调查与非连续性调 查
统计调查按时间标志 按时间标志可分为连续性(经 按时间标志 常性)和不连续性(一次性)调查两大 类。 1.连续性 连续性(经常性)调查:是指随着研 连续性 究现象的变化,连续不断地进行调查登 记。 2.不连续性 不连续性(一次性)调查:是指间隔 不连续性 一段较长的时间对事物的变化进行一次 性调查。
( Ⅰ ) 对称
( Ⅱ )
正偏,右
( Ⅲ )
负偏,左
钟型分布示意图
如图(Ⅰ)所示,其分布特征是以变量 的平均数为对称轴,左右两侧对称,两 侧变量值分布的次数随着与其平均值距 离的增大而渐次减少。在统计学,它们 各有不同方向的偏态。图(Ⅱ)曲线是 正偏(右偏)分配,图(Ⅲ)曲线是负 偏(左偏)分配。
四、统计调查误差error 统计调查误差
第二节 数据整理
一、数据整理的内容与程序
1.统计数据整理的内容 统计数据整理的内容: 统计数据整理的内容 统计分组和统计指标是统计整理的中心 统计分组和统计指标是统计整理的中心 工作。 工作。 2.数据整理的程序。 数据整理的程序。 数据整理的程序
二、统计分组
(二)调查数据与实验数据
1.调查数据 2.实验数据,自然科学
(三)统计调查的方案设计PLAN 统计调查的方案设计
1.确定调查目的. 2.确定调查对象和调查单位(P22) 调查对象:要调查的现象总体,该总体 是由许多性质相同的调查单位组成的。 调查单位:所要调查的具体单位,是进 行调查登记的标志的承担者 报告单位/填报单位:负责向上报告调 查内容,提交统计资料的单位 3.确定调查项目:标志。 4.调查表格和问卷的设计。 5.确定调查时间(时期,时点)和调查 期限. 6.统计调查的组织实施计划
三、cumulative累计频数与累计频率 累计频数与累计频率 1.向上累计频数(或频率)分布:先 向上累计频数(或频率)分布: 向上累计频数 列出各组的上限,然后由标志值低的 组向标志值高的组依次累计。 2.向下累计频数(或频率)分布:先 向下累计频数(或频率)分布: 向下累计频数 列出各组的下限,然后由标志值高的 组向标志值低的组依次累计。 例题2-2,P37
( 三)定期报表形式与专门调查 1.定期报表制度 定期报表制度是按国家统一规定的表 定期报表制度 式和内容,定期地向各级领导机构报送 统计资料的一种调查形式。 2.专门调查 专门调查是为某一专题研究而组织 专门调查 的专项调查。
三、统计调查体系
建立以必要的周期性的普查为基础, 经常性的抽样调查为主体,同时辅之 以重点调查、科学推算和少量的全面 报表综合运用的统计调查方法体系 统计调查方法体系。 统计调查方法体系
例: 1,要对某企业的生产设备的实际生产能力进 行调查,则该企业的生产设备是( ) A调查对象 B调查单位 C调查项目 D报告单位 2,调查某市工业企业资产负债的分布状况, 则工业企业是( ) A调查对象和报告单位 B调查单位和报告单位 C报告单位和填报单位 D填报单位和调查对象
二、统计调查的组织形式
某地区人口 死亡率
死 亡 率
(‰)
40 30 20 10 0
10 20 30 40 50 60 70 80
年龄
图2 - 4 U型分布示意图 型分布示意图
3、J型分布 、 型分布
正J型图
反J型图
J型分布示意图 型分布示意图
第四节 数据显示 统计表和统计图
一、统计表
(一)统计表的定义和结构 1.统计表的定义 统计表的定义 作用:清楚地、有条理地显示统计资料, 作用 直观地Intuitionally, Intuitively反映统 计分布特征,是统计分析的一种重要 工具。 。
6)组数的计算: )组数的计算: 组数=全距/组距 斯特杰斯Sturges经验公式(P31): 组数=1+3.3 Lg N 由此推出,组距=(最大变量值-最小 变量值)/(1+3.3Lg N )
三、统计指标Index, Indicator 统计指标
(一)指标的定义 总体的数量特征 描述总体的数量特征。标志是描述个体 描述总体的数量特征。标志是描述个体 的。 (二)指标的分类 1.数量指标:GDP 数量指标: 数量指标 2.质量指标 CPI,Engel coefficient系 质量指标: 质量指标 , 系 数 (三)指标体系 (四)国民经济活动的主要统计指标