统计学原理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学原理
第一章绪论
统计是对客观事物的数量方面进行核算和分析,是人们对客观事物的数量表现、数量关系和数量变化进行描述和分析的一种计量活动。
统计的三层含义:统计工作、统计资料、统计学
统计工作:即统计实践活动,是人们对客观事物的数据资料进行搜集、整理、分析的工作的总称,是一种社会调研活动
统计资料:是统计工作的成果,包括各种统计报表、统计图形及文字资料等。
统计学:是研究大量社会现象(经济)的总体方面的方法论科学
三者关系:统计学与统计实践活动的关系是理论与实践的关系,理论源于实践,理论又高于实践,反过来又指导实践。
统计工作和统计数据是工作和工作成果关系。
统计工作过程(统计工作的基本环节):
1.统计设计(准备阶段)设计方案、指标体系、分类目录等
2.统计调查(调查阶段)收集和占有统计资料
3.统计整理(整理阶段)分布数列、次数分布等加工资料(承上启下)
4.统计分析(分析阶段)绝对指标、相对指标等
5.统计的表现与运用(工作总结)
统计研究的基本方法:1.大量观察法2.综合指标法3.统计分组法4.归纳推理法5.统计模型
社会统计学的特点
1、数量性:统计研究对象是客观事物的数量方面。
2、总体性:主要是研究社会经济现象的总体数量规律
3、具体性:社会经济统计的研究对象是具体事物的数量,不是抽象的量。
4、变异性:总体中各单位的数值表现存在差异
5、不确定性:是在现有的统计资料基础上或样本数据基础上进行阶段性分析,所获得的结论不确定
统计的职能:信息职能、咨询职能、监督职能。
第二章统计数据的搜集
统计学中几个基本概念
统计数据的计量尺度
统计数据:是对客观社会经济现象进行计量的结果。
1.定类尺度:也称类别尺度或列名尺度,是按照现象的某种属性对其进行平行的分组或分类。
是最粗略、计量层次最低的计量尺度。
2.定序尺度:又称顺序尺度,是对现象之间的等级差或顺序差别的一种测度。
可以确定类别的优劣或顺序
3.定距尺度:也称间隔尺度,是对现象类别或次序之间间距的测度。
能进行排序以及准确地指出类别之间的差距是什么。
4.定比尺度:,也称为比率尺度,比定距尺度高一个层次,可以计算两个测量值之间的比值,其计算结果也表示为数值。
上述四种尺度对现象的测量层次是由低级到高级、由粗劣到精确逐步递进的。
统计数据的类型
因为测量尺度不同,分为四种类型:定类数据、定序数据、定距数据、定比数据
统计总体和总体单位
总体即统计总体,是指客观存在的、在同一性质基础上结合起来的许多个别事物的整体。
总体单位(简称单位)是组成总体的各个个体。
例如:要研究全国城镇居民的收支情况,就以全国城镇居民作为一个总体,每一个居民为总体单位。
总体的特点:1同质性:是确定总体的前提和基础。
它是根据统计的研究目的而定的。
大量性:统计总体应该由足够数量的同质性单位构成(必要条件)。
差异性:构成总体的各个同质性单位的特征存在着差异(前提和内容)。
注:构成中提的单位必须是同质的,不能把不通知的单位混在总体之中。
总体与总体单位具有相对性,随着研究任务的改变而改变。
同一研究对象,在一种情况下为总体,但在另
一情况下又可能变成单位。
标志和指标
标志是说明总体单位属性和数量特征的名称
标志表现是指标所反映的属性和数量特征在各总体单位的具体表现
标志分类:
★标志表现(品质标志、数量标志)
品质标志:说明总体单位质的特征,只能用文字、符号或数字代码来表现。
数量标志:表示总体单位量的特征,用数值来表现称为标志值(变量值)。
★标志变异(不变标志、可变标志)
不变标志: 在同一总体中,当一个标志在各个总体单位的表现都相同称为不变指标。
不变标志是总体同质性的基础。
变异标志:亦称可变标志,在一个总体中,当一个标志在各单位的具体表现有可能不同时,称为可变标志。
作为总体,同时必须存在变异标志,这表示所研究的现象在各单位之间存在着差异,才需要进行统计研究。
统计指标与统计指标体系
统计指标:由指标名称和指标数值构成。
反映统计总体数量特征的概念和数值。
特点:能用数字表示、说明综合特征、反映一定社会经济范畴的数量
构成:统计指标由两项基本要素构成,即指标的概念(名称)和指标的取值。
例如:经统计调查某民营企业固定资产原值(指标名称)为9.2亿元(指标数值)
统计指标分类:1.按其反映的内容不同分为数量指标(对应总量指标)反映总体绝对数量
多少的总量指标(指标总量和总体单位数)质量指标(对应相对指标和平均指标)反映总体内部结构和总体单位平均水平,说明工作效率、工作质量的统计指标
2.按其作用和表现形式的不同分为总量指标(绝对数)相对指标(相对数)平均指标(平
均数)
3.概念性指标:反映现象总体数量状况的基本概念。
三要素:指标名称、计量单位、计算
方法。
例如,年末全国人口总数、全国国内生产总值、社会消费品总额等。
具体的统计指标:反映现象总体数量状况的概念和数值。
六要素:指标名称、计量单位、计量
方法、指标数值、时间限制、空间限制。
例如:2011年我国国内生产总值为471564亿元,2011年末国家外汇储备31811亿美元。
特性:数量性、具体性、综合性
指标与标志的关系
▲标志反映总体单位的属性和特征,而指标则反映总体的数量特征。
▲指标都是用数值表示,标志用属性表示
▲指标数值经汇总得出,标志中的数量标志不一定通过汇总,可直接
▲标志一般不具有时间、地点等条件
▲总体和单位的概念会随着研究目的不同而变化,因此指标与标志的概念也是相对而言的。
▲有许多统计指标的数值是从总体单位的数量指标汇总而来的
变异与变量
变异:标志在总体单位之间的不同具体表现
变量:说明某种特征的概念。
可变的数量标志。
标志和指标都属于变量的范畴。
变量的具体数值表现即变量值。
变量的分类:
1.属性变量(定类变量、定序变量)数值型变量(定距变量、定比变量)
数值型变量又可分为离散型变量、连续型变量
连续型变量是指变量的取值在数轴上连续不断,例如,气象上的温度、湿度,零件的尺寸等。
按取值是否连续:
离散型变量是指变量的其取值是整数值,例如,企业数,职工人数等。
2.按所受因素不同:
确定性变量:是受确定性因素影响的变量
随机变量:是受许多微小的不确定因素(又称随机因素)影响的变量。
流量与存量
流量:一定时期存量:一定时点
统计数据搜集的方法
1.概念:指获取被调查对象数据的渠道或途径
2.分类:(1)直接观察法(2)通信法(3)采访法(4)登记法
统计调查
1.概念:指为了达到对客观进行认识的目的,把所要认识的对象作为一个研究总体,按照
已设计的统计标准体系和统计指标体系,采用科学的方式和方法,对研究总体进行计数、测量和登记,取得反映总体各单位有关特征的统计原始数据的统计方法。
2.基本特征:
(1)以统计认识为直接的、唯一的目的对统计总体的有关特征进行计数、测量和登记。
(2)统计调查搜集的是原始数据
调查方式(调查的类型/组织形式)
1、按调查对象范围:全面调查(普查)非全面调查(抽样调查统计报表重点调查典型调查)
2、按调查目的:应用性调查学术性调查
3、按调查时间:一次性调查经常性调查跟踪性调查
4、按状态不同:动态调查静态调查
5、按调查对象内容:综合调查专题调查
普查:为某一特定目的而专门组织的一次性全面调查(人口普查、工业普查等)
●特点:(1)通常是周期性的或一次性的,涉及面广、耗时、费力,一般需间隔较长时间;(2)一般需要规定统一的标准调查时间,以避免调查数据的重复或遗漏;
(3)准确性一般较高,较规范;
(4)适用的对象较窄,只能调查一些最基本、最一般的现象。
●原则:
(1)规定统一的标准时间
(2)尽可能在短期内完成登记工作
(3)普查尽可能按一定周期进行
(4)统一规定调查项目
统计报表:以原始数据为依据,按照国家统一规定的表格形式、统一规定的指标内容、统一的
报送程序和报送时间,由基层单位自下而上逐级向上级和国家定期提供统计资料的一种报告制
度。
●特点:统一性、全面性、经常性和相对可靠性
抽样调查:从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果推断总体数量特征。
●特点/优点:经济性强、时效性高、适应面广、准确性高
作用:能够解决全面调查无法或难以解决的问题。
可以补充和订正全面调查的结果。
可以用于对总体的某种假设进行检验。
重点调查(反映总体基本情况)(个别现象----一般性情况)
从调查对象的全部单位中选择少数重点单位进行调查(适用于“同类”中的“大户”)。
典型调查(推算总体的数量特征)(个别表象-----一般性结论)
从调查对象的全部单位中选择一个或几个有代表性的单位进行调查。
(不一定针对“大户”)
统计调查方案的基本内容
1确定调查目的和内容
2确定调查对象、调查单位和报告单位
(1)调查对象就是我们需要进行研究的总体范围,即调查总体。
它是由性质相同的许多调
查单位所组成的。
(2)调查单位是进行研究的总体单位,也即登记的标志表现的直接承担者。
(3)报告单位是指负责报告调查内容的单位
注意:调查单位与填报单位的区别调查单位是调查项目的承担者;填报单位是负责上报调查资料的单位。
3确定调查项目拟定调查表
1)确定调查项目
2)拟定调查表
(1)表头、表体和表脚
(2)单一表和一览表
4确定调查时间和期限
5制定调查的组织实施计划/
6 选择调查方法
统计数据的质量评价标准
精度、准确性、关联性、及时性、一致性、最低成本
第三章统计数据的整理和管理统计整理的概念和作用
1概念:根据统计研究的目的,将统计调查所获得的大量原始资料,进行科学的分类汇总,使之条理化、系统化,得出能反映现象总体特征的综合资料的过程。
2作用:统计整理是统计调查的继续,是统计分析的前提,它实现了统计资料从个别单位标志值向总体综合指标的过度,在统计研究中起着承前启后重要的作用
统计整理的步骤
1.制定整理方案(分类(分组)和汇总方案)
2.对调查资料进行审核和订正
3.进行统计分组(分类)并进行编码
4.进行统计汇总
5.编制统计表、绘制统计图,显示统计结果。
统计分组的概念和作用:
1概念:根据现象总体内在特点和统计研究任务的要求,将总体按照一定标准划分为若干性质不同又有联系的组成部分的一种统计方法。
2作用:1划分现象的类型
2说明社会经济现象的内部结构
3研究总体各部分之间的依存关系
选择分组标志的原则:根据研究问题的目的来选择
要选择最能反映被研究现象本质特征的标志
要结合现象所处的具体历史条件或经济条件来选择
分组标志的种类:品质标志分组—— 反映事物属性差异(简单复杂)
数量标志分组—— 反映事物数量差异(单项式组距式)简单分组—— 按一个标志对总体进行分组复合分组—— 按两个或两个以上标志对同
统计分组的分类
[]
分布数列1概念:在统计分组的基础上,将总体的所有单位按组归类,并按顺序排序,形成总体中各单位在个组件的分布,称为分布数列,又可称次数分配,或次数分布。
分布在各组的个体单位数叫次数,又称频数;各组次数与总次数之比叫比率,又称频率。
2分布数列的构成要素:
总体按某一标志所分成的各个组
各组次数或频率。
(次数即分布在各组的单位数,频率是各组的次数与次数的总和相比求得的比重)
分布数列分类:品质分布数列(这种数列一般比较稳定,只要分组标准定的比较恰当,通常能准确地反映总体的分布特征)
变量分布数列单项式分布数列
组距分布数列(等距数列异距数列)
组距数列的编制组限:组距两端的数值。
分为上限和下限。
组距:某一组的上限和下限的距离,分等距和异距(组距=上限-下限)
1、组距计算公式
①连续组距式分组:组距=本组上限-本组下限
②间断组距式分组:组距=本组上限-本组下限+1
全距:分组数列中最大值的上限与最小值的下限之差
组中值: 组的上限和下限的中间值
2、组中值的计算
①同时有上限、下限的组:组中值=(上限+下限)/ 2
②缺下限最小组:组中值=上限-相邻组组距/ 2
③缺上限最大组:组中值=下限+相邻组组距/ 2
等距数列等组距=全距/组数
异距数列次数密度=各组次数/各组组距
频数密度=各组频率/各组组距
统计表
1概念:把大量的统计数字资料,按一定顺序和格式列在表上,该表就是统计表。
包括调查表、汇总表、计算表以及各种各样容纳资料的统计表。
2构成:
从构成要素看:统计表由总标题、分标题(横行标题、纵栏标题)、数字资料构成。
从内容上看:统计表由主词和宾词两部分构成。
主词是统计表所要说明的总体及其主要分组情况;宾词是说明总体的统计指标
统计表的种类简单表
简单分组表
复合分组表
统计表的编制原则
1、统计表的各种标题,特别是总标题的表达,应该十分简明确切,概括地反映出表的基本内容。
2、表的主词各行和宾词各栏,一般应按先局部后整体的原则排列,即先列各个项目,后列总计。
3、如果统计表的栏数较多,通常要编号
4、表中数字应该填写整齐,对准位数
5、统计表中必须注明数字资料的计量单位
6、统计表的表式,通常是左右开口的
7、必要时,统计表应家注说明或解释
第四章综合指标
综合指标从它的作用和方法特点的角度可概括为三类:总量指标、相对指标、平均指标
总量指标(绝对指标)
总量指标是反映社会经济现象一定时间、地点、条件下总的规模、水平的统计指标。
总量指标表现形式是绝对数,不是抽象的绝对数,是有名数。
作用:1总量指标能反映一个国家的基本国情和国力,反映某部门或单位等人、财、物的基本数据。
2总量指标是制定政策、编制计划、实行社会经济管理的依据之一。
3 总量指标是计算相对指标和平均指标的基础。
种类:(一)按其反应的内容不同可分为:
总体单位总量——说明总体的单位总数。
(例:企业数、学校数、职工人数、学生人数)
总体标志总量——说明总体中某个标志值总和。
(例:总产量、总产值、工资总额、税金总额。
)
(二)按其反映的时间状况不同可分为:
时期指标——反应现象在某一时期发展过程的总数量(可连续计数,与时间长短无关,是累计结果)
时点指标——反应现象在某一时刻(瞬间)的状况。
(间断技术,与时间间隔无关,不能累计)
总体指标的计算:注意现象的同类、明确每项总量指标的统计含义、对计量单位熟悉
自然单位度量衡单位双重或多重单位复合单位货币单位劳动单位等
实物单位:是根据现象的属性和特点而采用的计量单位
价值计量单位:是用货币来度量社会财富或劳动成果的一种计量单位
劳动单位:是用劳动时间表示的计量单位。
相对指标
是两个有联系的指标数值之比,泳衣反映现象的发展程度、结构、强度、普遍程度或比例关系。
作用:相对指标能具体表明社会经济现象之间的比例关系。
相对指标能使一些不能直接对比的事物找出共同比较的基础。
相对指标便于记忆、易于保密。
相对指标的数值有两种表现形式:有名数(有单位的)无名数(系数百分数倍数等)
常用相对指标类型:计划完成相对指标;结构相对指标;比例相对指标;比较相对指标;
强度相对指标;动态相对指标计划完成相对数:用来检查、监督计划执行情况的相对指标。
一般用百分数表示。
结构相对指标:以部分数值与总体全体数值对比而得出比重或比率,来反映总体内部组成状况的综合指标。
比例相对指标:总体中不同部分数量对比计算的相对数
比较相对指标:两个同类总体的同类指标在不同国家、地区、部门、单位之间的对比计算结果可以用百分比、系数或倍数表示
强度相对指标:是由两个性质不同但有一定联系的总量指标对比计算的相对数。
用来表明一种现象与另一种现象对比中发展的强度、密度和普遍程度。
描述发展密度的强度相对指标可分为正指标(越大越好)和逆指标(越小越好)
强度相对数的两种表示方法:(1)一般用复名数表示。
(2)少数用百分数或千分数表示。
动态相对指标:两个不同时期或不同时点现象发展水平对比计算的相对指标。
[]作为对比标准的时间叫做基期,而同基期比较的时期叫做报告期,有时也称为计算
期。
常用的相对指标有发展速度和增长速度。
动态相对数的计算结果用百分数或倍数表示
平均指标平均指标的概念:又称平均数,平均指标是说明同质总体内某一数量标志在一定历史条件下一般水平的综合指标。
特点:1、将数量差异抽象化(数量标志)2、只能就同类现象计算3、能反映总体变量值的集中趋势
集中趋势:是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在
平均数的类型:数值平均数(算术平均数、调和平均数、几何平均数)位置平均数(众数、中位数、四分位数)算术平均数的基本公式=总体标志总量÷总体单位总数[]
算数平均数的数学性质(P59-60)
①算术平均数与标志值个数的乘积等于各标志值总和;②各标志值与算术平均数离差之和等于零;③各标志值与算术平均数离差的平方和为最小值
调和平均数
调和平均数又称“倒数平均数”,它是各个变量值倒数的算术平均数的倒数。
[]由相对
数求平均数
(1)明确相对数的分子、分母指标是什么,即相对数由哪两个指标对比形成。
(2)已知相对数的分子、分母指标时,用分子指标总数除以分母指标总数即为相对数的平均数。
(3)已知相对数的分子指标时,以分子指标为权数,采用加权调和平均数计算相对数的平均数;已知相对数的分母指标时,以分母指标位为权数,采用加权算术平均数计算相对数的平均数
(4)加权平均所采用的权数必须是相对数本身的分子或分母指标。
几何平均数
(1)几何平均数是N个变量值乘积的N次方根[]
几均。
几何平均主要用于计算比率或速度的平均
①应用条件
a.变量值是相对数据,如比率或发展速度。
b.变量值的连乘积等于总比率或总发展速度。
②特点
a.如果数列中有一个标志值等于零或负值,则无法计算。
b.受极端值影响较小,故较稳健。
位置平均数(是根据标志值的位置来确定的):①众数;②中位数
中位数(Median)中位数是一组数据按大小排序后,处于中间位置上的变量值。
中位数的求法
1、由未分组资料确定中位数:①先将总体各单位的标志值按照大小顺序排列。
②然后找出中位数。
当总体单位数N为奇数时,中位数位置=(N+1)/2;为偶数时,中位数位置=处于中间位置的两个单位标志值的算术平均数。
(P67例3-9)
2、由单项式分组资料确定中位数(P67例3-10)
3、由组距式分组资料确定中位数(P68例3-11)
众数(Mode)
众数是一组数据中出现次数最多的变量值。
众数的求法
1、由单项式分配数列确定众数:出现次数最多的标志值就是众数。
(P64例3-6)
2、由组距式分配数列确定众数:①先确定众数组。
等距分组条件下,次数最多的那一组为众数组;不等距分组条件下,频数密度或频率密度最高的那一组为众数组。
②通过公式计算众数的近似值。
(P65、66例3-7、3-8)
测定标志变动度的方法:全距、平均差、标准差
极差(又称全距,Range)是总体各单位标志的最大值和最小值之差,用以说明标志值变动范围的大小
[](例3-15)
平均差(average deviation):①未分组A.D =[] ;②已分组A.D =[]
平均差概括了所有单位的标志值变异情况,比极差和四位分差更具有综合性
方差与标准差
(1)总体数量标志的方差与标准差
②方差与标准差是测定标志变异程度最常用、最灵敏的指标
③总方差[]、组间方差[]、组内方差[]:[]
④方差与标准差的五个重要性质
(2)是非标志的方差与标准差:例3-18
第四章抽样估计和假设检验
抽样估计:按照随机抽样的原则,从总体中抽出一部分单位作为样本,并利用样本的实际资料计算样本指标值,然后根据样本指标对总体的数量特征(总体指标)做出具有一定可靠程度的估计和判断的一种统计分析方法。
抽样误差的概念
抽样误差即指随机误差,是指由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起抽样指标和全及指标之间的绝对离差。
抽样平均误差
1抽样平均误差是反映抽样误差的一般水平的指标。
2用抽样平均数的标准差或抽样成数的标准差来作为衡量其抽样误差一般水平的尺度。
影响抽样误差大小的因素:
1总体各单位标志值的差异程度。
(差异程度越大,抽样误差越大)
2样本的单位数(样本单位数越多,抽样误差越小)
3抽样方法(重复抽样的误差比不重复抽样的误差要大些)
4抽样调查的组织形式(简单随机抽样、类型抽样、等距抽样、整群抽样)
抽样极限误差
1概念:在做抽样估计时,应根据所研究现象的变异程度和分析任务的要求确定可允许的误差范围,在这个范围内的数字都算有效,这种可允许的误差范围称为抽样极限误差。
[]抽样极限误差等于样本指标可允许变动的上限或下限与总体指标之差的绝对值。
抽样误差的概率度
用抽样误差概率度t表示误差范围为抽样平均误差的t倍。
[]
抽样估计的置信度:
抽样估计置信度就是表明抽样指标和总体指标的误差,不超过一定范围的概率保证程度。
抽样估计的概率保证程度就是指抽样误差不超过一定范围的概率大小,用字母F(t)表示。