【统计学复习提纲】.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2013-2014学年度第二学期《统计学》复习提纲
第一章:绪论
1、统计的含义和特点
一、统计的含义:统计最基本的含义是人们对客观事物的数量表现、数量关系和数量变化进行描述和分析的一种计量活动。
在不同的场合,统计一词有统计工作、统计资料、统计科学三种含义。
二、统计的研究对象:统计的研究对象是统计工作的规律,即搜集、整理和分析统计数据的方法,是一门方法论科学。
(P11)
三、统计的特点(P4):
(1)数量性(最基本特点)(2)具体性(3)综合性(或总体性)。
2、统计学的基本概念:总体、总体单位、总体的特征,总体的分类。
标志、变异与变量,连续型变量与离散型变量联系和区别,指标与标志
一、总体:总体是在某种共性的基础上由许多个别事物结合起来的整体。
总体单位:构成总体的个别事物。
(P13)
他们不是一成不变的,在一定的条件下可以相互转化。
确定总体是为了确定调查研究的对象和范围,确定总体单位是为确定调查登记项目的承担者。
二、总体的特征(P13):
(1)同质性;(2)大量性;(3)差异性。
三、总体的分类(P13):
(1)有限总体;
(2)无限总体。
四、标志:指说明总体单位特征的名称,由标志名称+标志值构成。
标志的分类(P15):
(1)品质标志、数量标志;
(2)不变标志、可变标志(包括变异和变量)。
五、变量:变量就是可变的数量标志。
(P15)
变异:总体单位之间的这些品质和数量上的差异,即可变标志在总体各单位之间变现出来的差异。
变量和统计数据分类有对应关系。
六、连续型变量与离散型变量
数值变量可分为离散变量与连续变量。
凡是变量值只能以整数出现的变量就叫离散变量,变量值可以无限分割的变量就是连续变量。
七、指标:是说明总体数量特征的概念。
由指标名称+指标值组成。
标志和指标的区别和联系
(1)区别:
①指标说明总体的特征;而标志说明总体单位的特征
②指标只反映总体的数量特征;标志既可以反映总体单位的数量特征,也可以反映总体单位的品质特征
(2)联系:指标的数值是由总体各单位的数量标志的标志值汇总而得到的
八、指标体系
以共同的研究目的为纽带而相互联系的一系列统计指标成为指标体系。
3、补充:统计数据
统计数据是指对现象或事物进行测量的结果。
按照测量尺度的差异,可以将统计数据进行分类:分类数据,顺序数据和数值型数据。
分类数据和顺序数据说明的都是事物的品质(属性)特征,通常用文字来表述,其结果均表现为类别,可以通称为定性数据或品质数据。
数值型数据说明事物或现象的数量特征,用数值来表现,因此可称为定量数据或数量数据。
按照收集方法的不同,可以分为观测数据和实验数据。
按照时间状况的不同,可以分为截面数据和时间序列数据。
4、补充:参数与统计量、样本
参数(parameter):用来描述总体特征的概括性数字度量;例如总体平均数μ;总体标准差δ;总体比例π。
统计量(statistic):用来描述样本特征的概括性数字度量,它是样本的函数。
例如样本平均数x;样本标准差s;样本比例p。
样本(sample):从总体中抽取一部分个体的集合。
样本容量(sample size):构成样本的个体的数目,也称为样本量,通常用n表示。
第二章:统计调查
1、统计调查的含义及其在统计工作中的地位
2、统计调查的基本原则
统计调查是指根据既定目的,有组织、有计划地搜集统计资料的过程。
它是统计工作的第一阶段,基础环节。
统计调查的基本原则是真实、及时和合适。
3、统计调查的组织形式有哪些。
(红色字体)什么是随机抽样;什么是非随机抽样。
(蓝色字体)非随机抽样的类型(粉红色字体)
(普查:含义、优缺点,适用场合;
随机抽样调查:含义以及具体的抽样方法(简单随机、分层抽样、整群抽样、系统抽样、多阶段抽样)及适用场合;
非随机抽样:含义以及具体的抽样方法(重点抽样、典型抽样、任意抽样、配额抽样)及适用场合)
一、普查:是指为搜集某种社会经济现象在某时某地的情况而专门组织的一次性全面调查。
特点:涉及面广、工作量大、时间性强、耗费较多、组织工作复杂。
适用范围:限于重大全局性问题,提供基本的全面统计基础资料,如人口普查、经济普查等。
二、随机抽样调查:是指按随机原则从总体中抽取部分单位进行调查,并借以推断和认识总体的一种统计方法。
特点:最科学的非全面调查。
(1)简单随机抽样(纯随机抽样):是不对总体做任何加工整理,按照随机原则直接从总体N个单位中抽取n个单位作为样本进行调查的抽样方式。
它是最基本也是最简单的抽样组织方式,分为重复和不重复抽样两种情况。
特点:
①简单、直观,在抽样框完整时,可直接从中抽取样本
②用样本统计量对目标量进行估计比较方便
局限性
①当N很大时,不易构造抽样框
②抽出的单位很分散,给实施调查增加了困难
③没有利用其他辅助信息以提高估计的效率
(2)类型抽样(分层抽样或分类抽样):是将总体单位先按一定标志分组,然后在各组中随机抽取样本的抽样组织方式。
类型抽样是应用于总体内各单位在被研究标志上有明显差别的抽样。
主要原则是:分组时应使组内差异尽可能小,使组间差异尽可能大。
优点:
①保证样本的结构与总体的结构比较相近,从而提高估计的精度
②组织实施调查方便
③既可以对总体参数进行估计,也可以对各层的目标量进行估计
(3)等距抽样(机械抽样或系统抽样):是先将总体各单位按有关标志或无关标志进行排列,再按照固定的顺序和间隔来抽选样本单位的一种抽样组织形式。
等距抽样是不重复抽样,通常可以保证被抽取的单位在总体中均匀分布,缩小各单位之间的差异程度,提高样本的代表性。
优点:操作简便,可提高估计的精度
缺点:对估计量方差的估计比较困难
(4)整群抽样:是先将总体各单位划分成若干群,再以群为单位从中随机地抽取出若干群来,对被抽中群的所有单位进行调查的一种抽样组织形式。
特点:
①抽样时只需群的抽样框,可简化工作量
②调查的地点相对集中,节省调查费用,方便调查的实施
③它的精度比起简单随机抽样来要低一些。
(5)多级抽样(多阶段抽样):他把抽取样本单位分为n个步骤进行,即先从总体中抽取一级单位,然后再从抽中的一级单位中抽取二级单位,直到抽取最终单位。
特点:
①具有整群抽样的优点,保证样本相对集中,节约调查费用
②需要包含所有低阶段抽样单位的抽样框;同时由于实行了再抽样,使调查单位在更广泛的范围内展开
③在大规模的抽样调查中,经常被采用的方法
三、非随机抽样调查:是指调查者有意识地或随意而非随机地从总体中抽取部分单位进行调查的统计方法。
特点:一般不用于推算总体指标。
(1)重点抽样,是指只对总体中为数不多但影响颇大的重点单位进行研究的一种非全面调查。
特点:以较少的人力、物力和财力,几时地掌握总体的基本情况及其发展变化的基本趋势。
(2)典型抽样,是指根据对调查对象的初步了解,有意识地从中挑选具有代表性的单位进行研究的一种非全面调查。
要注意典型性。
作用:①“解剖麻雀”,推论一般,指导全局,促进统计研究的深化。
(3)任意抽样(方便抽样、随意抽样)是指调查者随意抽取调查单位进行调查的一种方法。
常用于市场调查和民意调查,例如柜台顾客调查、街头路边拦截访问等等。
特点:不能保证每个单位都有相同中选机会。
(与随机抽样相区分)
(4)配额抽样,是在总体作若干种分类和样本总容量既定的轻狂下,按配额从总体各部分抽取调查单位进行调查的方法。
例如:为研究暨大本科生学习状况,拟从暨大本科生中抽取500人,指定从2006级春季班中抽取30人,男生18人,女生12人;类似地,给其他各个班级指定抽选的额定人数。
此即配额抽样。
四、定期统计报表:是指按国家统一规定的指标体系、表格形式、报送程序和报送时间,定期地自下向上地向国家和上级主管部门报送统计资料的一种统计调查形式。
(与抽样无关)4、统计调查方案的内容(调查对象、调查单位和报告单位)
关于统计调查目的、对象、内容、方法、步骤、时间、经费和组织领导等的工作计划,即是统计调查方案。
它是指导统计调查工作的纲领性文件。
调查对象和调查单位对应统计调查中的总体和总体单位,调查对象是由调查单位组成的整体,调查单位是调查项目的承担者。
例如,要了解某地区国有企业工业设备的状况,那么调查对象就是“某地区国有企业工业设备”,调查单位就是该地区国有企业的每一台工业设备。
报告单位又叫填报单位,指按照要求负责填报调查结果的单位,只能是机构或者个人。
调查单位既包括机构、个人,也包括物。
二者有时重合,有时候不同。
5、调查误差:含义与分类;产生原因;防止和减少调查误差的方法
一、调查误差的含义:是指调查所得的统计数字与调查对象的实际数量之间的差异。
二、调查误差的种类:
(1)非代表性误差(工作误差):由于调查工作中的失误造成的误差。
(人为误差,理论上可以消除)
(2)代表性误差:以部分推断总体时必然存在的误差。
(无法消除,但可以进行控制和计算)随机抽样中的名称是抽样误差。
三、非代表性误差的产生原因
①调查方案规定不妥而产生的设计误差;
②调查过程记录不准转抄有误产生的登记误差;
③计量工具不准,数据折算汇总有误产生的误差;
④因(被)调查者弄虚作假造成的误差。
⑤无论全面调查还是抽样调查中都会出现,都是人为的误差,可以避免和减少。
四、防止或者减少统计误差的办法
(1)要正确周密地制定统计调查方案
(2)健全原始记录,完善统计台账
(3)加强对统计人员的培训,提高统计人员的素质
(4)要加强对统计调查资料的审核
(5)要科学地抽取样本和选择典型
(6)加强统计司法,严惩弄虚作假行为
6、调查项目和调查表
调查项目是指作为调查内容规定下来的有关调查单位的特征(标志)。
例如某位学生的性别、年龄、身高、体重、某课程分数等等;
调查表:合理有序排列调查项目的表格。
单一表,只能填写一个调查单位的调查表;一览表,可以同时填写若干调查单位的调查表。
第三章:统计整理
1、统计整理的含义以及意义,统计整理的程序和过程。
统计分组的概念、统计分组的种类
含义:根据统计研究的目的和要求,对统计所得的各项资料进行审核、科学分组和汇
总的工作过程。
整理的资料也包括历史资料。
意义:是整个统计工作的中间环节,是数据收集(统计调查)过程的继续和深化,又是统计分析的基础。
统计整理的程序:审核→分组→汇总→制表与绘图。
1.对数据进行全面审核、筛选和排序;
2.根据研究目的和要求,讲各指标进行分类分组;
3.在分类分组的基础上,进行汇总,得到各种指标;
4.编制统计表,绘制统计图,将资料简洁系统地进行展示。
一、统计整理的审核:
(1)审核资料的完整性和及时性。
(2)审核资料的准确性。
(3)历史资料的审查。
(4)资料审查后的订正。
二、统计整理的分组:
(1)统计分组:指根据社会经济现象的特点和统计研究的目的要求,按某种重要标志把总体分成若干部分的科学分类。
分组原则:组内尽量相似,组间尽量差异。
统计分组的关键:①选择分组标志;②划分各组界限。
(2)统计分组的作用:
①划分社会现象的不同类型
②揭示社会经济现象的内部结构
③分析社会现象间的依存关系
(3)统计分组的种类:
①按分组的作用或目的不同:类型分组、结构分组和分析分组。
②按分组标志的多少和分组形式:简单分组、复合分组和并列分组。
③按分组标志性质:品质分组和数量分组。
(4)统计分组的标志选择:
①分组标志:是指将总体划分为性质不同的组的标准或依据。
②分组标志选择的要求:
Ⅰ要符合统计研究的目的和要求
Ⅱ必须选择最主要的标志作为分组依据
Ⅲ要考虑社会经济现象所处的具体历史条件
三、统计整理的汇总:
(1)概念:将统计资料归并到各组中去,并计算各组和总体的合计数的工作过程。
(2)作用:将各个调查单位的情况,汇总成总体情况,使我们能看到全体,进而揭示总体在多方面的数量特征。
四、统计整理的制表:
(1)要合理安排统计表的结构。
(2)总标题应该简要反映表的基本内容,还要指出资料所属时间和地点。
(3)数据计量单位相同时,可放在表的右上角标明,不同时应放在每个指标后或单列出一列标明。
(4)表中的上下两条横线一般用粗线,其他线用细线。
(5)通常情况下,统计表的左右两边不封口。
6)表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一。
7)对于没有数字的表格单元,一般用“—”表示
8)必要时可在表的下方加上注释
2、统计分组:组数与组距、数值型数据的统计分组:等距分组与异距分组,组限与组中值计算,开口组的组距计算等
一、组数:即将总体分为几组。
(1)品质分组的组数由两个因素决定:事物本身的特点和统计研究的任务
(2)数量分组的组数由两个因素决定:
①全距=最大标志值-最小标志值
②组距=各组最大标志值(上限)-各组最小标志值(下限)=全距÷组数
二、组距:各组的最大标志值(上限)与最小标志值(下限)之差。
三、组限:是指每组两端的数值,其中每组的起点数值(最小值)称为下限,最点数值(最大值)称为上限。
四、组中值:是各组组距的中点值,代表组内各标志值的一般水平,具有平均数性质(但不是平均数)。
五、计算:【例题】
(1)重合式:指相邻两组中,前一组的上限和后一组的下限数值重合。
一般用于连续型变量。
组距=上限-下限
组中值=(上限+下限)÷2=下限+组距/2=上限-组距/2
(2)不重合式:指前一组的上限与后一组的下限,两值紧密相连而不相重复。
一般用于离散型变量。
组距=下组下限-本组下限=本组上限-前组上限
组中值=(本组下限+下一组下限) ÷2=本组下限+组距/2=下组下限-组距/2
组数、组距确定的斯特杰斯经验公式
1 3.31lg n N =+
max min
1 3.31lg
R X X
d
n N
-
==
+
其中n为组数,N为总体单位数,d为祖居,R为全距。
分组形式:
一、单项式分组:
(1)适合于离散变量
(2)将一个变量值作为一组
(3)适合于变量值变动幅度较小的情况
二、组距式分组:
1、适合于连续变量和变动幅度较大的离散变量
2、适合于变量值较多的情况
3、将变量值的一个区间作为一组必须遵循“不重不漏”的原则
4、可采用等距分组,也可采用不等距分组
①等距分组:标志变量在各组保持相等组距。
在分组标志变化比较均匀的情况下适合用等距分组。
②不等距分组:标志变量在各组中的组距不相同。
标志值急剧增长或下降时适合用不等距分组。
3、统计表的含义、结构及其种类
统计表,是指集中而有序地显示统计资料的表格。
它是表现统计数据和累计统计资料的基本手段。
统计表的结构由表头(表号、总标题和表中单位),行标题,列标题,数字资料和表外附加5个部分构成。
统计表按照用途的不同可以分为调查表、汇总表和分析表。
按照主词的分组情况不同可以分为简单表,分组表和复合表。
4. 统计图的含义及其类型
统计图是具体展示统计资料的图形。
它主要分为两大类:分布图和形象图。
一、分布图
分布图展现了统计资料的次数分布和类型特征。
常见的分布图有直方图、折线图、曲线图和累计曲线图。
二、形象图
形象图主要展现统计资料描述的数量、速度和结构特征。
常见的图有物形图、饼形图、柱形图和标示图。
三、数据类型划分
(1) 分类数据
分类数据可以用比例,比率,百分比等统计量描述,他们适用的统计图有条形图,柱形图,帕累托图和饼图。
(2) 顺序数据
顺序数据还可以使用累计频数和累计频率图、环形图。
(3) 数值型数据
数值数据还可以使用直方图、折线图等方式。
【例题】
5、分布数列及其种类;
一、分布数列(次数分布或次数分配):指反映总体单位在各组分布状况的一系列数字。
分布数列组成要素:(1)组的名称;(2)各组次数(频数)或频率
二、分布数列的种类:
(1)按分组标志的不同:
①品质数列,是指按品质标志分组所形成的分布数列,它由各组名称和各组单位数构成。
②变量数列,是指按数量标志分组所形成的分布数列,由变量和次数两个要素组成。
(2)按分组形式不同:
①单项式数列,是指各组都由一个具体的变量值(单项)来表示的数列。
②组距式数列,是指各组都由两个变量值界定的变量区间(组距)来表示数列,又分为等距数列和不等距数列。
(3)按次数分布的特征不同:
①钟形分布数列,数列中愈靠近变量值中点分布次数愈多,愈远离变量值中点分布次数愈少。
又分为对称分布、右偏分布(图1)和左偏分布(图2)。
口诀:右偏左倚,左偏右倚。
②J形分布数列。
(图3是正J型,图4是负J型)
③U形分布数列(图5)。
第四章:总量指标和相对指标 1、总量指标的含义。
总量指标的分类:总体总量与标志总量;时期指标与时点指标。
;
一、总量指标(绝对指标):是反映社会经济现象在一定时间、地点条件下所达到的总规模、总水平或工作总量的综合指标。
、
二、总量指标的种类:
(1)按其反映总体内容不同:
总体总量,即总体单位数,是由每个总体单位加总而得到的。
标志总量,是指总体各单位某一数量标志的总和。
(2)按其反映时间状态的不同:
时期指标(时期数),是指反映社会经济现象在一段时间内所达到的总规模、总水平或工作总量。
时点指标(时点数),是指反映社会经济现象在某一时点(时刻)所达到的数量状态。
(3)按采用的计量单位不同:
实物指标,是指以实物单位计量的总量指标,即以事物的物理属性或自然属性作为计量单位的指标。
价值指标,是指以货币为计量单位的总量指标。
劳动量指标,是指以劳动量单位计量的总量指标。
补充:时期指标与时点指标的比较:
时期指标的特点
(1)时期指标数值连续统计
(2)不同时期的时期指标数值可以累计相加
(3)时期指标数值大小与统计期限长短有关
时点指标的特点
1) 时点指标的数值间断统计
2) 不同时期的时点的指标数值不能累计相加
3) 时点指标的数值大小与其时间间隔长短无直接相关
2、相对指标的概念;相对指标的表现形式;相对指标的种类及各自最基本的计算公式;
一、相对指标:两个有联系的统计指标进行对比的比值,用以反映现象的发展程度、结构、强度、普遍程度或比例关系。
表现形式:单名数和复名数
无名数:如成数、比例、倍数、百分数、千分数。
没有计量单位。
有名数:如密度、强度等复合单位的相对数(克/立方米、元/人)。
二、相对指标的种类:
(1)计划完成相对数:现象在某一段时间内的实际完成数与计划完成数之比。
作用:考核、反映计划完成的程度(进度)。
100%=⨯实际完成数计划完成相对数计划完成数
产量、产值增长百分数:计划完成相对数=(100%+实际增长%)/(100%+计划增长%)×100% 产品成本降低百分数:计划完成相对数=(100%-实际降低%)/(100%-计划规定降低%)×100%
(2)结构相对数:总体中某部分数值与该总体数值对比的比值。
100%=⨯总体某部分数值结构相对数总体数值
作用:反映总体内部构成情况的综合指标。
分子分母不能互换!
特点:①必须与统计分组相结合;
②分子的数值是分母数值的一部分;
③总体中各部分比重之和等于1或100%;
④表现形式为无名数(百分数、千分数或 成数)。
(3)比例相对数:同一总体内某一部分数值与另一部分数值对比的比值。
100%=⨯总体中某一部分数值比例相对数同一总体另一部分数值
作用:反映总体各部分间的内在联系与比例关系。
(同一总体不同部分比较)
特点:①对比的分子分母属于同一总体;
②分子分母可以互换(与结构相对数的区别);
③比例相对数的数值,一般用百分数或几比几的形式表示。
(4)比较相对数:同一时间的同类指标在不同空间对比的比值。
100%=⨯甲地区某指标数值比较相对数乙地区同一指标数值
作用:反映同类现象在不同空间的数量差异或不平衡程度,发现先进与后进。
特点:①分子分母的数值分别属于不同的总体;
②分子分母是同类指标;
③分子分母可以互换。
(5)动态相对数:某一社会经济现象在不同时期两个数值对比的比率,又称发展速度或指数。
100%=⨯报告期数值动态相对数基期数值
作用:反映事物发展变化的方向与程度。
其中:报告期又称计算期,是研究或计算时期。
基期是作为比较基础的时期。
6)强度相对指标:两个性质不同但有一定联系的总量指标之间的对比。
100%=⨯某一指标数值强度相对数另一有联系的指标数值
作用:① 反映事物存在的密度、普遍程度、运动强度、负担强度 ;
② 反映经济效益的高低。
特点:①强度相对数一般采用有名数(复名数)为计量单位,即由分子分母原有的计量单位构成。
②有的强度相对指标分子分母可以互换,有正指标和逆指标,正指标的比值的大小与其反映的强度、密度和普遍程度成正比,而逆指标正好相反。
第五章:平均指标
1、平均指标意义与特点、平均指标概念和作用、平均指标的种类
一、平均指标:同质总体某一标志在一定时间、地点、条件下所达到的一般水平,是总体的代表值,它描述分布数列的集中趋势。
特点:同质性、代表性和抽象性。
作用:①可以比较同类现象在不同单位、不同地区间的平均水平;
②可以比较同类现象在不同时期的平均水平;
③可用于研究事物之间的依存关系;
④利用平均数还可以进行推算和预测。
二、平均指标的种类:
(1)数值平均数:算术平均数、调和平均数和几何平均数。
(2)位置平均数:众数和中位数。
2、算术平均数、基本计算公式、简单算术平均数的计算、加权算术平均数的计算、根据单项数列计算、根据组距数列计算
一、算术平均数:算术平均数=同一总体的标志总量/同一总体的总体总量
(1)简单算术平均数:121...X =n
i n i X X X X n
n =+++=∑ (2)加权算术平均数:112212...X =...n n n Xf X f X f f X f f f f
+++=+++∑∑ (3)交替标志平均数:以1作为具有某种属性的单位标志值,以0作为不具有某种属性的单位标志值。
利用加权算术平均数可得。
算术平均数的数学性质
(1)算术平均数与总体单位数的乘积,等于各单位标志值的总和。
(2)各单位标志值与算术平均数离差之和等于0。
(3)各单位标志值与算术平均数离差平方之和为最小。
(4)对各单位标志值加或减一个任意数a ,则算术平均数也要增加或者减少该数a 。
(5)对各单位标志值乘以或除以一个任意数b ,则算术平均数也要乘以或除以该数b 。
3、调和平均数、加权调和平均数的计算;几何平均数、简单几何平均数的计算、加权几何平均数的计算
一、调和平均数(倒数平均数)
(1)简单调和平均数:是标志值倒数的算数平均数的倒数。
11211111)/n i n n i x x x x x n ===+++++∑
(2)加权调和平均数:是指各单位标志值倒数的加权算术平均数的倒数。
12112112.......k i k i x k k i i k
i m m m m H m m m m x x x x ==+++==+++∑∑。