统计学原理复习提纲

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

统计学原理复习提纲
(复习总要求:结合每章节后客观题和作为作业布置的计算题)
第一章绪论
主要内容:
1 、统计的三个含义及其之间的关系。

P5
三个含义:统计工作(活动)、统计资料、统计学
三者关系:统计工作(活动),即统计实践活动,是基础;
统计工作的成果是统计资料,统计资料是统计实践活动的产物。

统计学是统计实践经验的理论概括和科学总结,它来源于统计实践,又高于统计
实践,反过来指导统计实践。

2、统计学研究的对象:大量社会经济现象总体的数量方面(数量特征和数量关系)
统计学的特点:1、数量性2、总体性3、具体性4、社会性
3、统计的作用(功能):1、信息功能2、咨询功能3、监督功能
4、统计研究的理论基础、基本方法与工作过程.
统计研究的理论基础:哲学唯物辩证法、社会经济学、数学
统计研究的基本方法:大量观察法、分组法、综合指标法、归纳判断法及其他相关的方法
统计工作过程P10—11: (统计任务、统计设计)统计调查、统计整理、统计分析 (统计信息
管理),三个阶段并非孤立的、而是密切联系的一个整体,其中各
环节往往是交叉进行的。

重点掌握内容: (能联系实际进行判断)
5、统计学的几个基本概念:P11—16
(1)总体与总体单位.统计总体是根据一定目的确定的所要研究事物的全体,它是客观存在,
并在某一相同性质基础上结合起来的许多个别单位的整体。

简称总体.
总体特点:同质性、大量性、变异性(或者差异性)
构成总体的这些个别单位称为总体单位。

总体可分为有限总体/无限总体
总体与总体单位具有相对性,随着研究任务的改变而改变
(2)标志与指标。

标志是说明总体单位特征的名称.分为品质标志、数量标志。

指标(统计指标)是说明现象总体量的特征的概念。

特点:数量性、综合性、具体性。

数量指标反映现象发展的总规模、总水平—总量指标
质量指标反映现象发展的相对水平、工作质量—相对指标、平均指标
指标和标志既有区别又有联系,两者的区别是:第一,指标是说明总体特征的,而标志是说
明总体单位特征的;第二,指标都是可量的,而标志不一定是可量的。

标志则有两种,一种是
数量标志,另一种是品质标志,其表现是概念或者文字说明. 两者的联系是:第一,统计指标
的数值来源于标志,没有标志就没有指标;第二,指标与标志如同总体与总体单位一样可
以相互转化.
(3)变异、变量和变量值。

变异:普通意义上为可变标志在总体各单位具体表现上的差别.
包括质 (性质、属性)的变异和量(数值)的变异。

严格上仅指品质标志的不同具体表现。

第二章
变量:可变的数量标志。

变量值:变量的数值表现。

按变量值是否连续可分为连续变量和离散变量.
统计调查
统计调查
主要内容:
1 、统计调查的概念、重要性、两个基本要求。

P19-20
统计调查是按照统计任务的要求,运用科学的调查方法,有组织地向社会实际搜集各项原始资料的过程。

统计调查重要性:认识社会的基本方式、是统计工作中的基础环节、统计调查理论和方法在统计学原理中占有重要地位。

统计调查两个基本要求:准确性、及时性
2 、统计调查方案设计:六项基本内容P21—29
(1)确定调查目的
(2)确定调查对象和调查单位
调查对象:需要进行研究的总体。

调查单位:所要研究的总体单位,即所要登记的标志的承担者。

填报单位:负责上报调查资料的单位。

(联系实际注意三者的区别)
(3)确定调查项目
调查表:一览表、单一表
调查问卷:结构(封面信、指导语、问题与答案—主体、编码等)
(4)确定调查时间和调查期限 (注意二者区别)
调查时间:调查资料所属时期或者时点
调查期限:调查工作开展的起止时间
(5) 选择调查方法
(6)调查工作的组织实施计划
3、统计调查的组织形式P30—36
按调查对象范围不同,分为全面调查和非全面调查
按组织形式,分为统计报表制度和专门调查
按登记事物的连续性分类,分为时常调查和一次性调查
重点掌握以下具体调查方法: (选取调查单位的方法不同)
(注意其区别,联系实际进行方法选择)
普查:专门组织的一次性的全面调查。

人口普查经济普查
统计报表制度:按照国家或者上级部门统一规定的表式、统一的指标项目、统一的报送程序和报送时间, 自上而下逐级提供基本统计资料的一种调查方式。

抽样调查:按照随机原则从总体中抽取一部份单位进行观察,并运用数理统计的原理,以被抽取的那部份单位的数量特征为代表,对总体作出数量上的判断分析.为非全面调查。

其特点见“第五章抽样判断”,共4 点
重点调查:在调查总体中选择部份重点调查单位搜集统计资料的非全面调查。

重点单位指这些单位在全部总体中虽然数目不多,所占比重不大,但就调查的标志值来说却在总量中占很大的比重。

典型调查:在调查对象中故意识地选取若干具有典型意义的或者有代表性的单位进行非全面调查。

各种调查组织形式不是彻底孤立的,是互为补充、相互交叉使用的.
第三章统计整理
主要内容P37—45
1 、统计分组概念:根据统计研究的需要,将统计总体按照一定的标志区分为若干个类型组的
一种统计方法。

统计分组目的:实现组内同质性、组间差异性
统计分组种类:
(1)按任务和作用不同分为类型分组、结构分组、分析分组
①划分社会经济现象的类型类型分组
②揭示现象总体内部的构成情况结构分组
③分析现象间的相互依存关系分析分组
类型分组与结构分组较难界定,三者之间不是彼此孤立的,而是相辅相成、相互补充的。

(2)按分组标志的性质分为:品质分组
变量分组(单项式分组、组距式分组—等距分组/异距分
组开口组/闭口组)
(离散型变量、连续型变量对应的分组)
(3)按分组标志的多少分为简单分组、复合分组、分组体系
以上第二类按分组标志性质分组能根据实际进行判断
(统计分组的关键:分组标志选择、组距和组数、正确划分各组界限,
其中最关键:分组标志选择)
分组标志的选择:
注意三点:
(1)根据研究问题的目的来选择
(2)要选择最能反映被研究现象本质特征的标志作为分组标志
(3)要结合现象所处的具体历史条件或者经济条件来选
择遵循原则:穷尽性互斥性
2、分配数列P46-57
概念:在统计分组的基础上,将总体的所有单位按组归类整理,并按一定顺序罗列,形成总体中各个单位在各组间的分布。

分配数列编制、频率计算、直方图绘制、组中值计算 (重点掌握)
其中关键点:(1)连续变量分组,“上限不在内原则,如50~60,60~70,则60 为60~70 组)
(2)分配数列中,各组频率之和=1
(3)累计(次数) 频率分布:它表明总体在某一标志值的某一水平上下总共
包含的次数和频率
向上累计(以下累计、较小制累计):上限以下的单位数 (比重)
向下累计(以上累计、较大制累计):下限以上的单位数 (比重)
(4)组中值计算:
3、统计表P57-62
(1)概念:把统计调查得来的数字资料,经过汇总整理后,得出一些系统化的统计资料,将其按一定顺序填列在一定的表格内,这个表格就是统计表。

注:统计表既是调查整理的工具,又是分析研究的工具.广义的统计表贯通在统计工作的各个阶段中。

(2)统计表结构:总标题、分标题(横行标题、纵栏标题)、纵横栏组成的本身及表中的数字
(3)统计表种类:(从主词上分类) 根据分组情况的不同,分简单表、分组表、复合表
(4) 宾词指标的设计:简单设计(平等配置一一罗列);复合设计(层叠配置分层罗列)
第四章综合指标
1、总量指标
总量指标是反映现象总体规模或者水平的统计指标。

是计算相对指标、平均指标及各种分析指
标的基础指标。

分类:按说明总体内容不同,分总体单位总量和总体标志总量
按反映的时间状况不同,分为时期指标和时点指标
按其采用的计量单位不同,分为实物指标、价值指标和劳动指标
(能根据实例判断总量指标类型,特殊是时期指标和时点指标):如人口数、商品库存额、国
内生产总值、商品销售额等)
2、相对指标(6 类) (能联系实际进行判断)
结构相对指标定义、计算公式、作用P78 总体部份数值/总体全部数值×100%
比例相对指标定义、计算公式、作用P79 总体中某部份数值/总体中另一部份数值
比较相对指标定义、计算公式、作用P80
某条件下的某类指标数值/另一条件下的同类指标数值×100%
强度相对指标定义、计算公式、作用P81
某一总量指标数值/另一有联系而性质不同的总量指标数值
动态相对指标定义、计算公式、作用P82 报告期水平/基期水平×100% (注意:强度相对指标与平均指标的区别)
计划完成程度相对指标定义、计算公式、P75 实际完成数/计划数×100% 根据数量指标计算;根据相对指标计算(本年计划数比上年实际数提高或者降低多少);
根据平均指标计算P74 例子
(了解)计划完成程度相对指标用来进行计划执行进度的考核;长期计划检查(水平法、累
计法)
3、平均指标
定义:P85 说明同质总体内某一数量标志在一定条件下普通水平的综合指标。

特点:P85 (1) 将数量标志抽象化
(2) 只能就同类现象计算
(3)能反映总体变量值的集中趋势
作用:P85—86
计算:(1)算术平均数简单算术平均数P87 、加权算术平均数P89
(2) 调和平均数简单调和平均数P93 、加权调和平均数P93
(3) 几何平均数简单几何平均数P96 、加权几何平均数P98
(4) 众数P100(只掌握单项数列):浮现次数最多的标志值
(5)中位数P103—104 (只掌握未分组资料、单项数列):各单位标志值按大小顺序
罗列,居于中间位置的标志值
奇数项:
偶数项:
(重点掌握以上平均指标的定义、计算公式及应用P87-106)
平均数、中位数、众数关系:对称分布
左偏分布:
右偏分布:
4 、变异指标(标志变动度)
概念:是指总体中各单位标志值差别大小的程度,又称离散程度或者离中程度。

作用:(1)反映各单位标志值分布的离中趋势
(2)说明平均指标对总体的代表性程度
(3)说明现象变动的均匀性或者稳定性程度
(1)全距:P112
(2)四分位差:P113
(3)平均差:P115 概念、计算公式
(4) (重点掌握) P117 标准差:是测度数据离散程度最重要和最常用的指标.是各单位标志值与其算术平均数的离差平方的算术平均数的平方根,又称“均方差”。

计算公式: 简化公式:
(5) P121 离散系数:又称标志变动系数,反映总体各单位标志值的相对离散程度.
常用标准差与算术平均数对照的离散系数(标准差系数)
标准差系数的计算公式、代表意义
(结合作业、书P126 三计算题:第3、4、5、10、11 题(判断计算) , 第8、13 题(计算大题))
第五章抽样调查(抽样判断)
1、抽样调查概念、特点、作用P241—244
概念:按照随机原则从总体中抽取一部份单位进行观察,并运用数理统计的原理, 以被抽取的那部份单位的数量特征为代表,对总体作出数量上的判断分析。

特点: (1)只抽取总体中的一部份进行调查
(2)用一部份单位的指标数值去判断总体的指标数值
(3)抽选部份单位时要遵循随机原则
(4)抽样误差可以事先计算并控制
2、抽样调查的几个基本概念P244-247
(1)全及总体(总体) 抽样总体(样本)
(2)指标(含义、计算公式)
平均数成数方差标准差
全及指标(参数):
抽样指标(统计量) :
(全及总体惟一确定,其统计指标也是惟一确定的;样本是不确定的,其统计指标也是不确定的;)
(3)重复抽样和不重复抽样
(4)样本容量和样本个数(样本可能数目)
3、抽样误差
抽样误差(随机误差)概念:指由于抽样的随机性而产生的那一部份代表性误差,不包括登记误差,也不包括可能发生的偏差。

误差分类:(1) 登记性误差
(2)代表性误差:偏差
随机误差(实际误差、抽样平均误差)
4、抽样平均误差概念、影响其大小的因素、意义、计算公式P253-255:
概念:抽样平均误差是指所有可能浮现的样本指标的标准差,也可以说是所有可能浮现的样本指标和总体指标的平均离差。

影响其大小的因素:总体各单位标志值的变异程度、样本容量、抽样方法、抽样组织方式抽样平均误差计算公式: (常用公式,结合实际作判断)
平均数的抽样平均误差计算公式:重复抽样情况下:
不重复抽样情况下:
成数的抽样平均误差计算公式:重复抽样情况下:
不重复抽样情况下:
5、抽样极限误差(置信区间)
概念:根据概率理论,以一定的可靠程度保证抽样误差不超过某一给定的范围。

(在进行抽样估计时,应该根据所研究对象的变异程度和分析任务的要求确定可允许的误差范围,在这个范围内的数字都算是有效的.它等于样本指标中允许变动的上限或者下限与总体指标之差的绝对
值。

)
6、抽样误差的概率度(可信程度、置信度)
基于概率估计的要求,抽样极限误差通常需要以抽样平均误差为标准单位来衡量。

概率度t 即为抽样极限误差与抽样平均误差之比的倍数。

数理统计证明:概率是概率度的函数P=F(t) (正态分布曲线正态分布概率表)
7、抽样判断P264 —266
抽样判断概念:指按已经抽定的的样本指标(样本平均数或者样本成数) 来估计总体指标 (总体平均数或者总体成数),或者其所在的区间范围.
优良估计的三个要求:无偏性、一致性、有效性
抽样判断方法:点估计区间估计(计算)
点估计:直接换算法修正分数法
区间估计:(1)根据给定的置信度要求推算抽样极限误差的可能范围
(2)根据给定的抽样误差范围,求概率保证程度.
(重在计算)
8 、必要抽样单位数的确定-意义、原则、计算P300—304
计算(只针对简单随机抽样):
简单随机重复抽样平均指标:
简单随机重复抽样成数指标:
简单随机不重复抽样平均指标:
简单随机不重复抽样成数指标:
(7 、8 部份计算结合作业书P322—323 第1、2、4 题计算)
第六章相关分析
1 、相关关系与函数关系,二者概念、区别与联系P333-334 (联系实际进行判断)
2 、相关关系的种类:P334—335
从涉及因素多少划分:单相关 (两个变量的相关关系)、复相关
从表现形态来划分:直线相关、曲线相关
从相关变化的方向来划分:正相关、负相关
从相关的程度来划分:彻底相关、不彻底相关和无相关
3 、相关分析的主要内容:P336—337
(1)确定现象之间有无关系,以及相关关系的表现形式
先作定性分析(相关分析的基础)
(2)确定相关关系的密切程度--相关分析
根据自变量、因变量数据资料编制成扩散图或者相关表,计算相关系数 (3)选择合适的数学模型-—回归分析
确定了现象间确实有相关关系和密切程度后,就要选择合适的数学模型,对变量之间的联系赋予近似描述
(4)测定变量估计值的可靠程度
运用配合的模型测定因变量的估计值,将估计值与实际值对照,如果差别小,说明估计得准确,反之,则不够准确。

可靠程度用估计标准误差来衡量。

(5)对计算出的相关系数,进行显著检验。

4、简单线性相关分析:(相关系数的计算)
相关系数:反映两个变量线性相关密切程度的指标。

它是由x 与y 之间协方差同x 、y 各自标准差之比来确定的。

相关系数计算公式:P341—343 (根据已有的资料选用适当的计算公式)
(重点掌握总量公式)
相关系数密切程度的判定:P343 (结合实例判断)
-1≤r≤1 (正号表示正相关、负号表示负相关;越接近1 表示相关关系越强、越接近0 表示相关关系越弱。

)
0.3 以下为无相关;0 。

3~0 。

5 是低度相关;0 。

5~0.8 是显著相关;0.8 以上是高度相关
相关系数的显著性检验(了解):P345—346
(1) T 检验—设假设、确定并根据样本资料计算检验统计量临界值、查检验统计量临界值表确定临界值,二者对照做出结论。

(2) R 检验:直接查“相关系数临界值表,比较确定。

5、简单直线回归分析:
回归分析就是对具有相关关系的变量之间数量变化的普通关系进行测定,确定一个相关的数学表达式,以便于进行估计或者预测的统计方法.
回归分析种类:自变量个数—一元、多元回归;回归形式:线性回归、非线性回归
以简单直线回归 (一元线性回归) 为例来介绍其原理和计算。

(1)确定自变量、因变量
(2)简单直线回归数学表达式普通形式
(3)如何确定参数a、b
(4) 最小平方法应用(即,∑ (y—y c)=0;∑ (y—y c ) ^2=min )
推导出参数b 、a 的计算公式:P348-349
回归系数b 的含义:X 每变动一个单位,Y 的平均变动值。

反映变量间的数量变动关系。

对回归模型的评价:
(1)判定系数:测定回归直线拟合优度的一个重要指351—352
(在简单直线回归模型中,判定系数即为单相关系数的平方. )
(2) 回归估计标准误差:因变量的各个观察值与拟合值的平均离差,判断回归方程代表
性的大小。

(1)根据因变量实际值和估计值的离差计算P353
(2)根据a、b 参数值计算P354
(3)线性回归方程的显著性检验(即回归系数 b 是否显著)(了解P355)
因变量的估计、预测:
回归系数b 与相关系数r 之间的关系:
相关分析与回归分析的比较:
联系:相关分析依靠回归分析表明现象间数量关系的具体形式;回归分析要以相关分析为基础。

区别: (1)分析内容不同:相关分析只研究变量间相关的方向和程度;回归分析研究变
量间相关的具体形式
(2) 变量的地位不同:相关分析不必确定因变量和自变量,所有变量都可以是随
机变量,改变变量的位置不影响相关分析的结果;回归分析必须先确定因
变量与自变量, 普通惟独因变量是随机变量,自变量是非随机变量,
交换变量的位置, 回归方程不同,只能根据自变量推算因变量。

(重点掌握:结合书P368 计算题4、8 题计算相关系数、进行回归分析等)
第七章动态数列
1、动态分析法概念:P130
2、动态数列的概念、作用和种类:P130
概念:将某种现象在时间上变化发展的一系列同类的统计指标,按时间先后顺序罗列。

动态数列由两个基本要素构成:一是资料所属时间、另一个是各时间上的统计指标数值.
作用:三个方面
种类:按统计指标性质不同,分为绝对数动态数列、相对数动态数列、平均数动态数列,其中绝对数动态数列是基本(基础)数列,其他数列由绝对数动态数列派生而来。

按指标所反映的社会经济现象所属的时间不同,绝对数动态数列分为时期数列和
时点数列。

时期数列与时点数列的区别:
时期数列:在绝对数动态数列中,各项指标值反映现象在一段时期内发展过程的总
量。

特点:时期数列—时期指标-相加性、累加性-指标数值大小与时期长短有关-数值
通过连续不断的登记而取得
时点数列:在绝对数动态数列中,各项指标值反映现象在某一时点(瞬间)所处的数
量水平.
特点:时点数列—时点指标-不具相加性、累加性—指标数值大小与时期长短无直
接相关-通过间断登记取得
3 、编制动态数列的原则:可比性P133-13
4 四点原则
(1)指标时间统一 (2) 总体范围统一 (3) 经济内容统一(4)计算口径统一
4、动态数列水平分析指标:P134—145
发展水平:就是在动态数列中,各项具体的指标数值。

可以是总量指标、相对指标、平均指标。

根据位置不同:分为最初水平、最末水平、中间各项水平、基期水平、
报告期水平
平均发展水平:就是将不同时期的发展水平加以平均而得的平均数叫平均发展水平,又称为序时平均数或者动态平均数.
与普通平均数的联系和区别:P135
各种动态数列平均发展水平的计算公式:
绝对数动态数列:时期数列:
时点数列:连续时点: {连续变动时点:
非连续变动时点: (时间间隔为权数)
间断时点:间隔相等(首尾折半法) P138
间隔不等(首尾折半法加权数) P139 增长量:P144 报告期水平—基期水平
平均增长量:逐期增长量之和/逐期增长量个数或者累计增长量/(动态数列项数-1)
年距增长量:(年距增减水平) 报告期发展水平—上年同期发展水平
5、动态数列速度分析指标:P146-153
发展速度:报告期水平/基期水平(又称总速度)分为:定基、环比发展速度
(二者关系:定基发展速度=环比发展速度的连乘积;
两个相邻时期的定基发展速度之比,等于它们的环比发展速度) 增长速度:增长量/基期发展水平另:增长速度=发展速度-1 (定基、环比增长速度) 年距发展速度:报告期水平/上年同期发展水平
平均发展速度:是各期环比发展速度的序时平均数。

两种计算方法,运用于不同情况。

水平法制定长期计划,则为几何平均法
(不要求)长期计划,则为方程法结合平均增长速度查对表计算
具体见P149- 151
平均增长速度:平均发展速度-1
5 、动态数列变动趋势和季节变动分析: (不要求)
长期趋势测定方法:间隔扩大法、挪移平均法、最小平方法(满足条件: ) (重点掌握最小平方法运用于直线方程的计算。

P160- 163 例题)
趋势线拟合为直线方程,则现象发展的逐期增长量大体相等;
趋势线拟合为抛物线方程,则现象发展的逐期增长量的增长量大体相等;
趋势线拟合为指数曲线方程,则现象发展的环比发展速度或者环比增长速度大体相等。

季节变动分析:挪移平均法、挪移平均趋势剔除法(计算季节比率季资料时季节比率之和为400%;月资料时1200%)
(重点掌握:结合书P179 计算题4、5 题计算)
第八章统计指数
1 、统计指数的概念、作用、种类P185-189
概念:仅反映复杂现象总体数量变动或者差异程度的相对数
种类:按不同标准分类:按说明现象的范围不同-—总指数、个体指数
按指数化指标的性质不同--数量指标指数、质量指标指数
按指数的表现形式不同——综合指数、平均指标指数
按指数数列中基期的不同--定基指数、环比指数
按时间是否变化-—静态指数、动态指数
按说明因素的多少—-两因素指数、多因素指数
(注:结合实际判断)
2 、统计指数的编制方法(同度量因素):
同度量因素的概念和作用:
概念:同度量因素,使得不同度量单位的现象总体转化为数量上可以加总的现象总体,并客观上体现为其在实际经济现象或者过程中的份额或者比重.
作用:同度量作用、权数作用
同度量因素选择的普通原则是:
编制质量指标总指数时, 以数量指标为同度量因素并固定在报告期。

编制数量指标总指数时,以质量指标为同度量因素并固定在基期。

(注:结合实际判断。

如:商品零售价格指数、工业产品产量指数)
总指数的编制方法:
(1) 综合指数:
数量指标综合指数编制:公式:
质量指标综合指数编制:公式:
(2)平均指标指数:P200-202——从个体指数出发来编制总指数
算术平均数指数公式:。

相关文档
最新文档