统计学复习提纲
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学原理复习提纲
(结合书后客观题和作业计算题)
第一章绪论
主要内容:
1、统计的三个含义及其之间的关系。
P5
三个含义:统计工作(活动)、统计资料、统计学
三者关系:统计工作(活动),即统计实践活动,是基础;
统计工作的成果是统计资料,统计资料是统计实践活动的产物。
统计学是统计实践经验的理论概括和科学总结,它来源于统计实践,又高于统计实践,反过来指导统计实践。
2、统计学的特点:1、数量性2、总体性
3、具体性
4、社会性
3、统计的作用(功能):1、信息功能2、咨询功能3、监督功能
4、统计研究的理论基础、基本方法与工作过程。
统计研究的理论基础:哲学唯物辩证法、社会经济学、数学
统计研究的基本方法:大量观察法、分组法、综合指标法、时间数列分析法、指数分析法、相关分析法、归纳推断法及其他相关的方法。
统计工作过程P10-11:(统计任务、统计设计)统计调查、统计整理、统计分析(统计信息
管理),三个阶段并不是孤立的、而是紧密联系的一个整体,其中各
环节常常是交叉进行的。
5、我国的统计任务和组织。
我国《统计法》规定:“统计的基本任务是对国民经济和社会发展情况进行统计调查、统计
分析,提供统计资料和统计咨询意见,实行统计监督。
”
“国家建立统一的统计系统,实行统一领导、分级负责的统计管理体制。
”重点掌握内容:(能联系实际进行判断)
6、统计学的几个基本概念:P11-15
总体与总体单位。
统计总体是根据一定目的确定的所要研究事物的全体,它是客观存在,并
在某一相同性质基础上结合起来的许多个别单位的整体。
简称总体。
总体特点:同质性、大量性、变异性(或差异性)
构成总体的这些个别单位称为总体单位。
总体可分为有限总体/无限总体
总体与总体单位具有相对性,随着研究任务的改变而改变
标志与指标。
标志是说明总体单位特征的名称。
分为品质标志、数量标志。
指标(统计指标)是说明总体综合数量特征的概念。
其特点:数量性、综合性、具体性。
标志与指标关系:区别4点、联系2点P12-13
(二者之间可变换P13 工资总额)(但品质标志不能直接转为指标,只有其变异最后表现为综合性的数量时,才构成统计研究的对象)
变异、变量和变量值(标志值)。
变异:可变标志在总体各单位具体表现上的差别。
包括质(性质、属性)的变异和量(数值)的变异
变量:可变的数量标志。
变量值(标志值):变量的数值表现。
按变量值是否连续可分为连续变量和离散变量。
第三章 综合指标
(各种指标分类能联系实际进行判断)
综合指标分类:
按反映总体内容的不同分为数量指标和质量指标P 14例子
数量指标反映现象发展的总规模、总水平—总量指标
质量指标反映现象发展的相对水平、工作质量—相对指标、平均指标 按其作用和表现形式不同分为总量指标(绝对数)、相对指标(相对数)、平均指标(平均数)
1、总量指标
总量指标是反映现象总体规模或水平的统计指标。
是计算相对指标、平均指标及各种分析指
标的基础指标。
分类:按说明总体内容不同,分总体单位总量和总体标志总量
按反映的时间状况不同,分为时期指标和时点指标
按其采用的计量单位不同,分为实物指标、价值指标和劳动指标
2、相对指标(6类)
结构相对指标 定义、计算公式、作用 P79 总体部分数值/总体全部数值×100% 比例相对指标 定义、计算公式、作用P80 总体中某部分数值/总体中另一部分数值 比较相对指标 定义、计算公式、作用P81
某条件下的某类指标数值/另一条件下的同类指标数值×100%
强度相对指标 定义、计算公式、作用P82
某一总量指标数值/另一有联系而性质不同的总量指标数值
动态相对指标 定义、计算公式、作用P83 报告期水平/基期水平×100%
计划完成程度相对指标 定义、计算公式、P74 实际完成数/计划数×100%
分别根据总量指标计算;根据相对指标计算(本年计划数比上年实际数提高或降低多少);根据平均指标计算 P75例子
计划完成程度相对指标用来进行计划执行进度的考核、长期计划检查(水平法、累计法) (注意:强度相对指标与平均指标的区别)
3、平均指标
定义:P85 特点:P85 作用:P85-86
计算:(1)算术平均数X = 总体单位总量
总体标志总量 简单算术平均数P88、加权算术平均数P90 (2)调和平均数h X =
变量值倒数和总体单位总量 简单调和平均数P94、加权调和平均数P94 (3)几何平均数 简单几何平均数P97、加权几何平均数P99
(实际应用P 100 结合动态数列平均发展速度、流水线产品平均合格率)
(4)众数P100(单项数列)
(5)中位数P103-105(未分组资料、单项数列)
(熟练掌握以上平均指标的定义、计算公式及应用 P87-106)
算术平均数、众数、中位数关系(对同一总体,由其分布特征决定:(P108-109)
(结合实际判断)
对称分布 e o M M X == 右偏分布X M M e o 〈〈 左偏分布o e M M X 〈〈
4、 变异指标(标志变动度)(重点掌握标准差、标准差系数,会计算、会判断)
全距:P113
四分位差:P114
平均差:P116 概念、计算公式
标准差:是测度数据离散程度最重要和最常用的指标。
是各单位标志值与其算术平均数的离差平方的算术平均数的平方根,又称“均方差”。
反映总体单位标志值的离散程度,反映总体分布的离中趋势 P118-121
计算公式:n X X ∑-=
2)(σ(未分组资料) ∑∑-=f f X X 2)(σ (分组资料) 简化公式:22)(X n X -=
∑σ(未分组资料)22)(X f f X -=∑∑σ(分组资料) (方差2σ)
离散系数:又称标志变动系数,反映总体各单位标志值的相对离散程度。
常用标准差与算术平均数对比的离散系数(标准差系数)P122-123
标准差系数的计算公式: %100⨯=X V σ
σ
标准差系数的代表意义和应用:测定平均数的代表,比较同类事物发展的均衡性,
检查生产过程的稳定性、消除不同变量数列水平差异的影响。
(联系实际计算、判断)
(算术平均数与标准差计算要结合抽样推断、相关分析进行)
第四章 动态数列(时间数列)
1、动态分析法概念:P132
2、动态数列的概念、作用和种类:P130
概念:将某种现象在时间上变化发展的一系列同类的统计指标,按时间先后顺序排列。
由两个基本要素构成:一是资料所属时间、另一个是各时间上的统计指标数值。
作用:三个方面
种类:按统计指标性质不同:分为绝对数动态数列、相对数动态数列、平均数动态数列,其
中绝对数动态数列是基本(基础)数列,其他数列由绝对数动态数列派生而来。
按指标所反映的社会经济现象所属的时间不同:绝对数动态数列分为时期数列和时
点数列。
3、编制动态数列的原则:P135-136 四点原则
4、动态数列水平分析指标:P136-147
发展水平:在动态数列中,各项具体的指标数值。
根据位置不同:分为最初水平0a 、最
末水平n a 、中间各项水平、基期水平、报告期水平
平均发展水平:就是将不同时期的发展水平加以平均而得的平均数叫平均发展水平,又称
为序时平均数或动态平均数。
与一般平均数的联系和区别:P137
各种动态数列平均发展水平的计算公式:P138-146
1、绝对数动态数列:(1)时期数列:n
a a ∑= (2)时点数列:①连续时点“日”:连续变动时点:n a a ∑=
非连续变动时点:∑∑=f
af a (“天”为权数) ②间断时点“非日”:(首尾折半法) P139-141 间隔相等1
22
121-+++=-n a a a a a n
n 间隔不等(首尾折半法加权数-时点间隔)
∑-=--+++++=11
11232121222n i i
n n n f f a a f a a f a a a 2、相对数或平均数动态数列:b
a c =
增长量:P146 报告期水平-基期水平
平均增长量:逐期增长量之和/逐期增长量个数累计增长量/(动态数列项数-1)
年距增长量(年距增减水平):报告期发展水平-上年同期发展水平
5、动态数列速度分析指标:P146-153
发展速度:报告期水平/基期水平(分为:定基、环比发展速度(二者关系))总速度
增长速度:增长量/基期发展水平另:增长速度=发展速度-1 (定基、环比增长速度)年距发展速度:报告期水平/上年同期发展水平
平均发展速度:是各期环比发展速度的序时平均数。
两种计算方法,运用于不同情况。
水平法制定长期计划,则为几何平均法P151-153
累计法制定长期计划,则为方程法结合平均增长速度查对表计算(不要求)平均增长速度:平均发展速度-1
5、动态数列变动趋势和季节变动分析:
长期趋势测定方法:间隔扩大法、移动平均法、最小平方法
(重点掌握最小平方法运用于直线方程的计算,与相关分析章节相结合)趋势线拟合为直线方程,则现象发展的逐期增长量大体相等;
趋势线拟合为抛物线方程,则现象发展的逐期增长量的增长量大体相等;
趋势线拟合为指数曲线方程,则现象发展的环比发展速度或环比增长速度大体相等。
季节变动分析:移动平均法、移动平均趋势剔除法(计算季节比率季资料时季节比率之和为400%;月资料时1200%)
结合作业:P181三、计算题1、4
第五章 统计指数
1、统计指数的概念、作用、种类 P186-192
种类:按说明现象的范围不同分为:总指数、个体指数
按统计指标的内容不同:数量指标指数、质量指标指数
按指数表现形式不同:综合指数、平均指标指数、平均指标对比指数
按指数所说明的因素多少:两因素指数、多因素指数
按在一个指数数列中所采用基期不同:定基指数、环比指数
(注:掌握按不同标准分为什么类,结合实际判断是哪种指数)
2、统计指数的编制方法(同度量因素):
(1)综合指数法P 192-202
同度量因素:就是把不能直接相加的指标过渡为可以相加的因素。
其作用:同度量、权数
同度量因素选择的一般原则是:
编制数量指标总指数时,以质量指标为同度量因素并固定在基期。
编制质量指标总指数时,以数量指标为同度量因素并固定在报告期。
(注:结合实际判断。
如:商品零售价格指数、工业产品产量指数)
数量指标综合指数编制:公式:∑∑=00
01
p q p
q K q 质量指标综合指数编制:公式:∑∑=1011q p q p K p (2)平均指标指数法:P202-205(从个体指数出发) 数量指标指数 公式:∑∑=0
000q p q
p k K q
q (以基期总值指标为权数)(加权算术平均) 质量指标指数 公式:∑∑=1
1111q p k q p K p (以报告期总值指标为权数)(加权调和平均) 3、几种主要价格指数的编制:居民消费价格指数(CPI )((加权算术平均)、农副产品收购价格指数、房地产价格指数(加权调和平均)、股票价格指数(综合指数法)等。
4、指数体系因素分析、因素推断(重点掌握其计算和分析)
(1)两因素综合指数的指数体系∑∑∑∑∑∑⨯=1011000
1001
1q p q p p q p q q p q p 从相对数、绝对数两面分析
(2)平均指标对比指数的指数体系
平均指标对比指数:P218-223 P226-228
⎥⎥⎦
⎤⎢⎢⎣⎡⨯⎥⎥⎦⎤⎢⎢⎣⎡=⎥⎥⎦⎤⎢⎢⎣⎡∑∑∑∑∑∑∑∑∑∑∑∑000110110111000111///f f x f f x f f x f f x f f x f f x 结合作业:布置的作业题、课件中两因素分析计算题、P 244T 第15题
第二章统计调查与整理
统计调查
主要内容:
1、统计调查的概念、重要性、两个基本要求。
P19-20
统计调查是按照统计任务的要求,运用科学的调查方法,有组织地向社会实际搜集各项原始资料的过程。
统计调查重要性:认识社会的基本方式、是统计工作中的基础环节、统计调查理论和方法在统计学原理中占有重要地位。
统计调查两个基本要求:准确性、及时性
2、统计调查方案设计:六项基本内容P21-29
(1)确定调查目的
(2)确定调查对象和调查单位
调查对象:需要进行研究的总体。
调查单位:所要研究的总体单位,即所要登记的标志的承担者。
填报单位:负责上报调查资料的单位。
(注意三者的区别,联系实际判断)
(3)确定调查项目
调查表:一览表、单一表
调查问卷:结构(封面信、指导语、问题与答案—主体、编码等)
(4)确定调查时间和调查期限(注意三者的区别,联系实际判断)
调查时间:调查资料所属时期或时点
调查期限:调查工作开展的起止时间
(5)选择调查方法
(6)调查工作的组织实施计划
3、统计调查的组织形式P30-36
按调查对象范围不同,分为全面调查和非全面调查
按组织形式,分为统计报表制度和专门调查
按登记事物的连续性分类,分为经常调查和一次性调查
重点掌握以下调查方式:(注意其区别,联系实际判断选择)
普查:专门组织的一次性的全面调查。
人口普查经济普查
统计报表制度:按照国家或上级部门统一规定的表式、统一的指标项目、统一的报送程序和报送时间,自上而下逐级提供基本统计资料的一种调查方式。
抽样调查:按照随机原则从总体中抽取一部分单位进行观察,并运用数理统计的原理,以被抽取的那部分单位的数量特征为代表,对总体作出数量上的推断分析。
为非全面调查。
重点调查:在调查总体中选择部分重点调查单位搜集统计资料的非全面调查。
重点单位指这些单位在全部总体中虽然数目不多,所占比重不大,但就调查的标志值来说却在总量中占很大的比重。
典型调查:在调查对象中有意识地选取若干具有典型意义的或有代表性的单位进行非全面调查。
各种调查组织形式不是完全孤立的,是互为补充、相互交叉使用的。
统计整理
1、统计分组P37-47
概念:根据统计研究的需要,将统计总体按照一定的标志区分为若干个类型组的一种统计方法。
统计分组目的:实现组内同质性、组间差异性
统计分组种类:
(1)按任务和作用不同分为类型分组、结构分组、分析分组
①划分社会经济现象的类型类型分组
②揭示现象总体内部的构成情况结构分组
③分析现象间的相互依存关系分析分组
类型分组与结构分组较难界定,三者之间不是彼此孤立的,而是相辅相成、相互补充的。
(2)按分组标志的性质分为品质分组、变量分组(单项式分组、组距式分组—等距分组/异距分组开口组/闭口组)
(3)按分组标志的多少分为简单分组、复合分组、分组体系(平行分组体系、复合分组体系)
(以上分组类别能根据实际进行判断、选择)
(统计分组的关键:分组标志选择、组距和组数、正确划分各组界限)
分组标志的选择:
注意三点:
(1)根据研究问题的目的来选择
(2)要选择最能反映被研究现象本质特征的标志作为分组标志
(3)要结合现象所处的具体历史条件或经济条件来选择
遵循原则:穷尽性互斥性
2、分配数列P48-59
概念:在统计分组的基础上,将总体的所有单位按组归类整理,并按一定顺序排列,形成总体中各个单位在各组间的分布。
分配数列构成两要素:总体分的各组、各组的频数
品质数列:
变量数列:(1)单项数列
(2)组距数列组数、组限(上限不在内原则)、组中值
分配数列编制、频率计算、组中值、累计次数分布计算(重点掌握,P54-57)
3、统计表P59-64
(1)概念:把统计调查得来的数字资料,经过汇总整理后,得出一些系统化的统计资料,将其按一定顺序填列在一定的表格内,这个表格就是统计表。
注:统计表既是调查整理的工具,又是分析研究的工具。
广义的统计表贯穿在统计工作的各个阶段中。
(2)统计表结构:总标题、分标题(横行标题、纵栏标题)、纵横栏组成的本身及表中的数字
(3)统计表种类:(从主词上分类)根据分组情况的不同,分简单表、分组表、复合表(4)宾词指标的设计:简单设计(平等配置一一排列);复合设计(层叠配置分层排列)
第六章 抽样调查
1、抽样调查概念、特点、作用P247-251
概念:按照随机原则从总体中抽取一部分单位进行观察,并运用数理统计的原理,以被抽取的那部分单位的数量特征为代表,对总体作出数量上的推断分析。
2、抽样调查的几个基本概念P251-259
(1)全及总体(总体)-N 抽样总体(样本)-n
(2)指标(含义、计算公式)
平均数 成数 方差 标准差
全及指标(参数): P 2σ
σ 抽样指标(统计量): x p 2i σ i σ
(全及总体唯一确定,其统计指标也是唯一确定的;
样本是不确定的,其统计指标也是不确定的,是随机变量;)
(3)重复抽样和不重复抽样
(4)样本容量和样本个数(样本可能数目)
3、抽样误差
误差分类:(1)登记性误差
(2)代表性误差:偏差、随机误差
抽样误差(随机误差)概念:指由于抽样的随机性而产生的那一部分代表性误差,不包括登记误差,也不包括可能发生的偏差。
4、抽样平均误差概念、影响其大小的因素、意义、计算公式P260-271:
概念:抽样平均误差是指所有可能出现的样本指标的标准差,也可以说是所有可能出现的样本指标和总体指标的平均离差。
(抽样误差的平均水平)
影响因素:总体各单位标志值的变异程度、样本容量、抽样方法、抽样组织方式
简单随机抽样情况下:
抽样平均误差计算公式:(常用公式)(能根据关系进行判断)
平均数的抽样平均误差计算公式:重复抽样情况下:n n u x σ
σ==2
不重复抽样情况下:)1(2N
n n u x -=σ 成数的抽样平均误差计算公式:重复抽样情况下:n
p p u p )1(-= 不重复抽样情况下:)1()1(N n n p p u p --=
5、抽样极限误差(置信区间)P274 X x x -=∆ P p p -=∆
概念:根据概率理论,以一定的可靠程度保证抽样误差不超过某一给定的范围。
(在进行抽样估计时,应该根据所研究对象的变异程度和分析任务的要求确定可允许的误差范围,在这个范围内的数字都算是有效的。
它等于样本指标中允许变动的上限或下限与总体指标之差的绝对值。
)
6、抽样误差的概率度(可信程度、置信度)
基于概率估计的要求,抽样极限误差通常需要以抽样平均误差为标准单位来衡量。
概率度t 即为抽样极限误差与抽样平均误差之比的倍数。
数理统计证明:概率是概率度的函数 P=F (t )(正态分布曲线\正态分布概率表) 99.7 3%-t=3 95.45%-t=2 68.27. %-t=1
(三者关系式:x x tu =∆ p p tu =∆)
7、抽样推断 P277-278
抽样推断概念:指按已经抽定的的样本指标(样本平均数或样本成数)来估计总体指标(总体平均数或总体成数),或其所在的区间范围。
优良估计的三个要求:无偏性、一致性、有效性
抽样推断方法:点估计 区间估计(计算)
点估计:直接换算法 修正分数法
区间估计(重点掌握计算):(1)根据给定的置信度要求推算抽样极限误差的可能范围
已知F (t )→t ,2
σ(或σ)→u ,推x ∆、p ∆
(2)根据给定的抽样误差范围,求概率保证程度。
已知,x ∆、p ∆,2σ(或σ)→u ,推t →F (t )
8、必要抽样单位数的确定-意义、原则、计算P307-309(只针对简单随机抽样) 简单随机重复抽样平均指标时:22
2t n ∆=σ 抽样成数指标时: 简单随机不重复抽样平均指标时: 不重复抽样成数指标时:
9、随机抽样主要组织形式(能结合实际选择使用)P280-307
(1)简单随机抽样
(2)类型抽样(分类抽样):先对总体各单位按一定标志加以分类(层),再从各类(层)中按随机原则抽取样本,由各类(层)内的样本组成一个总的样本。
(3)机械抽样(等距抽样、系统抽样):对研究总体按一定的顺序排列,每隔一定的间隔抽取一个单位,并把这些抽取的单位组成样本。
(无关标志、有关标志;随机起点、半距起点、对称等距)P288
(4)整群抽样:将总体划分为由总体单位所组成的若干群,以群为抽样单位,从总体中抽取若干个群作为样本,对中选群内的所有单位进行全面调查的方式。
(P295生产线上抽)
(5)多阶段抽样:抽取样本时不是一次直接从总体中抽取,而是分两个或两个以上的阶段来进行。
结合作业:布置的作业题P 332计算题第1题
第七章 相关分析
1、相关关系与函数关系,二者概念、区别与联系P344-345
2、相关关系的种类:P345-346
从涉及因素多少划分:单相关、复相关 从表现形态来划分:直线相关、曲线相关 从相关变化的方向来划分:正相关、负相关
从相关的程度来划分:完全相关、不完全相关和无相关
3、相关分析的主要内容:P347-348
(1)确定现象之间有无关系,以及相关关系的表现形式
先作定性分析(相关分析的基础)
(2)确定相关关系的密切程度——相关分析
根据自变量、因变量数据资料编制成散布图或相关表,计算相关系数
(3)选择合适的数学模型——回归分析
确定了现象间确实有相关关系和密切程度后,就要选择合适的数学模型,对变量之间的联系给予近似描述
(4)测定变量估计值的可靠程度
运用配合的模型测定因变量的估计值,将估计值与实际值对比,如果差别小,说明估计得准确,反之,则不够准确。
可靠程度用估计标准误差来衡量。
(5)对计算出的相关系数,进行显著检验。
4、简单线性相关分析:(相关系数的计算)
相关系数计算公式:P352(根据已有的资料选用适当的计算公式)
理论公式:y x xy r σσσ2= 简化公式:∑∑∑∑∑∑∑---=2222)
()(y y n x x n y x xy n r
与回归系数b 的关系式:
(二者同符号)
相关系数密切程度的判定:P354 (只能用来判断线性相关关系)
-1≤r ≤1 (正号表示正相关、负号表示负相关;越接近1表示相关关系越强、越接近0表示相关关系越弱。
)
0.3以下为无相关;0.3~0.5是低度相关;0.5~0.8是显著相关;0.8以上是高度相关
5、简单直线回归分析:
回归分析就是对具有相关关系的变量之间数量变化的一般关系进行测定,确定一个相关的数学表达式,以便于进行估计或预测的统计方法。
(直线回归、曲线回归) 以简单直线回归为例:(从最小平方法出发推导) bx a y +=
∑∑∑∑∑--=22)
(x x n y x xy n b x b y a -= 与相关系数r 回归系数b 的含义:X 每变动一个单位,Y 的平均变动值。
判定系数2
r (测定回归直线拟合优度的一个重要指标) 含义:说明估计的总偏差中有多少百分比可以由两个变量的依存关系来解释。
估计标准误差2)(2--=
∑n y y S c yx :其大小说明回归方程推算结果的准确程度,即反映
回归直线代表性大小。
当完全线性相关时: 1=r 、 yx S =0
结合作业:布置的作业题P 387计算题第8题、复习练习题中计算题1。