2019-2020第二学期统计学复习大纲
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2019-2020第二学期《统计学》复习大纲
填空题、选择和判断知识点:
1. 统计学发展的三个阶段:古典统计学时期、近代统计学时期和现代统计学时期,古典统
计学有两大学派:国势学派和政治算术学派,代表人物分别是德国的康令、阿亨瓦尔和英国的威廉•配第、约翰•格朗特。
近代统计学也有两大学派:数理统计学派和社会统计学派,代表人物分别是比利时的凯特莱和德国的克尼斯。
现代统计学以推断统计为主流。
2. 统计的含义:统计资料、统计工作和统计学。
统计资料是经过观察、调查得到的各种具有
信息价值的数字资料;统计工作是对各种统计数据资料进行搜集、整理、推断和分析的活动过程;统计学即指导统计工作的理论和方法,是关于统计数据资料的搜集、整理和推断的科学。
统计工作与统计资料是统计活动与统计成果的关系,统计工作与统计学则是统计实践与统计理论的关系。
统计的本质就是用数据说明问题,用数据反应真相。
3. 标志与指标的种类判断:标志是用以描述个体所共同具有的某种属性或特征的名称。
标
志按其结果的表示方式不同分为品质标志和数量标志两种。
品质标志表明个体属性方面的特征,数量标志说明个体数量方面的特征,标志表现是标志在各个体上的具体表现结果。
标志按其在每个个体上的具体表现结果是否相同可以分为不变标志和可变标志。
标志按其表现个体特征的直接程度不同可以分为直接标志和间接标志。
标志的测定尺度有四种,按由低层次到高层次的顺序分别为:定类尺度、定序尺度、定距尺度和定比尺度。
从狭义上看,变量是指可变的数量标志,从广义上看,也可包括可变的品质标志。
变量按其所受影响因素不同可以分为确定性变量和随机性变量;变量按其数值的变化是否连续出现可以分为离散型变量和连续型变量。
统计指标是反映实际存在的社会经济现象总体数量特征的概念及其数值。
统计指标由指标名称和指标数值两部分组成,具体包括指标名称、计算方法、时间限制、地点限制、指标数值和计量单位六个要素。
统计指标按其计算的范围不同,可以分为总体指标和样本指标;统计指标按其反映现象的内容不同,可以分为数量指标和质量指标;统计指标按其反映现象的时间状态不同,可以分为静态指标和动态指标;统计指标按其功能不同,可以分为描述指标、评价指标和预警指标。
统计指标的设计要确定指标的名称与涵义、计算范围、计算方法、资料搜集方法、量化尺度和计量单位等内容。
统计指标与标志之间既存在区别(说明的对象不同,表现结果的形式不同),又存在联系(标志是计算指标的依据,两者可以互换)
4.几种常用调查方法的种类判断:1、根据调查对象所包括的范围不同分为:全面调查与非
全面调查。
2、按调查登记的连续性不同分为:经常性调查(重复多次,不等于周期性调查)一次性调查。
3、根据调查组织形式不同(政府统计)分为:统计报表制度与专门调查。
4、根据调查资料的搜集形式不同分为:直接观察法、 报告法、 采访法。
5.几种常用的统计调查组织形式的判断:普查 统计报表制度 重点调查 典型调查 (概率)抽样调查
6.频数密度和频率密度的概念:频数密度是频数与组距之比,频率密度是频率与组距之比。
7.直方图和条形图的区别判断:条形图是用条形的长度(横置时)表示各类别频数的多少,其
宽度(表示类别)则是固定的。
直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义。
直方图的各矩形通常是连续排列,条形图则是分开排列
8.中位数、众数和算术平均数的位置关系:在对称分布: o e M M x == 在右偏时:
x M M e o ≤≤ 在左偏时 :o e M M x ≤≤ 适度偏态时:)(3x M x M e o -=-
9.总体参数和样本统计量的特点:总体参数:由目标总体计算得到的反映总体数量特征的综
合指标。
总体参数值是唯一的,总体参数的值通常未知。
样本统计量:由样本计算得到的反映样本数量特征的综合指标。
样本统计量不是唯一的量。
样本统计量是用来估计总体参数的,但是,由于实践中获得的只是众多可能样本中的一个样本,因此,其值“并非唯一的”,但是“可知的”,因此每一次抽样,都可以计算出相应的统计量值。
10.抽样误差的概念和类型判断:抽样误差:是指根据样本统计量所得的抽样估计值与总体参数真值之间的绝对离差,表示为θθ-ˆ 。
类型判断:表现形式
抽样标准误差:反映抽样误差的一般水平,它的实质含义是指样本统计量抽样分布的标准差。
即它反映了样本统计量分布的离散程度。
通常用 )(x SE 或 )(p SE 表示。
抽样实际误差:抽样实际误差是指样本估计值与总体参数值之间的离差 。
抽样极限误差 :所允许的最大误差范围
11.变量间的关系:相关关系和函数关系的判断:函数关系:是一一对应的确定关系。
相关
关系:变量之间存在着不确定的数量依存关系。
一个变量的取值不能由另一个变量唯一确定。
当变量 x 取某个值时,变量 y 相应的取值可能有几个。
12.相关系数取值的含义: r 的取值范围是 [-1,1]
0<r 1,为正相关 -1r<0,为负相关
|r|=1,为完全相关
r =1,为完全正相关
r =-1,为完全负相关
r = 0,不存在线性相关关系
|r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切
一般可划分:|r|< 0.3不相关; 0.3 ≤|r|<0.5低度相关(弱相关);0.5 ≤|r|<0.8为显著相关
(密切相关); 0.8 ≤|r|为高度相关
13.时间数列的影响因素:时间数列的影响因素(或者说构成要素)分成四种:长期趋势(T )、
循环变动(C )、季节变动(S )和不规则变动(I )。
上述因素作用的模式不同,理论上有加法模型和乘法模型。
14.发展速度、增长速度、平均发展速度:发展速度:基期水平报告期水平发展速度=
根据基期
的选择不同,形成两种发展速度:定基发展速度(总速度)。
环比发展速度:以上一期
为基期。
增长速度:00%)11-(发展速度基期发展水平增长量增长速度==。
根据基期的不同:定基增长速度=定基发展速度—1(100%),环比增长速度=环比发展速度—1
(100%)。
平均发展速度:1、几何平均法:
n i i n
n a a a a X ∏-==10。
2、方程式法(累计法):
20001......n n i
i a X a X a X a =+++=∑
15.翻番的概念:
16.统计指数的分类:1.按其反映对象范围的不同分为个体指数和总指数。
个体指数:说明
个别事物(例如某种商品或产品等)数量变动的相对数称个体指数。
个体指数通常记作I 。
总指数:说明度量单位不相同的多种事物(复杂现象)数量综合变动的相对数,例如工业总产量指数、零售物价总指数。
2.按其所反映的社会经济现象特征不同分为数量指标指数和质量指标指数:
数量指标指数——简称数量指数,主要是指反映现象的规模、水平变化的指数,例如商品销
售量指数、工业产品产量指数等等。
质量指标指数——简称质量指数,是指综合反映生产经营工作质量变动情况的指数,例如物价指数、产品成本指数等等。
3.指数按其采用基期的不同分为定基指数和环比指数:
定基指数——将不同时期的某种指数按时间先后顺序排列,形成指数数列。
在同一个指数数列中,如果各个指数都以某一个固定时期作为基期,就称为定基指数;
环比指数——如果各个指数都是以报告期的前一期作为基期,则称之为环比指数
4.按照常用的计算总指数的方法或形式可以分为综合指数和平均数指数:
综合指数——从数量上表明不能直接相加的社会经济现象的总指数。
平均数指数——以个体指数为基础,采取平均形式编制的总指数。
简答题:每题5分,共20分
1.指标与标志的概念、区别与联系:同填空题、选择和判断知识点 3.
2.总体、样本与个体的概念、区别与联系:总体是统计研究的客观对象的全体,是根据一定
的目的和要求所确定的具有某种共同性质的事物所组成的集合体。
个体是组成总体的每一个个别事物,也称为总体单位。
总体和个体是互为存在条件地连接在一起的。
总体和个体不是固定不变的,而是随着研究目的不同而变化。
样本是由从总体中抽取的一部分个体所组成的集合体,也称为子样。
样本中所包含的个体数,称为样本容量或样本单位数。
总体和样本的关系可以概括为:总体是所要研究的对象,样本是所要观测的对象,样本是总体的代表和缩影;样本是用来推断总体的;总体与样本的角色是可以改变的;
总体与样本都具有大量性、同质性和差异性三个特征。
3.重点调查、抽样调查、典型调查的含义、相互的区别与联系:重点调查:从总体中选择部
分重点单位搜集统计资料的非全面调查。
优点:调查单位少、可以详细调查较多的项目、时效性好、成本低。
缺点:一般不能由调查结果推断总体一般水平。
目的:了解总体的基本情况。
选择调查单位的原则:客观性原则。
典型调查:有意识地从总体中选择少数有代表性单位进行深入细致的研究,以了解总体发展变化规律及数量特征。
目的:了解事物发展变化规律(个案研究),估算总体数量特征。
选择调查单位的原则:主观性原则(“有意识”)。
种类:解剖麻雀式(个案研究)与划类选典式(代表性抽样)。
抽样调查:按照随机原则从总体中抽取部分单位(样本)进行调查,并根据样本结果推断总体的非全面调查方法。
选择调查单位的原则:随机性原则。
目的:推断总体数量特征与数量关系
4.抽样分布的概念、影响因素:概念:抽样分布就是样本统计量的概率分布,它由样本统
计量的所有可能取值和与之对应的概率组成。
影响因素:1、总体分布。
2、样本容量。
3、抽样方法。
4、抽样组织形式。
5、估计量构造。
5.同度量因素的概念、作用与选择:.同度量因素的概念:为解决复杂现象总体不能直接加
总的问题,必须引入一个媒介因素使其转化为价值量指标形式。
作用:为了在综合对比过程中单纯反映某一因素的变动或差异程度,又必须将引入的媒介因素的水平固定起来。
选择:当研究销售量的变动时,销售量是数量指标,则与之相联系的质量指标——价格,就是同度量因素。
当研究价格的变动时,商品价格是质量指标,则与
之相联系的数量指标——销售量,就是同度量因素
6.统计指数的概念及作用:加总法: 计算总量指标的基础公式
对比法: 计算相对指标的基本公式
平均法: 计算平均指标的基本公式
总量指标:反映统计总体在某一个标志上的总规模或总水平的指标。
认识的起点;编制计划的依据;计算其它指标的基础。
相对指标:相对指标又称统计相对数。
它是两个有联系的现象数值的比率,用以反映现象的发展程度、结构、强度、普遍程度或比例关系。
在统计分析中运用相对指标,可使我们能够更清楚地认识现象之间的关系,可以使不能直接对比的现象找到可以对比的基础。
平均指标:平均指标又称统计平均数,用以反映社会经济现象总体各单位某一数量标志在一定时间、地点条件下所达到的一般水平
相对指标数值的表现形式是有名数和无名数
7.时期指标、时点指标的区别与联系:时期指标(流量):一段时间之内的累计总量。
时点指标(存量):一个时点(瞬间)所达到的总量。
8.统计数据收集的含义、要求:含义:所谓统计数据收集,就是按照统计研究的目的和任务,
运用各种科学有效的方式和方法,有针对地收集反映客观现实的统计数据的活动过程统计数据收集是整个统计活动的基础阶段。
要求:统计调查必须达到准确性、及时性和完整性三个基本要求。
9.统计资料整理的概念与基本步骤:概念:是指根据统计研究任务的要求,对统计调查所取
得的各项原始资料进行科学的分类、加工和汇总,使之条理化、系统化的工作过程。
广义上说,对已整理的资料进行再加工,也属于统计资料整理。
基本步骤:整理方案的设计,数据预处理,统计分组和汇总,整理数据的显示和整理数据的保存与公布。
P.40 10.平均指标的作用:平均指标可以反映总体各单位变量分布的集中趋势;可以用来比较同
类现象在不同单位的发展水平,以说明生产水平、经济效益或工作质量的差距;可用来
分析现象之间的依存关系。
利用平均指标进行综合分析,反映现象的一般水平、差异情况和发展动态,从而便于比较利用平均指标可以作出统计估算和数量推算
11.抽样标准误差的影响因素:①总体内在差异程度:一定条件下,差异程度越大抽样误差
越大;②样本容量n :一定条件下,n越大抽样误差越小;③抽取方法:一般情况下,不重复抽样小于重复抽样误差;④抽样组织形式:一定条件下,不同抽样组织方式抽样误差也不同。
⑤抽样估计方法
12.相关和回归的区别和联系:相关分析中,变量x 变量y 处于平等的地位;回归分析中,
变量y 称为因变量,处在被解释的地位,x 称为自变量,用于预测因变量的变化
相关分析中所涉及的变量x 和y 都是随机变量;回归分析中,因变量y 是随机变量,自变量x 通常是非随机的确定变量
相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量x 对变量y 的影响大小,还可以由回归方程进行预测和控制
计算题:5题,每题10分,共50分。
小数点都是保留两位。
每份试卷中都是每章一道计算题。
1. 变量分布特征的描述:平均数的计算
2. 时间数列分析:相对指标时间数列和平均指标时间数列的计算;
3. 抽样估计:简单随机抽样的区间估计(均值和比例)
4. 相关与回归:相关系数、回归方程计算与预测
5. 统计指数:综合指数、平均数指数。