统计学重点
统计学重点
复习重点:统计学基本概念、问题简答复习重点统计1.简述统计的含义及其相互之间的关系。
统计资料、统计工作、统计学统计资料是统计工作的成果统计工作满足对统计资料的准确性统计学与统计工作是理论和实践的关系2.简述变量分配数列编制的步骤。
步骤:①将原始资料按其数值大小重新排列②确定全距③确定组距和组数④ 确定组限⑤ 编制变量数列3.什么是统计指标、什么是统计标志?说明二者的联系与区别。
统计指标是反映社会经济现象总体数量特征的概念标志指标简称标志,是反映总体单位某种特征的名称。
区别:指标是说明总体特征的,而标志是说明总体单位特征的;标志有不能用数值表示的品质标志和能够用数值表示的数量标志两种,而指标都能用数值表示联系:许多统计指标的数值是从总体单位的数量标志汇总而来的;指标和数量标志之间存在着转化关系。
4.什么是发展速度?包括哪些类型?各类之间的数量关系?发展速度是两个时期发展水平之比,它表明现象发展的程度和方向。
(一)定基发展速度=报告期水平÷某一固定时期水平(二)环比发展速度=报告期水平÷前一期水平数量关系:1.环比发展速度的连连乘积等于相应的定基发展速度2.相邻的两个定基发展速度之比等于相应时期的环比发展速度5.什么是结构相对指标、强度相对指标和比例相对指标?各类之间的关系如何?结构相对指标是利用分组的方法,将总体去区分为性质不同的若干部分,以部分数值与总体数值对比,计算各部分所占比重或比率的相对数,是反映同一时期总体内部组成状况的综合指标。
部分与总体的关系比例相对指标是反映同一总体内部各部分之间数量对比关系的综合指标,用来反映总体各组成部分之间的数量联系程度和比例关系。
部分与部分的关系强度相对指标是将两个性质不同但有一定联系的总体的指标对比而得到的相对数,用以反映现象强度、密度或普遍程度的综合指标。
关联指标间的关系6.什么是统计调查?有哪些类型?统计调查方案包括哪些内容?统计调查是根据研究的任务和目的,按照预先设计的方案,采用统计学的理论和方法,对所研究对象进行有计划,有组织的搜集资料的工作过程。
统计学重点
简答1、抽样框是包含全部抽样单位的名单框架。
主要有三种形式:名单抽样框;区域抽样框;时间表抽样框。
2、样本估计量的标准差定义为抽样平均误差;抽样平均误差的平方为抽样方差;一定概率下抽样误差的可能范围,称为极限误差3、必要抽样数目因素影响(1)总体方差(或总体标准差)(2)允许误差范围(3)置信度(4)抽样方法(5)抽样组织形式4、估计量:样本指标又称样本统计量与或估计量。
标准为:无偏性;有效性;一致性5、点估计常用的方法有哪两种?其基本思想是什么?一是矩估计法。
其基本思想是:由于样本来源于总体,样本矩在一定程度上反映了总体矩,而且由大数定律可知,样本矩依概率收敛与总体矩。
因此,只要总体x的k阶原点矩存在,就可用样本矩作为相应总体矩的估计量,用样本矩的函数作为总体矩的函数的估计量。
二是极大似然估计法。
其基本思想是:设总体分不函数形式已知,但又未知参数,未知参数可以取很多值,在未知参数的一切可能取值中选一个使样本观测值出现的概率为最大的参数作为估计量。
6什,么是抽样推断?抽样推断都有哪几方面的特点?答:抽样推断是在抽样调查的基础上,利用样本的实际资料计算样本指标,并据以推断总体相应数量特征的统计分析方法。
特点:(1)是由部分推算整体的一种认识方法论。
(2)建立在随机取样的基础上。
(3)运用概率估计的方法。
(4)抽样推断的误差可以事先计算并加以控制。
7,什么是参数和统计量?各有何特点?答:参数指的就是某一个全及指标,它反映了全及总体某种数量特征,统计量即样本指标,它反映了样本总体的数量特征。
其特点是:全及指标是总体变量的函数,但作为参数其指标值是确定的、唯一的,是由总体各单位的标志值或标志属性决定的;而统计量是样本变量的函数,是总体参数的估计值,其数量由样本各单位标志值或标志属性决定,统计量本身也是随机变量,8数据计量尺度:定类尺度、定序尺度、定距尺度、定比尺度。
其中定类是分类数据,定序是顺序数据,定距和定比是数值型数据。
统计学重点
第一章1、数据类型:按照所采用的计量尺度不同,我们将数据分为:分类数据(归于某一类别的非数字型数据,ex:血型),顺序数据(有序类别的非数据型数据,ex:喜好,产品等级),数值型数据(按照数字尺度测量的观测值)2、统计量:用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数,样本统计量通常用小写英文字母表示,若存在未知变量就不是统计量。
第二章1、概率抽样(随机抽样):(1)特点:按一定的概率以随机原则抽取样本(抽取样本时使每个单位都有一定的机会被抽中)。
每个单位被抽中的概率是已知的,或是可以计算出来的。
当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率(2)简单随机抽样:体现在每一个样本点的选取上(简单直观方便,但是效率低)(3)分层抽样:适用于总体差距大,体现在每一层样本点选取上(精度最高)(4)系统抽样:第一个样本点的选取是随机的(简单,提高精度,但是方差估计难)(5)整群抽样:要求:群集间互斥且周延,群集与群集间差异小,群集内类似总体每一群的选取是随机的(简单,相对集中,方便,但是精度较差)(6)多阶段抽样:先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查。
2、非概率抽样(1)抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查(2)有方便抽样、判断抽样、自愿样本、滚雪球抽样、配额抽样等方式3、比较:4、抽样误差:所有样本可能的结果与总体真值之间的平均性差异影响因素:样本量的大小、总体的变异性第三章1、数据审核:(1)原始数据:完整性,准确性;(2)二手数据:适用性,时效性,确认是否有必要做进一步的加工整理2、分类数据的图示:(1)条形图:主要反映分类数据的频数分布(2)帕累托图:各类别数据出现的频数多少排序的柱形图,用于展示分类数据分布。
(3)饼图:主要用于表示样本或总体中各组成部分所占的比例,用于研究结构性问题。
统计学基础知识考试重点
统计学基础知识考试重点第一章统计和数据第二章●统计是用来处理数据的,是关于数据的一门学问。
1、统计学:是用以收集数据、分析数据和由数据得出结论的一组概念、原则和方法。
2、统计分析数据的方法分为:(1)描述统计(2)推断统计3、描述统计:是研究数据搜集、处理和描述的统计学方法。
4、推断统计:是研究如何利用样本数据来推断总体特征的统计学方法。
5、推断统计包括:(1)参数估计(2)假设检验6、定性变量的特点:只反映现象的属性特点,不能说明具体量的大小和差异。
●定性变量包括分类变量和顺序变量。
●只反映现象分类特征的变量称分类变量。
分类变量没有数值特征,所以不能对其数据进行数学运算。
●如果类别具有一定的顺序,这样的变量称为顺序变量。
顺序变量不仅能用来区分客观现象的不同类别,而且还可以表明现象之间的大小、高低、优劣关系。
7、定量变量的特点:可以用数值表示其观察结果,而且这些数值具有明确的数值含义,不仅能分类而且能测量出来具体大小和差异。
●数值型数据(定量数据)作为统计研究的主要资料,其特征在于它们都是以数值的形式出现的,有些数值型数据只可以计算数据之间的绝对差,而有些数值型数据不仅可以计算数据之间的绝对差,还可以计算数据之间的相对差。
其计量精度远远高于定性数据。
在统计学研究中,数值型数据有着最广泛的用途。
8、数据按获取的方法不同分为:(1)观测数据(2)实验数据9、观测数据:是对客观现象进行实地观测所取得的数据,在数据取得的过程中一般没有人为的控制和条件约束。
10、实验数据:一般是在科学实验环境下取得的数据。
11、统计数据资料的来源:(1)通过直接的调查或实验获得的原始数据,这是统计数据的直接来源;(2)别人调查的间接数据,并将这些数据进行加工和汇总后公布的数据,这是数据的间接来源。
12、数据的直接来源:(1)统计调查(2)实验法●通过统计调查得到的数据,一般称为观测数据。
●运用实验法时,实验组和对照组的产生应当是随机的。
统计学重点
1、非全面调查方式有哪几种?说明他们各自的特点及应用场合。
(1)抽样调查是一种专门组织的非全面调查,是按照随机原则从总体中抽取部分单位组成样本,以样本数据推断总体特征的一种调查方法,是实际中应用最广的一种调查方式。
具体来说:①不可能进行全面调查的社会现象,为了测算全面数据,必须采取抽样调查方法;②没必要或很难进行全面调查的社会现象,也可采用抽样调查;③其他应用,如进行生产过程的质量控制、对全面调查结果进行检验修正等。
(2)重点调查时在调查对象中选择一部分重点所进行的非全面调查。
但只有在当调查任务是掌握调查对象的基本情况,而在总体中的确存在的重点单位时,才能进行重点调查。
(3)典型调查是根据调查的目的和任务,在对调查对象全面分析的基础上,有意识地选择若干有典型意义或有代表性的单位进行深入、细致调查的一种非全面调查方式。
可以用来研究某些复杂的专门问题或新生事物。
2、数据分组的关键是什么?如何选择分组标志?(1)数据分组的关键是选择分组标志和划分各组界限。
(2)应根据研究的目的选择分组标志;选择能够反映事物本质的标志;考虑现象所在的历史条件或经济条件选择分组标志。
3、简述均值、中位数和众数的特点及应用场合。
(1)均值的计算利用了全部数据信息,具有优良的数学性质,主要适用于数值型变量集中趋势测度值。
主要缺点是易受极端值的影响。
算术平均数是实际中应用最广泛的集中趋势测度值;调和平均数主要用于不能直接计算均值的数据;几何平均数主要用于计算比率或速度数据的平均数。
(2)中位数是一组数据中间位置上的代表值,其特点是不受数据极端值得影响,主要适用于作为顺序数据的集中趋势测度值。
(3)众数是一组数据分布的峰值,它也是一种位置的代表值,不受极端的影响。
其缺点是不具有唯一性。
众数主要适用于作为分类数据的集中趋势测度值。
(4)当数据呈对称分布或接近对称分布时,应选择均值作为集中趋势的代表值。
当数据呈偏态分布时,可以选择众数或中位数作为集中趋势测度值。
统计学重点
1.统计的三种含义:统计工作、统计资料、统计学2.统计学的研究对象是大量社会经济现象3.统计学的特点:数量性、总体性、具体性、社会性、差异性4.统计学研究方法:大量观察法、统计分组法、统计指标法、统计推断法、统计模型5.统计的基本职能:信息(最基本)、咨询、监督职能6.统计工作的过程:统计设计、统计调查、统计整理、统计分析7.总体和总体单位(判断):总体是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体。
构成总体的这些个别单位成为总体单位。
总体的特点:同质性、大量性、差异性8.标志和指标:标志是用来说明总体单位特征的名称,分为品质标志和数量标志。
指标是说明总体的综合数量特征的。
指标包括:空间、时间、指标名称、指标数值、计量单位、计算方法9.标志和指标的区别和联系:区别-(1)标志是说明总体单位特征的,而指标是说明总体特征的。
(2)指标都能用数值表示,而标志中的品质标志不能用数值表示,使用属性表示的。
(3)指标数值是经过一定的汇总取得的,而标志中的数量指标不一定经过汇总,可直接取得。
(4)标志一般不具备时间地点等条件,但作为一个完整的统计指标,一定要讲时间地点和范围。
联系-(1)有许多统计指标的数值是从总体单位的数量标志值汇总而来的。
(2)两者存在着一定的变换关系。
10.变量按取值是否连续可分为离散变量和连续变量。
11.统计调查的特征:准确性、及时性、全面性12.统计调查方案设计:确定调查目的、确定调查对象和调查单位、确定调查项目、确定调查时间和调查期限、制定调查的组织实施计划、选择调查方法13.确定调查单位就是要赋予调查单位以科学的定义,而填报单位是负责上报调查资料的单位。
14.问卷的结构:封面信、指导语、问题与答案、编码15.调查时间是指调查资料所属的时点或者时期。
调查期限是指调查工作进行的起讫时间(从开始到结束的时间)。
16.统计调查的组织形式:(1)按调查对象包括的范围分类:普查、统计报表制度、抽样调查、重点调查、典型调查(2)按调查的组织形式分类:统计报表制度和专门调查(3)按登记事物的连续性分类:经常调查和一时调查17.各类统计调查的特点调查范围调查时间组织形式统计报表全面或非全面经常报表制度普查全面一时专门调查抽样调查非全面经常或一时专门调查重点调查非全面经常或一时报表或专门典型调查非全面一时专门调查18.统计整理阶段的工作内容程序:资料审核、统计分组、统计汇总、编制统计表19.统计分组:就是根据统计研究的需要,将统计总体按照一定的标志区分为若干组成部分的一种统计方法。
统计学重点
1.统计学的研究对象:客观事物总体的数量特征(数量表现和数量关系),通过这些数量特征反映客观现象规律性的表现。
2.统计学研究对象的特点:数量性、总体性、具体性、社会性、差异性3.统计总体(总体):由客观存在的、具有某种共同性质的许多个别单位所构成的整体,当这个整体作为统计研究的对象时称为统计总体。
(大量性、同质性、差异性)4.总体单位(个体):构成总体的每一个事物或基本单位称为总体单位。
5.在某一特定范围、特定目的的统计研究中,统计总体与总体单位是包含与被包含的关系。
但是两者可以在一定条件下转换。
总体与个体是互为存在条件的连接在一起,没有个体,总体也不存在,没有总体,个体也就无法确定。
6.标志:用来说明总体单位属性或特征的名称。
每个总体单位都具有许多属性和特征。
7.标志表现:标志特征在各单位的具体表现。
如果说标志是统计所要调查的项目,那么标志表现是调查所得结果标志的实际体现。
品质标志的具体表现是属性,数量标志的具体表现是数值。
数量标志的具体表现,称为数量标志值,简称标志值。
8.标志的分类:标志按其性质不同可以分为品质标志和数量标志。
品质标志:表示事物的质的特征,无法量化。
主要用作分组的依据。
数量标志:表示事物的量的特征,能够量化。
可进行计算。
9.变量:包括可变的数量标志和统计指标。
变量的具体表现,就是可变数量标志或统计指标的不同取值,称为变量值。
10.变量的分类:按照变量值是否连续,变量可以分为连续型变量和离散型变量。
连续型变量是指它的数值是连续不断的,即在任意两个相邻数值之间可以取无限多个不同的数值。
(eg.人体的身高、体重)。
一种近视的结果。
离散型变量的数值是通过逐个计数的方法得出的,所取的可能数值只能按整数计数,不可能有小数。
(eg.职工人数、企业数、机器台数)而且其可能数值的个数是有限的,构成有限总体。
11.统计指标:反映社会经济现象总体的数量特征的名称和具体数值。
与标志不同,它是依附于统计总体的。
统计学重点
1.时点指标和时期指标的区别。
时期指标反映现象在某一时期内发展过程的总数量;时点指标反映现象在某一时刻(瞬间)上状况的总量。
时期指标和时点指标各有不同的特点:(1)时期指标的数值时连续计数的,它的每个数值是表示现象在某一点时期内发生的总量;而时点指标的数值是间断计数的,它的每个数值是表示现象发展到某一时点上所处的水平。
(2)时期指标具有累加性,即各个时期值相加可以说明现象在较长时期内发生的总量;而时点指标不具有累加性;(3)时期指标的大小受时期的长短的制约;而时点指标数值的大小与时点间的间隔长短无直接的关系。
2.什么叫统计分组?统计分组有哪些分类?(1)统计分组是指根据事物内在的特点和统计研究的需要,将统计总体按照一定的标志区分为若干组成部分的一种统计方法。
其目的是把同质总体中的具有不同性质的单位分开,把性质相同的单位合在一起,保持各组内统计资料的一致性和组间资料的差异性,以便进一步运用各种统计方法研究现象的数量表现和数量关系,从而正确地认识事物的本质及其规律。
(2)①简单分组,又称为单一分组,就是对被研究现象总体只按照一个标志进行的分组;②复合分组,就是对同一总体选择两个或两个以上标志层叠起来进行的分组;③分组体系,采用一系列相互联系,相互补充的标志对现象进行分组,这些分组结合起来构成一个体系,在统计学上叫做分组体系。
4.单项式分组和组距式分组分别在什么情况下应用?变量数值不多,变动范围不大,即总体单位的不同标志值较少,这时可做成单项式分组;变量数值较多,变动范围较大,即总体单位的不同标志值较多,则应该作组距式分组。
5.什么是同度量因素,在编制指数时如何确定同度量因素的所属时间。
(1)同度量因素是使若干由于度量单位不同不能直接相加的指标,过渡到可以加总和比较而使用的媒介因素。
(2)确定同度量因素的一般原则是:质量指标指数应当以报告期的数量指标作为同度量因素,即使用派氏公式,而数量指标指数则应以基期的质量指标作为同度量因素,即使用拉氏公式。
统计学考试重点
精品文档统计学考试重点(是我去年考试时的,命中率百分之百)1.统计的涵义:从数量方面认识总体现象的本质和规律的一种认识活动或调查研究活动。
概括为:统计工作,统计资料,统计学。
2.统计工作,统计资料与统计学的联系:统计工作是获取统计资料的实践活动,统计资料是统计工作的成果。
同时又服务于统计工作,统计学来源于统计实践,有用于指导统计实践,它可以使统计工作进行的更科学,得到的统计资料更全面、更及时、更准确3.统计的研究对象是大量社会经济现象的数量特征与规律。
4.统计的研究对象具有以下特点:①数量性②总体性③具体性。
5.统计工作可分为四个阶段,统计设计,统计调查,统计整理,统计分析。
6.统计工作的基本方法:大量观察法,统计分组法,综合指标法,统计推理法7.统计总体:简称总体,是根据统计研究目的确定的所研究对象的全体。
8.总体单位:简称单位或个体,是只构成总体的个别单位。
9.指标是指用来说明总体单位数量特征或属性特征的概念或名称。
10.标志根据表现形式分为:品质标志和数量标志11.指标是说明总体数量特征的科学概念和具体数值。
12.指标所包含的要素有:指标名称,指标数值,时间,空间,计量单位。
13.指标按其表现形式不同,又可分为总量指标,相对指标,平均指标。
14.按所反映总体内容不同可分为:数量指标和质量指标。
15.变量,所谓变量,是指可变的数量标志。
16.统计数据的计量尺度分为:定类尺度,定序尺度,定距尺度,定比尺度。
17.数据的类型有:定性数据(由定类尺度和定序尺度计量形成) 。
定量数据(由定居尺度和定比尺度计量形成) 。
18.统计调查方案的设计(内容):①确定调查的目的和任务②确定调查对象、调查单位与报告单位,③确定调查项目、设计调查表式,④确定调查时间、空间和调查期限,⑤制定调查工作的组织实施计划。
⑥选择调查方法精品文档19.统计数据搜集的原则:准确性原则,及时性原则,系统性原则,完整性原则。
20.统计数据搜集的方法:观察法,报告法,询问法。
统计学复习重点
统计学复习重点第一章统计数据信息处理的方法:1.描述统计方法;2.推断统计方法统计数据的含义:统计数据工作、统计资料、统计学政治算数学派:威廉。
配第;国势学派:康令;数理统计学派:凯特勒统计数据研究的对象具备如下特点:1.数量性2.具体性3.总体性4.社会性统计工作的基本任务:服务与监督基本方法:1.大量观察法 2.综合指标法 3.统计数据分组法总体:即统计总体,是指客观存在的、在同一性质基础上结合起来的许多个别事物的整体总体单位:形成统计数据总体的个别单位标志:表明总体单位特征的名称品质标志:表明总体单位质的特征,用属性则表示数量标志:说明总体单位量的特征,用数量表示,数量标志的具体体现:标志值指标:表明总体的综合数量特征。
1.按结构分后:指标名称、指标数值2.按内容分:数量指标(绝对数)、质量指标(相对数、平均数)标志与指标的联系和区别:区别:1.标志(指数量标志)不一定经过汇总,可直接取得;而指标(指数量指标)一定经过汇总就可以获得。
2.标志一般不具备时间、地点等条件;但完整的统计指标一定要讲明时间、地点、范围联系:1.有些数量标志值汇总可以获得指标的数值。
既可以指总体各单位标志量的总和,也可以指总体单位数的总和2.数量标志与指标之间存在变换关系。
随着统计目的的改变,如果原来的总体单位变成了统计总体,则与之相对应的数量标志就成了统计指标变异:就是标志在各总体单位具体表现的差异——通常意义上的变异;严苛说道,变异指品质标志的不同表现变量:指气门的数量标志。
变量的具体内容数值整体表现即为变量值(线性变量、连续变量)统计指标体系:研究社会经济现象的一系列相互联系的统计指标为统计指标体系流量:即为一定时期内生产的产品和劳务而获得的总收入或开支的总量。
就是时期指标。
存量:即某一时点上过去生产与积累起来的产品、货物、存储、资产负债的结存数。
是时点的指标。
流量之比、存量之比及流量与存量之比既不是流量也不是存量。
统计学重点
1.统计学是收集、处理、分析、解释数据并从数据中得出结论的科学统计学分为描述统计和推断统计(分为参数估计和假设检验)2、包含所研究的全部个体的集合,称为总体。
从总体中抽取的一部分元素的集合,称为样本。
用来描述总体特征的概括性数字度量,称为参数。
用来描述样本特征的概括性数字度量,称为统计量。
变量分为:分类变量、顺序变量、数值型变量。
5种鉴别图表优劣的准则:一张好的图表应当1 精心设计、有助于洞察问题的实质2 使复杂的观点得到简明、确切、高效的阐述3能在最短的时间内以最少的笔墨给读者提供最大量的信息4是多维的5表述数据的真实情况变量值与其平均数的离差除以标准差后的值,称为标准分数。
标准分数以测度每个数值在该组数据中的相对位置,并可以用它来判断一组数据是否有离群点。
z=(x-μ)/σμ为平均数,σ为标准差变异系数:变异系数是衡量资料中各观测值变异程度的另一个统计量。
变异系数=标准差/平均数点估计:从总体中抽取一个样本,根据该样本的统计量对总体的未知参数作出一个数值点的估计区间估计:根据一个样本的观察值给出总体参数的估计范围:概率抽样的分类1)纯随机抽样:对总体的所有容量不做任何的分类和排队,完全按随机原则逐个抽取样本容量.2)、分层抽样类型抽样:将全及总体中的所有单位按某一主要标志分组,然后在各组中采用纯随机抽样或等距抽样方式,抽取一定数目的调查单位构成所需的样本.3)、系统抽样先将总体各单位按某一有关标志(或无关标志)排队,然后相等距离或相等间隔抽取样本单位4)、整群抽样在全及总体中以群(或组)为单位,按纯随机方式或等距抽样方式,抽取若干群(或组),然后对所有抽中的各群(或各组)中的全部单位一一进行调查假设检验:事先对总体参数或分布形式作出某种假设然后利用样本信息来判断原假设是否成立当原假设为真时拒绝原假设,所犯错误称为第Ⅰ类错误,又称弃真错误。
当原假设为假时没有拒绝原假设,所犯错误称为第Ⅱ类错误,又称取伪错误。
统计学重点
统计学重点整理1、参数:是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。
通常有总体平均数、总体标准差、总体比例表示。
统计量:是用来描述样本特征的概括性数字度量。
它是根据样本数据计算出来的一个量。
通常有样本平均数、样本标准差、样本比例表示。
2、茎叶图:是反映原始数据分布的图形。
它由茎和叶两部分构成,其图形是数字组成的,通过其可以看出数据的分布形状及数据的离散状况。
箱线图:是由一组数据的最大值、最小值、中位数、两个四分位数这五个特征值绘制而成,它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比较。
3、方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。
它所研究的是非类型自变量对数值型因变量的影响。
它是通过对数据误差来源的分析来判断不同总体的均值是否相等,进而分析自变量对因变量是否有显著影响. 假定前提:1、每个总体都应服从正态分布2、各个总体的方差必须相同3、观测值是独立的。
4、统计数据的分类(1)按计量尺度:分类的数据、顺序的数据、数值型数据(2)按收集方法:观察的数据、实验的数据(3)按时间状况:截面的数据、时序的数据5、饼图:是用圆形及圆内扇形的角度来表示数值大小的图形,它主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例,对于研究结构性问题十分有用。
直方图和条形图:定义:直方图:是用于展示分组数据分布的一种图形,它是用矩形的宽度和高度来表示频数分布的。
条形图:是用宽度相同的条形的高度或长短来表示数据多少的图形。
区别:1、条形图使用图形的长度表示各类别频数的多少,其宽度固定,直方图用面积表示各组频数,矩形的高度表示每一组的频数或频率,宽度表示组距。
2、直方图各矩形连续排列,条形图分开排列,3、条形图主要展示分类数据,直方图主要展示数值型数据。
6、经验法则表明:当一组数据对称分布时,约有68%的数据在平均数加减1个标准差的范围之内,约有95%的数据在平均数加减2个标准差的范围之内,约有99%的数据在平均数加减3个标准差的范围之内。
统计学重点整理
参数(parameter):描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值。
所关心的参数主要有总体均值、标准差、总体比例等。
总体参数通常用希腊字母表示统计量(statistic):用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数。
所关心的样本统计量有样本均值(x)、样本标准差(s)、样本比例(p)等。
样本统计量通常用小写英文字母表示1、概率抽样:简单随机抽样(SRS)、系统抽样(SYS)、分层抽样(STS)、整群抽样(STS)、多阶段抽(MSS)简单随机抽样(SRS)特点:总体中每一个样本点均有相同机率被抽中、抽出某个样本后不影响另一个样本抽出的机率(独立性)、经常先列样本名册后用计算机产生随机数或随机表抽选放回和不放回:放回(重复)抽样;无放回(不重复)抽样系统抽样(SYS)等距抽样:将所有样本列册以序号排列,先随机抽取第一个样本,接着每隔K个样本抽取下一个样本;间隔K 的求法:Population size/ Sample size;常用于抽样(类似于简单随机抽样)分层抽样(STS)将总体区分为数个层(strata):层之间互斥且周延、层内性质相近、层与层之间差异明显从每一层中简单随机抽取若干样本作为该层的代表,再将所有层总结集合整群抽样(STS)将总体区分为多个群集clusters:群集间互斥且周延、群集与群集间差异小、群集内类似总体随机抽取数个clusters将抽中的群集内每个样本均调查多阶段抽样(MSS)第一阶段:分群——整群抽样第二阶段:分层——分层抽样第三阶段……整群抽样的优点是实施方便、节省经费;整群抽样的缺点是往往由于不同群之间的差异较大,由此而引起的抽样误差往往大于简单随机抽样。
抽样方法优点缺点简单随机抽样操作简便易行,总体个数多时,工作量太大系统抽样操作便简易行,可以提高效率如不了解样本总体,抽出的样本有偏差分层抽样充分保证样本结构与总体的一致整体差异不明显时不适用,在使用时提高样本的代表性需要与其他抽样方法综合使用。
统计学复习重点
1、社会经济统计:它是从数量方面入手研究社会经济现象的现状及发展规律的一种手段。
统计的涵义:一是指统计活动(统计工作);二是指统计资料;三是指统计科学统计的基本方法:一.大量观察法二.综合分析法三.归纳推断法2、按统计指标的表现形式不同将其分为总量指标,相对指标和平均指标。
总量指标,是反映现象总体规模的统计指标。
它主要描述社会经济活动的总成果。
相对指标是两个有联系的统计指标之比,它反映事物之间的数量关系或联系程度。
平均指标是说明总体单位某一数量标志一般水平的统计指标。
3、统计指标的基本要求:一,要有正确的理论依据;二,要明确统计指标内容;三,要有一个科学的计算方法。
4、指标体系的定义和分类所谓指标体系,就是将反映社会经济现象数量特征的一系列相互依存、相互联系的统计指标有机结合所组成的整体。
一,按内容划分可分为社会统计指标体系、经济统计指标体系和科学技术统计指标体系,社会指标体系是反映货描述社会及人口基本特征和变动情况的指标体系。
经济指标体系是反映或描述国民经济基本特征及其运行情况的指标体系。
科技指标体系是指反映或描述科学技术特征及其发展情况的指标体系。
二,按反应的范围可分为宏观、中观和微观统计指标体系。
三,按研究目的不同分为基本统计指标体系和专题统计指标体系。
5、统计调查的分类一,按搜集资料的组织方式不同,统计调查可分为统计报表和专门调查;二,按调查对象包括的范围不同,统计调查可分为全面调查和非全面调查三,根据调查资料登记时间是否具有连续性,统计调查可分为经常性调查和一次性调查;四,按搜集统计数据的方法不同,统计调查可以分为直接观察法、采访法、报告法和问卷法。
6、普查普查:为了某种特定目的而专门组织的一次性全面调查。
普查是适合于特定目的、特定对象的一种调查方式,主要用于搜集处于某一时点状态上的社会经济数量,目的是为了掌握特定社会经济现象的全貌,详细了解重要的国情、国力,为国家制定有关政策或措施提供依据。
统计学重点
第一章统计的含义:1,统计工作2,统计资料3,统计学统计学:对研究对象的数据资料进行搜集整理,分析和研究,以显示其总体特征和规律性的学科。
特点:数量性,总体性,具体性,社会性。
(数量性,综合性,具体性)统计工作过程:1,统计调查2,统计整理3,统计分析统计指标的种类:数量指标和质量指标指标和标志的区别和联系:标志是说明总体单位特征的,指标是说明总体特征的,标志有文字表示的质量标志和数字表示的数量标志,但是指标都是用数字表示的,指标的数值大多是用总体单位的数值标志值综合而来常用基本单位:指标和标志,变异和变量,总体和总体单位。
指标构成要素:指标名称,计量单位,计算方法。
指标体系设计的原则:目的性或针对性,本质性,层次有序性,独立性,可行性或信息可取性,可比性。
第二章统计调查概念:根据统计研究的目的和要求,运用科学的调查方法,有组织有计划地向社会搜集各项原始资料的工作过程。
统计调查总类:按照调查的组织形式,可分为统计报表制度和专门调查按照对象包括的范围不同,可分为全面调查和非全面调查按调查登记的时间是否连续,可分为经常性调查和一次性调查按搜集资料的方式不同,可分为直接观察法,报告法,采访法,网上调查法。
调查问卷的设计:1确定调查目的2确定调查对象和调查单位3确定调查项目和调查问卷4确定调查时间和期限5制定调查组织实施计划6选择调查方法。
第三章统计分组概念:根据统计研究的需要,将总体按照一定的标志区分为若干部分或组的统计方法。
分配数列概念:在统计分组的基础上,将总体的所有单位按组归类整理,并按一定顺序排列,形成总体中各个单位在各组间的分布。
统计表的结构:总标题,横行标题,纵栏标题,指标数值第四章简单算术平均数加权算术平均数调和平均数几何平均数众数,中位数概念标准差,离散系数第五章动态数列的概念:同一现象在不同时间的观测值按照时间顺序排列起来的数列动态数列的种类:时期数列,时点数列,(绝对数,相对数,平均数)动态数列。
大学统计学考试重点(考试必备)
第一章统计总论1.统计三种不同含义:统计工作,统计资料,统计学(总体性、数量性、具体性、社会性)2.关系:统计资料是统计工总的成果,统计工作和统计资料是过程与成果的关系。
统计学是统计工作经验的总结,统计学来源于实践,又高于实践,反过来对统计实践具有很大的指导作用。
3.统计学的研究对象:统计学最初是以社会现象为其研究对象的。
统计的研究对象是统计研究所要认识的客体,这个客体独立存在于人们的主管意识之外。
社会经济统计学的研究对对象是社会经济现象总体的数量特征和数量关系,通过这些数量关系反映社会经济现象的规律性。
4.社会经济统计的特点:数量性(数量特征、数量关系、数量界限),总体性,具体性,社会性。
5.统计学的性质:社会经济统计学是一门认识社会经济现象总体数量的方法论科学。
.6.统计研究方法:大量观察法,统计分组法,综合指标法,统计模型法,统计推断法7.统计的基本任务:对国民经济和社会发展情况进行统计调查、统计分析,提供统计资料和咨询意见,实行统计监督。
8.统计的基本职能:信息职能、咨询职能、监督职能9.统计的过程:统计设计、统计调查、统计整理、统计分析、统计资料的提供和管理。
10.统计总体:是由客观存在的具有某种共同性质的许多个别单位所构成的整体。
(客观性、同质性、大量性、差异性)11.总体单位(个体):构成总体的每一个别事物,简称单位。
12.标志:是说明总体单位属性或特征的名称。
13.指标:是用来反映总体数量特征的科学概念和具体数值。
(数量性、综合性、具体性)(六要素:指标名称、计算方法、计量单位、时间限制、空间限制、具体数值)14.区别与联系:说明的对象不同。
指标是说明总体特征的,而标志是说明总体单位特征的。
表示方法不同。
标志有不能用数值表示的品质标志与能用数值表示的数量标志两种,而指标都是用数值表示的。
联系,许多统计指标的数值时从总体单位的数量标志值汇总而来的。
有些统计指标与数量标志之间存在一定条件下变换干系。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.统计指标和标志有何区别和联系?
统计指标和标志和区别表现为:
首先,指标和标志的概念明显不同,标志是说明个体特征的,一般不具有综合的特征;
指标是说明总体特征的,具有综合的性质。
其次,统计指标分为数量指标和质量指标,它们都是可以用数量来表示的;标志分为
数量标志和品质标志,它们不是都可以用数量来表示,品质标志只能用文字表示。
统计指标和标志的联系表现为:
统计指标数值是由各个体的标志表现结果综合概括而来的。
随研究目的不同,指标与
标志之间可以互相转化。
两者体现这样的关系:指标在标志的基础上形成,指标又是确定标
志的依据。
2.什么是统计分布?它包括哪两个要素?
答:统计分布就是在统计分组的基础上,把总体的所有单位按组归并排列,形成总体中各个单位在各组间的分布。
其实质是把总体的全部单位按某标志所分的组进行分配所形成的数列,所以又称为分配数列或分布数列。
统计分布由两个构成要素所组成:
(1)总体按某标志所分的组
(2)各组所占的单位数——次数。
3.强度相对指标和其他相对指标的主要区别是什么?
主要区别:
(1)其他各种相对指标都属于同意总体内的数量进行对比,而轻度相对指标除此之外,也可以是两种性质不同的但又有联系的属于不同总体的总量指标之间的对比。
(2)计算结果表现形式不同。
其他相对指标用无名数表示,而强度相对指标主要是用有名数表示。
(3)当计算强度相对指标的分子、分母的位置互换后,会产生正指标和逆指标,而其他指标不存在正、逆指标之分。
4简述编制变量数列的一般步骤。
⑴对资料进行分析:①计算全距(R);②变量的性质;③变量值变动是否均匀。
通过全距的计算以及变量是离散型还是连续型来确定编制单项数列还是组距数列,根据变量值的变动是否均匀确定编制等距还是异距数列。
⑵在编制组距数列时,还需确定组距和组数,其原则是能真正反映总体的分布特征。
⑶确定各组的组限。
离散型变量的组限可不重叠,连续型变量的组限必须重叠。
⑷将总体各单位分布到各组、计算次数、颁率、变量数列就编制而成。
5什么是上限不在内原则?
上限不在内原则是指当变量数列组限采用重叠分组时,有一个上、下限归入哪个组的问
题。
一般地,对选用变量值越大越好的指标的分组应遵循“上限不在内”原则,即每组的上
限所对应的单位数不计入该组内,应计入下组内,如某班某学生考试成绩正好60分,则该
学生应放在60-70这组,而不应计入60以下这组。
1.某企业2001年某产品单位成本520元,2002年计划规定在上年的基础上单位成本降低5%,
实际降低6%,试确定2002年单位成本的计划数和实际数,并计算2002年降低成本计划完成程度指标。
解:2002年单位成本计划数:520―(520×5%)=494(元)
2002年单位成本计划数:520―(520×6%)=488.8(元)
2002年降低成本计划完成程度=%
95.99%100494489
=⨯
2、某乡两种稻种资料如下:
要求:试比较哪种稻种的稳定性比较好。
3、解:
10.911118107510==
甲x (斤) 03.9299386400
==乙x (斤)
09.82=甲σ(斤) 08.68=甲σ(斤)
%01.9=甲σV %33.7=乙σV 甲乙σσV V < ∴乙稻种的稳定性比较好
4、 随机抽取400只袖珍半导体收音机,测得平均使用寿命5000小时。
若已知该种收音机
使用寿命的标准差为595小时,求概率保证度为99.73%的总体平均使用寿命的置信区间。
2、400=n ,5000=x ,595=σ小时,3=t ,
()
75
.29400
595==
=n
x σ
σ,
[]
)(:x t x X σ±,计算得概率保证程度为99.73%时,总体平均使用寿命的置信区间为
[]25.5089,75.4910。
、某公司所属三个厂近两年产量完成资料如下:填出空格中的数字。
解:
6、一个电视节目主持人想了解观众对某个电视专题的喜欢程度,他选取了500个观众作样
本,结果发现喜欢该节目的有175人。
试以95%的概率估计观众喜欢这一专题节目的区间范围。
解
:
500
=n ,
%3535.0500
175
或==
p ,
96
.1=t ,
%13.2500
)
35
.01(35.0)1(=-=-=
n p p p μ %]13.296.1%35[],[:⨯±±即p t p P μ,经计算得概率保证程度为95%时,观众喜欢这一
专题节目的置信区间为[]%39%,8.30。
7、某厂生产的三种产品的有关资料如下:
要求:(1)计算三种产品的单位成本总指数以及由于单位产品成本变动使总成本变动的绝
对额;
(2)计算三种产品的产量总指数以及由于产量变动而使总成本变动的绝对额; (3)利用指数体系分析说明总成本(相对程度和绝对额)变动情况。
解:
(1)
单位成本总指数为:
%04.9648000
46100
20008500041200102000750005.4120081
011==⨯+⨯+⨯⨯+⨯+⨯=
∑∑q
p q p ,
由于单位产品成本平均下降3.96%,使总成本下降:
1900)4800046100()(
1
01
1=--=--∑∑q p q p ;
(2)产量总指数为:
%29.11442000
48000
150085000410001020008500041200100
01
0==⨯+⨯+⨯⨯+⨯+⨯=
∑∑q
p q p ,
由于产品产量平均增加14.29%,使总成本增加:
600042000480000
01
0=-=-∑∑q
p q p ;
(3) 总成本指数为:
%76.10942000
46100
01
1==
∑∑q
p q p , 总成本变动绝对额:
41000
01
1=-∑∑q
p q p ,
(4)指数体系:109.76% = 96.04% ×114.29%,
4100=6000-1900
(5)分析说明:由于报告期单位成本比基期下降3.96%,产品产量增加14.29%,使得总成本报告期比基期增加4100,单位成本下降节约总成本1900,产量增加使总成本增加6000,两类因素共同作用的结果使总成本净增4100。
8、某企业资料如下表所示:
要求:①计算出厂价格指数和由于价格变化而增加的总产值;
②计算总产值指数和产品产量指数;
③试从相对数和绝对数两方面简要分析总产值变动所受的因素影响。
解:
列表计算如下:
出厂价格指数:
%60.109750
822
11
11
1==
∑∑q
p k q p
由于价格变化而增加的总产值=822-750=72(万元)
总产值指数:%97.114715822
11==
∑
∑q p q p
107
7158220
01
1=-=-∑∑q
p q p (万元)
产量指数:%90.104715750
1
011==∑∑q p q p k
35
7157501
0011=-=-∑∑q p q p k (万元)
指数体系:114.97%=104.90%×109.60% 107万元=35万元+72万元
9、某地区家计调查资料得到,每户平均年收入为6800元,均方差为800元,每户平均年
消费支出为5200元,方差为40000元,支出对于收入的回归系数为0.2,
要求:(1)计算收入与支出的相关系数;
(2)拟合支出对于收入的回归方程; (3)估计年收入在7300元时的消费支出额; (4)收入每增加1元,支出平均增加多少元?
6、解:收入为x ,支出为y ,由已知条件知:
6800=-
x 元, 800=x σ元, 5200=-
y 元, 400002
=y σ, 2.0=b
①计算相关系数:
公式:
y x b
r σσ=
代入数字并计算:8
.040000
8002.0=⨯
=
②配合回归直线方程:
bx a y c +=
计算系数-
-
-=x b y a ,代入数字计算得: 384068002.05200=⨯-=a 故支出对于收入的回归方程为:x y c 2.03840+=
③估计消费支出额:
当7300=x 元时,530073002.03840=⨯+=c
y (元)
④当收入每增加1元时,支出平均增加0.2元。
10、某酒店到三个农贸市场买草鱼,其每公斤的单价分别为:9元、9.4元、10元,若各
买5公斤,则平均价格为多少?若分别购买100元,则平均价格又为多少?
解:若各买5公斤,则平均价格
47.915142
==∑∑=
-
f xf x (元/公斤)
若分别购买100元,则平均价格
45.9104.99300
=++=∑∑=
x m H (元/公斤)。