统计学李金昌课后简答题----个人整理版

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《统计学》简答题
第一章
1.统计的含义与本质是什么
含义:1、统计工作:调查研究。

资料收集、整理和分析。

2、统计资料:工作成果。

包括统计数据和分析报告。

3、统计学:研究如何搜集、整理、分析数据资料的一门方法论科学。

本质:就是关于为何统计,统计什么和如何统计的思想。

2.什么是统计学有哪些性质
统计学是关于如何收集、整理和分析统计数据的科学。

统计学就其研究对象而言,具有数量性、总体性和差异性的特点;就其学科范畴而言,具有方法型、层次性和通用性的特点;就其研究方式而言,具有描述性和推断性的特点。

3.统计学数据可分为哪几种类型,不同类型数据各有什么特点
1)按照所采用的计量尺度,可分为定性数据和定量数据
定性数据是只能用文字或数字代码来表现事物的品质特征或属性特征的数据,具体分为定序数据和定类数据。

定量数据是只能用数值来表现事物数量特征的数据,具体分为定距数据和定比数据。

2)按照表现形式不同,可以分为绝对数、相对数和平均数
绝对数是用以反映现象或事物绝对数量特征的数据。

以最直观、最基本的形式体现现象或事物的外在数量特征,有明确的计量单位,是表示直接数量标志或总量标志的形式。

相对数是用以反映现象或事物相对数量特征的数据。

通过另外两个相关统计数据的对比来体现现象或事物之间的联系关系,其结果主要表现为没有明确计量单位的无名数。

平均数是用以反映现象或事物平均数量特征的数据。

体现现象或事物某一方面的一般数量水平。

3)按收集方法,可分为观测的数据和实验的数据
观测数据:数据是在没有对事物进行人为控制的条件下得到的。

实验数据:数据是在实验中控制实验对象而收集到的。

4)按照被描述的对象和时间的关系,可分为截面数据和时间序列数据
截面数据:描述的是现象在某一时刻的变化情况。

时间序列数据:描述的是现象随时间而变化的情况。

5)按照加工程度不同,可以分为原始数据和次级数据
原始数据是指直接向调查对象收集的、尚待加工整理、只反映个体特征的数据,或通过实验采集的原始记录数据。

次级数据是指已经经过加工整理、能反映总体数量特征的各种非原始数据。

4.如何正确理解描述统计与推断统计的关系
描述统计和推断统计是统计方法的两个组成部分。

描述统计是整个统计学的基础,推断统计则是现代统计学的主要内容。

描述统计对资料的数量特征及其分布规律进行测定和描述;而统计推断是指通过抽样等方式进行样本估计总体特征的过程,包括参数估计和假设检验两项内容。

推断统计是和假设检验联系在一起的,这只是简单的描述现象,并没有进行假设,再利用数据检验,得出推断的结果。

5.统计研究的基本过程如何常用的统计方法有哪些
统计设计,数据搜集,数据整理,数据分析与解释(核心、最终目的)
常用的统计方法:大量观察发、统计分组法、综合指标法、统计推断法、统计模型法
6、总体、样本、个体三者关系如如何试举例说明。

所为总体,就是统计所研究的客观对象的全体,是有所有具有某种共同性质的事物所组成的集合体。

有时也称为母体。

个体:组成总体的每个个别事物称为个体。

样本:就是从总体中抽取的一部分的集合,也称子样。

总体与个体的关系:1、总体容量随着个体数的增减可变大变小;2、随着研究目的的不同,总体中的个体可发生变化;3、随着研究范围的变化,总体与个体的角色可以变换。

样本与总体的关系:1、总体是所要研究的对象,而样本则是所要观测的对象,样本是总体的代表和缩影。

2、样本使用来推断总体的。

3、总体和样本的角色是可以改变的。

7.如何理解总体的大量性、同质性和差异性
大量性是指总体中的个体数量必须是充分多的,同质性是指总体中的每个个体都必须具有某种共同属性或特征,差异性是指个体的属性或特征在某些方面又必须存在一定的差异。

统计研究总体的数量特征,大量性是条件,同质性基础,差异性是前提。

8.如何理解标志、指标、变量三者的含义试举例说明。

标志是用于描述或体现个性特征的名称,如某人是男性,教师。

统计指标简称指标是反映现象总体数量特征的概念以及数值,如09年全国人口13亿。

从狭义上看变量是指可变的数量标志,从广义上看变量不仅指可变数量标志也包括可变的品质标志,因此可变标志就是变量。

9.品质标志、数量标志、质量指标、数量指标四者关系如何试举例说明。

1)品质标志:表明个体属性特征,其结果只能用文字表述。

即只能表现为定性数据。

例如:个人的性别、职业、文化程度和民族等。

2)数量标志:表明个体的数量特征,其结果要以数值来表示。

即表现为定量数据。

例如:个人的身高、年龄、收入等。

3)数量指标:(绝对指标或总量指标)反映现象总体某一方面绝对数量特征的指标,表明现象所达到的总体规模、总水平或总工作量。

例如:人口数、总产量、土地面积、投资质量指标:包括相对指标和平均指标,它是反映现象总体内在对比关系或总体间对比关系的指标,表明现象所达到的相对水平、平均水平、工作质量或相互依存关系。

例如:人口性别比例、职工平均工资、产品合格率、人均土地面积、产值增长速度。

资金利润率等。

10.什么是统计指标体系有哪些表现形式试举例说明。

统计指标体系是由一系列统计指标构成,但并不是单个指标的简单组合,而是各个指标之间相互联系,相互制约的。

表现形式:1.数学等式关系 2.相互补充关系 3.相关关系 4.原因、条件、结果关系11.统计指标与标志的关系
区别:1)指标和标准说明的对象不同。

指标说明总体的特征,标志说明个体的特征。

2)指标和标志的表现形式不同。

指标是用数值来表现的,而标志则既有只能用数值表现的数量标志,也有只能用文字表现的品质标志
联系:1.统计指标的指标值是由各单位的标志值汇总或计算得来的;2.随着研究目的的不同,指标与标志之间可以相互转化。

12.统计指标的分类
1)按其计算范围不同:分为总体指标和样本指标;
2)按其反映现象的内容不同:分为数量指标和质量指标;
3)按其反映现象的时间状态不同:分为静态指标和动态指标。

13.统计学发展的三个阶段,派别和观点
第二章
1、如何设计统计数据收集方案试举例说明。

方案内容包括:1)确定数据收集目的;2)收集的数据及其类型;3)数据收集对象与数据观测单位;4)观测标志与调查表5)数据所属时间和数据收集期限;6)选择数据收集方式;7)数据收集组织。

2.概率抽样和非概率抽样有什么本质区别试举例说明。

概率抽样是按照随机原则抽取样本,即总体中的每个个体都有已知的、非零的概率被抽取到样本中。

非概率抽样是凭人们的主观判断或根据便利性原则来抽取样本,总体中每个个体被抽取的可能性是难以用概率来表示和计算的。

3.分层抽样与整群抽样有什么区别试举例说明。

相同点:它们的第一步都是依据某一标准将总体分为不同的层次或群体。

不同之处:①划分的依据不同;②抽样的方法不同;③适用范围不同。

4.什么是重点调查有什么特点
定义:为了解总体基本情况,在数据收集对象总体中只选择一部分重点个体,进行观测的一种非全面调查方式。

特点:1)客观原则选取观测单位;2)是范围较小的全面调查;3)目的是了解总体基本情况,为主观部门指导工作服务;4)重点调查结果一般不用以推断总体的数量特征。

5.在统计数据收集过程中,可能存在哪些误差试分别举例说明。

1) 观测性误差:调查观测的各个环节因工作粗心或被观测者不愿配合而造成的所收集数据与实际情况不符的误差。

包括记录错误、抄录错误、汇总错误差、计算错误、计量错误和计算机输入误差等工作误差,以及被调查者不愿或难以提供真实情况的误差,有时还存在调查人员弄虚作假的误差和各种人为因素干扰的误差。

2)代表性误差:只有在抽样调查中存在,根据原因不同分为系统性代表性误差和偶然代表性性误差(在抽样中不可避免,但可以计算和控制,如实际误差、抽样平均误差)
6.统计数据整理有哪些基本步骤
1)整理方案的设计;2)数据预处理;3)统计分组和汇总;4)整理数据的显示;5)整理数据的保存和分布。

7.如何理解统计分组的含义和性质
含义:根据统计研究的目的和事物本身的特点,选择一定的标志,将研究现象总体划分为若干个不同的组和类的一种统计研究方法。

性质:
1)统计分组有分和合的双重功能,是分与合的对立统一。

2)统计分组必须遵守“穷尽原则”和“互斥原则”,即现象总体中任何一个个体都必须而且只能属于某一个组,不能遗漏或重复。

3)统计分组的目的是要在同质性的基础上研究总体的内在差异性,即尽量体现出分组标志的组间差异而缩小组内差异。

4)统计分组在体现分组标志的组间差异的同时,可能掩盖了其他标志的组间差异,因此,任何统计分组的意义都有一定的限定性。

5)统计分组的关键是分组标志的选择和分组界限的确定,如果分组标志选择不当或分组界限不合理,就会混淆事物的性质,难以反映现象总体的特征。

8.什么是统计数据收集的实验方式应遵循哪些原则
所谓实验方式,是指运用自然科学的试验法,通过观测人为安排条件下试验产生的各种结果并加以记录的方式来获取数据,或通过人为安排条件下的试验来探求某个或某些因素对所研究事物的数量影响程度和作用方式,凭借试验结果来揭示所考察因素与所研究事物之间的数量因果关系。

原则:均衡分散原则和整齐可比性原则
9.数据收集对象、观测对单位、填报单位概念的概念及种类
数据收集对象:所要研究的现象总体
观测对象:观测标志的承担者
填报单位:负责报告收集到的数据内容的单位
调查表:把所要观测的标志按逻辑顺序列在一定形式的表格内
种类:单一表和一览表。

10.抽样调查的概念、特点、作用
概念:抽样调查是一种非全面调查,它从总体中抽取样本,以样本推断总体。

优点:经济节省、时效性强、准确度高、灵活方便
特点:
1)在样本的抽取上应遵循随即原则
2)在抽样的功能上能以部分推断总体
3)在推断的手段上采用概率估计的方法
4)在推断的理论上,以大数定律和中心极限定理为依据
5)在推断的效果上,抽样误差可以计算并加以控制
作用:
1)用于认识那些不能或难以进行全面调查的总体的数量特征
2)用于认识那些发展变化比较稳定,有规律而不必进行全面调查的现象总体的特征3)用于收集灵敏度高,时效性强或时间要求紧迫的统计数据
4)用于与其他数据收集方式相结合相互补充和核对
5)用于对总体特征的某种假设进行检验,判断这种假设的真伪,决定方案的取舍,为行动决策提供依据。

11.统计表的概念、作用与构成
概念:是一种用以表现统计数据的重要形式。

经过汇总整理的统计数据,按一定的顺序排列在相应的表格内所形成的。

作用:它是统计描述的重要工具,可代替冗长的文字叙述,便于计算、分析和对比。

构成:从统计表的形式来看,主要是由总标题、横行标题(横标目)、纵栏标题(纵标目)和指标数值(数字资料)四个部分构成。

从统计表的内容来看,包括主词和宾词两个部分。

主词就是统计表所要说明的对象或总体,即被研究总体的各个组成部分,通常列在表的左下方。

宾词就是用来说明主词的统计指标,通常列在表的右上方。

12.分布数列的概念、构成
概念:将各组的频数或频率按分组的一定顺序加以排列所形成的。

分布数列有两个构成要素:统计分组所形成的各个组和各组的频数或频率。

分布数列根据分组标志的性质不同,分为品质分布数列和变量分布数列。

13.变量数列、单项式、组距式变量数列概念及适用范围
变量数列:按照数量标志分组形式的分布数列称为变量分布数列。

变量数列按形式不同,可分为单项式分组的变量数列和组距式分组的变量数列。

(1)单项式数列。

它是指数列中每一组的变量值都只有一个,即一个变量值就代表一组。

(2)组距式数列。

即以一个变量区间表示一个组的变量数列,变量值处于同一个区间范围的个体属于同一个组,区间的长度就是组距。

第三章
1、什么是变量分布的集中趋势、离中趋势和分布形状
变量分布所呈现出向中心值靠拢或聚集的态势就称为集中趋势。

离中趋势就是变量分布中的各变量值远离中心值的倾向。

分布形状就是反映变量分布的偏斜程度和尖陡程度。

2、什么是平均指标有什么作用常用的平均数有哪些
平均指标是将变量的各变量值差异抽象化,以反映变量值一般水平或平均水平的指标,即反映变量值中心值或代表值的指标。

作用:
1)通过反映变量分布的一般水平,帮助人们对研究现象的一般数量特征有一个客观认识2)利用平均指标可以对某一现象总体在不同时间上的发展水平进行比较,以说明这种现象变化的趋势或规律性
3)利用平均指标可对不同空间的发展水平进行比较,以反映他们总体水平上存在的差异,进而分析产生差距的原因
4)利用评价指标可以分析现象之间的依存关或进行数量上的推算
5)平均指标还可以作为研究和评价事物的一种数量标准或参考
常用的平均数有:数值平均数(算数平均数、调和平均数、几何平均数)和位置平均数(中位数、众数)
3.如何理解加权平均数中权数的意义
平均值的大小不仅受变量值大小的影响,而且受各组频数大小的影响。

频数大的组,其变量值对平均数的影响大,频数小的组,其变量值对平均数的影响小。

当较大变量值出现的频数较大时,平均数就接近于变量值大的一端,而当较小变量值出现的频数较大时,平均数就接近于变量值较小的一端。

显然,各组频数对加权平均数的高低起着一种权衡轻重的作用,所以把f称为权数
4.在实际应用中,调和平均数与算术平均数有什么联系
如果掌握的权数资料是相对数或平均数的母项数值,要用算术平均数;如果掌握的权数资料是相对数或平均数的子项数值,则要用调和平均数。

对于相同的总体,两者计算得到的结果完全相同。

5.算术平均数、中位数和总数三者的数量关系说明什么样的变量分析特征
(1)在变量分布完全对称(正态分布)时,中位数、总数和算术平均数完全相同时。

(2)当众数<中位数<平均数时,变量分布向右偏
(3)当平均数<中位数<众数时,变量分布向左偏。

(4)众数—平均数=3(中位数—平均数)
6.什么是离散指标有什么作用常用的离散指标有哪些
离散指标是反映变量值变动范围和差异程度的指标,即反映变量分布中各个变量值远离中心值或代表值程度的指标。

常用的离散指标主要有:全距(极差)、四分位差、异众比率、平均差、标准差、离散系数。

作用:1)可以用来衡量和比较平均数的代表性;2)可以用来费用各种现象活动的均衡性、节奏性或稳定性;3)为统计推断提供依据。

7.如何反映变量分布的形状
变量分布的形状要用形状指标来反映。

形状指标就是反映变量分布具体形状,即左右是否对称、偏斜程度和陡峭程度如何的指标。

具体形状指标有两个方面:一是反映变量分布偏斜程度的指标,称为偏度系数;二是反映变量分布陡峭程度的指标,称为峰度系数。

第四章
1.什么是总体分布和样本分布两者有什么联系
总体分布是指总体中所有个体就某一变量的取值所形成的分布。

样本分布是指样本中所有个体就某一变量的取值所形成的分布。

联系:当样本容量很大时,或者当样本容量逐渐增大时,样本分布会接近总体分布。

如果样本容量很小,样本分布就有可能与总体分布相差很大,抽样估计的结果就会有误差。

2.什么是抽样分布它受哪些因素的影响
抽样分布是指样本统计量的概率分布,它由样本统计量的所有可能取值和与之相对应的概率组成。

影响因素:总体分布、样本容量、抽样方法、抽样组织形式、估计量的构造(直接估计量和间接估计量)。

3.抽样误差与非抽样误差有什么区别试举例说明。

抽样误差是由抽样的非全面性与随机性所引起的偶然性误差。

偶然性误差的特点是,它随着样本容量的增大而趋向于零,或者说各样本统计值的平均数与总体参数值只差为零。

非抽样误差是随机抽样的偶然性因素以外的原因所引起的误差,是非抽样调查所特有的。

它主要是由于抽样框不够准确,有些观测单位的数据无法取得,已取得的一些数据不真实等原因引起的样本观察数据非同质、或残缺、或不真实而产色号给你的误差。

第五章
1.什么是假设检验为什么要进行假设检验
假设检验就是事先对总体参数或总体分布形态做出一个规定或假设,然后利用样本提供的信息,以一定的概率来检验假设是否成立(或是否合理),或者说判断总体的真实情况是否与原假设存在显著的系统性差异。

我们在实践中会遇到这些问题:根据样本观测得到的一些结论,根据经验积累得到的一些认识,以及由此得到的判断为了尽可能科学、客观的回答这些问题,使我们的判断、选择和决策避免失误,我们需要借助一定的方法,这就是统计学的假设检验方法。

2.什么是原假设和备择假设如何看待两者在假设检验中的地位
原假设是研究者对总体参数值事先提出的假设,是被检验的假设。

备择假设是研究者通过检验希望能够成立的假设,是当原假设不成立时提供的假设。

原假设与备择假设是相互排斥的,两者中有且只有一个正确,通常希望原假设能被推翻而备择假设能被接收。

3.假设检验有哪两种判断规则如何进行两种规则的转换
临界值规则和P-值规则。

4假设检验的一般步骤是什么
1)提出原假设和备择假设
2)确定检验的显著性水平α
3)根据样本通缉令的概率分布确定出与α对于的临界值,即确定接受域和拒绝域
4)构造检验统计量,并根据样本观测数据计算出检验统计值
5)比较检验统计值与临界值,做出接受或拒绝原假设的判断
5.什么是假设检验的两类错误两者之间有什么样的数量关系
第一类错误是“以真为假”的错误,即原假设正确但却被拒绝的错误,也成为“弃真”错误。

第二类错误是“以假为真”的错误,即原假设不正确却被接受的错误,也称“纳伪”错误。

α变小,β就变大。

6.是否α+β=1为什么
α与β是在两个前提下的概率。

α是拒绝原假设时犯错误的概率,β是接收原假设时的概率,所以α+β不一定等于1
7.假设检验与参数估计有什么异同点
假设检验与参数估计是统计推断的两个组成部分。

它们都是利用样本信息对总体进行某种推断。

但推断的角度不同。

在参数估计中,总体参数在估计前未知,参数估计是利用样本信息对总体参数作出估计。

而假设检验则是先对值提出一个假设,然后根据样本信息检验假设是否成立。

第七章
1、什么是相关关系它与函数关系有什么不同
相关关系是现象之间存在的一种非确定性的数量依存关系,与函数关系区别是:1)函数关系是现象之间存在的确定性数量依存关系,而相关关系是非确定性的;2)相关关系是相关分析的研究对象,函数关系是相关分析的工具。

2、相关分析与回归分析有何区别和联系
1)相关分析:广义上讲是指对两个或两个以上现象之间数量上的不确定性依存关系进行的统计分析。

2)回归分析:是指对具有相关关系的两个或两个以上变量之间数量变化的一般关系进行测定,确定因变量和自变量之间的数量变动关系的数学表达式,以便对因变量进行估计或预测的统计分析方法。

区别:1)在相关分析中不必确定自变量和因变量,在回归分析中要事先确定哪个是自变量哪个是因变量,而且只能从自变量去推测因变量,不能从因变量去推测自变量。

2)相关关系不能指出变量间相互关系的数量具体形式,而回归分析能确切指出变量间相互关系的数量具体形式,它可根据回归模型从已知量估计和预测未知量。

3)相关关系所涉及的变量一般都是随机变量,而回归分析中因变量是随机的,自变量是作为研究时给定的非随机变量。

联系:1)相关分析是回归分析的基础和前提,2)回归分析是相关分析的深入和继续。

3.什么是回归标准误这个指标有什么用
回归标准误是给定x值时,y的实际观测值对其估计值y 的平均离差。

回归标准误的数值越大,说明估计值的代表性越大,观测点越靠近回归直线,其离散程度就越小,回归的结果就越精确。

第八章
1、序时平均数与静态平均数有何异同
定义:平均发展水平又称序时平均数和动态平均数,是指不同时间上发展水平的平均数。

共性是都费用现象的一般水平或代表性水平,都是平均数。

1)一般平均数把同质总体某一数量标志在某一时间上的水平抽象化,从静态上反映现象的一般水平或代表性水平,而序时平均数把同一现象在不同时间上的差异抽象化,动态上反映现象的一般水平或代表性水平。

2)一般平均数是根据变量数列计算得到的,序时平均数是根据时间数列来计算的。

2、时期数列与时点数列有哪些区别
时期数量是同类的时期指标按时间先后顺序形成的数列,数列中的各期指标值反映的社会现象在一定时期达到的总量。

而时点数量是时点指标按照时间先后顺序排列而形成的统计数量,反映的是经济现象在某一时点或某一瞬间所达到的水平。

例如年末人口数量、男性人口数量等。

时期数列的特点:
1)数列中不同时间的指标数值可以累加
2)指标值的大小和时期的长短有直接的关系。

一般来说,时期越长,数值越大。

3)指标值一般通过连续登记获得。

时点数列的特点:
1)数量中的不同时点上的数值不能累加(或相加没有意义)
2)数值的大小和时间长短无直接关系
3)时点指标的数值一般通过不连续登记取得。

3、环比增长量和定基增长量有什么关系
1)环比增长量也称逐期增长量,是两个相邻时期发展水平之差
2)定基增长量也称累计增长量,是反映报告期发展水平比某一固定时期发展水平的增长量。

3)环比增长量之和等于相应的定基增长量
4)两相邻的定基增长量之差等于相应的环比增长量
4、环比发展速度和定基发展速度之间有什么关系
环比发展速度:报告期发展水平÷前一期发展水平
定基发展速度:报告期发展水平÷某一固定时期发展水平
某时期内个环比发展速度的连乘积等于相应的定基发展速度,两个相邻的定基发展速度之比是相应的环比发展速度。

5、什么是平均发展速度说说水平发和累积分计算平均发展速度的基本思路。

各在什么样的情况下选用
定义:各期环比发展速度的序时平均数,表明现象在一定时期内发展变化的平均程度。

水平法:从最初水平a0出发,每期按一定的平均发展速度发展,则到n期后达到的理论水平等于其实际水平a n。

相关文档
最新文档