《统计与计量分析》答案-190616(2)-新版.docx

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《统计与计量分析》试题库

一、简答题

1.获得数据的概率抽样方法有哪些?

(1)简单随机抽样

简单随机抽样又称纯随机抽样,是指在特定总体的所有单位中直接抽取n个

组成样本。

它最直观地体现了抽样的基本原理,是最基本的概率抽样。

(2)系统抽样

系统抽样也称等距抽样或机械抽样,是按一定的间隔距离抽取样本的方法。

(3)分层抽样

分层抽样也叫分类抽样,就是先将总体的所有单位依照一种或几种特征分为

若干个子总体,每一个子总体即为一类,然后从每一类中按简单随机抽样或

系统随机抽样的办法抽取一个子样本,称为分类样本,它们的集合即为总体

样本。

(4)整群抽样

整群抽样又称聚类抽样或集体抽样,是将总体按照某种标准划分为一些群体,每一个群体为一个抽样单位,再用随机的方法从这些群体中抽取若干群体,

并将所抽出群体中的所有个体集合为总体的样本。

(5)多阶段抽样

多阶段抽样又称多级抽样或分段抽样,就是把从总体中抽取样本的过程分成

两个或多个阶段进行的抽样方法。

2.请说明平均数、中位数和众数的特点及应用场合。

平均数

是一组数据相加后除以数据的个数得到的结果,是集中趋势的最主要测度值。

它易受极端值影响,数学性质优良。主要适用于数值型数据,而不适用于分

类数据和顺序数据。

数据对称分布或接近对称分布时应用。

中位数

是一组数据排序后处于中间位置上的变量值,不受极端值影响。它将全部数据等分成两部分,一部分数据比中位数大,一部分比中位数小。主要用于测度顺序数据的集中趋势,当然也适用于数值型数据,但不适用于分类数据。

数据分布偏斜程度较大时应用。

众数

是一组数据中出现次数最多的变量值。它不受极端值影响,具有不唯一性。

众数主要用于分类数据的集中趋势,当然也适用顺序数据和数值型数据。

数据分布偏斜程度较大时应用。

3.请解释中心极限定理的含义。

中心极限定理是研究独立随机变量和的极限分布为正态分布的问题。它是概率论中最重要的一类定理,有广泛的实际应用背景。

中心极限定理是概率论中讨论随机变量序列部分和分布渐近于正态分布的一类定理。这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量积累分布函数逐点收敛到正态分布的积累分布函数的条件。

4.请解释置信水平的含义。

置信水平是指特定个体对待特定命题真实性相信的程度,也就是概率是对个人信念合理性的量度。一般用1-α表示。

概率的置信度解释表明,事件本身并没有什么概率,事件之所以指派有概率只是指派概率的人头脑中所具有的信念证据。

置信水平是指总体参数值落在样本统计值某一区内的概率;而置信区间是指在某一置信水平下,样本统计值与总体参数值间误差范围。置信区间越大,置信水平越高。

5.第I类错误和第II类错误分别是指什么?它们发生的概率的大小之间存在

怎样的关系?

当原假设为真时拒绝原假设,所犯的错误称为第Ⅰ类错误,又称为弃真错误,犯第Ⅰ类错误的概率通常记为a。

当原假设为假时没有拒绝原假设,所犯的错误称为第Ⅱ类错误,又称为取伪错误,犯第Ⅱ类错误的概率通常记为b。

两者发生的概率的关系:当a增大时,b减小;当b增大时,a减小。

6.什么是P值?利用P值进行检验与利用统计量进行检验有什么不同?

P值是当原假设为真时,检验统计量小于或等于根据实际观测样本数据计算得到的检验统计量值的概率。P值常常作为观察到的数据与原假设不一致程度的度量。

统计量检验采用事先确定显著性水平α,来控制犯第一类错误的上限,P值可以有效地补充α提供的关于检验可靠性的有限信息。

P值检验的有点在于,它提供了更过的信息,让人们可以选择一定的水平来评估结果是否具有统计上的显著性。

7.请说明内生变量与外生变量的区别。

内生变量是具有某种概率分布的随机变量,其数值是在所研究的经济系统的模型内决定的,其参数是联立方程模型估计的元素。内生变量是由模型系统决定的,同时也对模型系统产生影响。内生变量一般为经济变量。

外生变量一般是确定性变量,或是具有临界概率分布的随机变量,其数值是在所研究的经济系统的模型之外决定的,其参数不是模型系统研究的元素。外生变量影响系统但不受系统影响。外生变量一般是经济变量,条件变量,政策变量,虚变量。

8.我国1998年至2016年的季度通货膨胀率数据属于什么数据(时间序列,面

板数据,还是截面数据)?

时间序列数据是指对一个或几个变量跨期观察得到的数据。也就是按固定的时间间隔观察某个对象的属性或变量的取值。

面板数据也称纵列数据,是对若干固定对象的属性或变量值追踪观察而得到的数据,跟踪观察一般是按固定时间间隔的跨期观察。

截面数据是指一个变量或多个变量再某个时点的数据集。也就是说在同一个时间点观察多个对象的某个属性或变量取值。

我国1998年至2016年的季度通货膨胀率数据属于时间序列数据。

9.在回归模型中,对变量取对数的好处是什么?

好处有很多,其中包括:

1.减弱模型中数据的异方差性,只能是减弱,并不能彻底消除。

2.模型形式的需要,利用线性回归模型的前提是解释变量和被解释变量之

间的现行关系,但是在实际中这一点很难满足,很多的时候需要对多个变量或者是单一变量做对数变换,让模型的形式变为线性。

3.取对数,再配合差分变化,把绝对数变成相对数,这样,数据更能表示

变动的相关性。

4.有时候变量不符合正态分布的假定,取了对数可以渐近正态分布。

10. 请说明回归模型做预测和因果关系分析时基本假设的异同。(未找到确定答案)

相关文档
最新文档