统计学简答题61068

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

统计学简答题

2.2什么是二手资料?使用二手资料需要注意些什么?

与研究内容有关的原信息已经存在,我们只是对这些原信息重新加工、整理,使之成为我们进行统计分析可以使用的数据,则把他们称为间接来源的数据。注意二手资料也有很大的局限性,如资料的相关性不够、口径可能不一致,数据也许不准确等等,在

使用二手资料前,对二手资料进行评估是必要的。

2.3比较概率抽样和非概率抽样的特点以及类型?什么情况下分别适合采

用?

概率抽样特点:1.抽样时按一定的概率以随机原则抽取样本 2.每个单位被抽中的概率是已知的 3.用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率,

也就是说,估计量不仅与样本单位的观测值有关,也与其入量概率有关。非概率抽样特点:操作简便,时效快,成本低,对抽样中的统计学专业技术要求不是很高。概率抽样

类型:简单随机抽样、分层抽样、整群抽样。系统抽样、多阶段抽样;非概率抽样特点:方便抽样、判断抽样、自愿样本、滚雪球抽样、配额抽样。非概率抽样适合探索性的研

究,调查结果用于发现问题,也适合市场调查中的概念测试;概率抽样适合调查目的在于掌握研究对象总体的数量特征,得到总体参数的置信区间。

3.1数据的预处理包括哪些内容?

数据的与处理是在对数据分类或分组之前所做的必要处理,包括数据的审核、筛选、排序等。

3.4直方图与条形图有何区别?

直方图与条形图不同。首先,条形图是用条形的长度(横置时)表示各类别频数的

多少,其宽度(表示类别)则是固定的;直方图是用面积表示各组频数的多少,矩形的

高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。

其次,由于分组数据具有连续性,直方图的各矩形通常是在连续排列,而条形图则是分开排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。

3.6饼图和环形图有什么区别?

环形图中间有一个“空洞”,每个样本用一个环来表示,样本中的每一部分数据用

环中的一段表示。因此环形图可显示多个样本各部分所占的相应比例,从而有利于构成的比较研究。

3.7茎叶图与直方图相比有什么优点?它们适用的场合是什么?

茎叶图类似于横置的直方图,与直方图相比,茎叶图既能给出数据的分布状况,又能给出每一个原始数据,即保留了原始数据的信息。而直方图虽然能很好地显示数据的

分布,但不能保留原始的数值。在应用方面,直方图通常适用于大批量数据,茎叶图通

常适用于小批量数据。

3.9制作统计表应该注意哪几个问题?

首先,要合理安排统计表的结构;其次,表头一般应包括表号、总标题和表中数据

的单位等内容;再次,表中的上下两条横线一般用粗线,中间的其他线要用细线,这样

使人看起来清楚醒目。最后在使用统计表时,必要时可在表的下方加上注释,特别要注意注明数据来源,以表示对他人劳动成果的尊重,以备读者查阅使用。

4.7标准分数有哪些用途?

给出了一组数据中各数值的相对位置;并可以用它来判断一组数据是否有异常值。

在对多个不同量纲的变量进行处理时,常常需要对各变量进行标准化处理。

4.8为什么要计算离散系数?

对于平均数不同或计量单位不同的不同组别的变量值,是不能用标准差直接比较其

离散程度,为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数。

7.2简述评价估计量好坏的标准?

无偏性,指估计量抽样分布的数学期望等于被估计的总体参数;有效性,指对同一参数总体的两个无偏估计量,有更小标准的估计量更有效;一致性,随样本量的增大,

点估计量的值越来越接近被估计总体的参数。

7.5 Za/2δ/√(n)的含义是什么?

Za/2δ/√(n)是估计总体均值时的估计误差。A是事先所确定的一个概率值,也被称为风险值,它是总体均值不包括在置信区间的概率,Za/2是标准正态分布上侧面积为a/2时的Z值

8.3什么是假设检验中的两类错误?

一类错误是原假设H0为真却被我们拒绝了,犯这种错误的概率用a表示,也称a 错误或弃真错误;另一类错误是原假设为伪我们却没有拒绝,犯这种错误的概率用β表示,所以也称β错误或取伪错误。

8.7假设检验依据的基本原理是什么?

它的基本思想可以用小概率原理来解释.所谓小概率原理,就是认为小概率事件在一

次试验中是几乎不可能发生的.也就是说,对总体的某个假设是真实的,那么不利于或不能支持这一假设的事件A在一次试验中是几乎不可能发一的;要是在一次试验中事件A 竟然发生了,我们就有理由怀疑这一假设的真实性,拒绝这一假设.

11.8一元线性回归模型中有哪些基本的假定?

因变量y与自变量x之间具有线性关系;在重复抽样中,自变量x的取值是固定的,即假定x是非随机的;误差项ε是一个期望值为0的随机变量,即E(ε)=0;对于所有的x值,ε的方差&2都相同;误差项ε是一个服从正态分布的随机变量。

11.10解释总平方和、回归平方合、残差平方和的含义,并说明它们之间的关系。

对一个具体的观测值来说,变差的大小可以用实际观测值y与其均差来表示,而n

次观察值的总变差可由这些离差的平方和来表示,称为总平方和(SST)。由于自变量x 的变化引起的y的变化,而其平方和反映了Y的总变差中由于x与y之间的线性关系因其的y的变化部分,它是可以由回归直线来解释的变差部分,称为回归平方和(SSR)。除了x对y眼的线性影响之外的其他因素对y变差的作用,是不能由回归直线来解释的变差部分,称为残差平方和(SSE).关系:SST=SSR+SSE.

11.11简述判定系数的含义和作用?

判定系数是对估计的归回方程拟合优度的度量。判定系数R^2测度了回归直线对观测数据的拟合优度。取值范围【1,1】。越接近1,表明回归平方和占总平方和的比例越大,拟合程度越好,反之。

11.14怎样评价回归分析的结果?

所估计的回归系数^β1的符号是否与理论或事先预期相一致;如果理论上认为y与x之间的关系不仅是正的,而且是统计上显著的,那么所建立的回归方程也应该如此;

回归方程多大程度上解释了因变量y取值的差异?考虑关于误差项ε的正态性假定是否成立。

12.2多元回归模型中有哪些基本的假定?

误差项ε是一个期望值为0的随机变量,即E(ε)=0;对自变量x1,x2,…,xk的所有值,ε的方差&^2都相同;误差项ε是一个服从正态分布的随机变量,且相互独立,

即ε~N(0,&^2)

12.3解释多重判定系数和调整的多重判定系数的含义和作用?

是多元回归中的归回平方和占总平方和的比例,它是多元回归方程拟合优度的一个

统计量,反映了在因变量y的变差中被估计的回归方程所解释的比例。为避免增加自变量而高估R^2,统计学家提出用样本量n和自变量的个数k去调整R^2,即调整的多重判定系数(Ra^2)。

13.1简述时间序列的构成要素。

成分分为四种,即趋势---是时间序列在长时期内呈现出来的某种持续向上或持续向

下的变动(T)、季节性或者季节变动---是时间序列一年内重复出现的周期性波动(S),周期性或循环波动---时间序列中呈现出来的围绕长期趋势的一种波浪形或者振荡式变

动(C),随机性或不规则变动(I)。

13.3简述平稳序列和非平稳序列的含义。

平稳序列是基本上不存在趋势的序列,这类序列中各观察值基本上在某个固定的水

平上波动,虽然在不同的时间段波动的程度不同,但并不存在某种规律,波动可以看成是随机的。非平稳序列是包含趋势、季节性或周期性的序列,它可能只含有其中的一种成分,也可能是几种成分的组合。

14.3拉氏指数与帕氏指数各有什么特点?

拉氏指数:计算综合指数时将作为权数的同度量因素固定在基期;帕氏指数:计算综合指数时将作为权数的同度量因素固定在报告期。

14.5什么是指数体系,它有什么作用?

相关文档
最新文档