多元统计思考题及答案

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《多元统计分析思考题》

第一章 回归分析

1、回归分析是怎样的一种统计方法,用来解决什么问题?

答:回归分析作为统计学的一个重要分支,基于观测数据建立变量之间的某种依赖关系,用来分析数据的内在规律,解决预报、控制方面的问题。

2、线性回归模型中线性关系指的是什么变量之间的关系?自变量与因变量之间一定是线性关系形式才能做线性回归吗?为什么?

答:线性关系是用来描述自变量x 与因变量y 的关系;但是反过来如果自变量与因变量不一定要满足线性关系才能做回归,原因是回归方程只是一种拟合方法,如果自变量和因变量存在近似线性关系也可以做线性回归分析。

3、实际应用中,如何设定回归方程的形式?

答:通常分为一元线性回归和多元线性回归,随机变量y 受到p 个非随机因素x1、x2、x3……xp 和随机因素Ɛ的影响,形式为:

011p p y x x βββε=++⋅⋅⋅++

01p βββ⋅⋅⋅是p+1个未知参数,ε是随机误差,这就是回归方程的设定形式。

4、多元线性回归理论模型中,每个系数(偏回归系数)的含义是什么? 答:偏回归系数01p βββ⋅⋅⋅

是p+1个未知参数,反映的是各个自变量对随机变量的影响

程度。

5、经验回归模型中,参数是如何确定的?有哪些评判参数估计的统计标准?最小二乘估计法有哪些统计性质?要想获得理想的参数估计值,需要注意一些什么问题? 答:经验回归方程中参数是由最小二乘法来来估计的;

评判标准有:普通最小二乘法、岭回归、主成分分析、偏最小二乘法等; 最小二乘法估计的统计性质:其选择参数满足正规方程组, (1)选择参数01

ˆˆββ分别是模型参数01ββ的无偏估计,期望等于模型参数;

(2)选择参数是随机变量y的线性函数

要想获得理想的参数估计,必须注意由于方差的大小表示随机变量取值的波动性大小,因此自变量的波动性能够影响回归系数的波动性,要想使参数估计稳定性好,必须尽量分散地取自变量并使样本个数尽可能大。

6、理论回归模型中的随机误差项的实际意义是什么?为什么要在回归模型中加入随机误

差项?建立回归模型时,对随机误差项作了哪些假定?这些假定的实际意义是什么?答:随机误差项Ɛ的引入使得变量之间的关系描述为一个随机方程,由于因变量y很难用有限个因素进行准确描述说明,故其代表了人们的认识局限而没有考虑到的偶然因素。

7、建立自变量与因变量的回归模型,是否意味着他们之间存在因果关系?为什么?答:不是,因果关系是由变量之间的内在联系决定的,回归模型的建立只是一种定量分析手段,无法判断变量之间的内在联系,更不能判断变量之间的因果关系。

8、回归分析中,为什么要作假设检验?检验依据的统计原理是什么?检验的过程是怎样

的?

答:因为即使我们已经建立起了模型,但是尚且不知这个回归方程是否能够比较好地反映所描述的变量之间的影响关系,必须进行统计学上的假设检验;

假设性检验原理可以用小概率原理解释,通常认为小概率事件在一次试验中几乎不可能发生的,即对总体的某个假设是真实的,那么不支持这一个假设事件在一次试验中是几乎不可能发生的,要是这个事件发生了,我们就有理由怀疑这一假设的真实性,拒绝原假设;

检验过程:

(1)提出统计假设H0和H1;

(2)构造一个与H0相关的统计量,称其为检验统计量;

(3)根据其显著性水平 的值,确定一个拒绝域;

(4)作出统计决断;

9、回归诊断可以大致确定哪些问题?回归分析有哪些基本假定?如果实际应用中不满足

这些假定,将可能引起怎样的后果?如何检验实际应用问题是否满足这些假定?对于各种不满足假定的情形,分别采用哪些改进方法?

答:回归诊断解决:

(1)回归方程的线性假定;

(2)是否存在多重共线性;

(3)误差项的正态性假定;

(4)误差项的独立性假设;

(5)误差项同方差假定;

(6)是否存在数据异常;

原基本假定H:

(1)假设回归方程不显著;

(2)假设回归系数不显著;

引起后果:与模型误差相比,自变量对因变量的影响是不重要的(模型误差太大、自变量对y的影响确实太小)。

如何检验:用F统计量或者P值法来检验方程的显著性;

改进方法:

(1)对于模型的误差太大,我们要想办法缩小误差,检查是否漏掉了重要的自变量,或检查自变量与y的非线性关系;

(2)对于自变量对y影响较小,此时应该放弃回归分析方法。

10、回归分析中的R2有何意义?它能用来衡量模型优劣吗?

答:R2是回归平方和与总离差平方和之比,作为评判一个模型拟合度的标准,称为样本决定系数,其值越接近1,意味着模型的拟合优度越高。但是其不是衡量模型优劣唯一标准,增加自变量会使得自由度减少,因此需要引入自由度修正的复相关系数。这些都需要视具体的情况而定。

11、如何确定回归分析中变量之间的交互作用?存在交互作用时,偏回归系数的意义与不

存在交互作用的情形下是否相同?为什么?

答:交互作用是指因素之间联合搭配对试验指标的影响作用,存在交互作用是,偏回归系数肯定与不存在是的系数不同,毕竟变量之间有相互影响的关系。

12、有哪些确定最优回归模型的准则?如何选择回归变量?

答:(1)修正的复相关系数2a R 达到最大;

(2)预测平方和达到最小;

(3)定义C p 统计量值小,选择p C p

小的回归方程;

(4)赤池信息量达到最小;

按照以上准则进行回归变量的选择。

13、在怎样的情况下需要建立标准化的回归模型?标准化回归模型与非标准化模型有何

关系?形式有否不同?

答:在多元线性回归分析中,由于涉及到的变量量纲不同,差别很大,需要对变量进行

中心化和标准化,数据中心化处理相当于将坐标原点移至样本中心坐标系的平移不改变直线的斜率;标准化处理后建立的回归方程模型比非标准化的回归方程少一个常数项,系数存在关系。

14、利用回归方法解决实际问题的大致步骤是怎样的?

答:(1)根据预测目标,确定自变量和因变量;

(2)建立回归预测模型;

(3)进行相关分析;

(4)检验回归预测模型,计算预测误差;

(5)计算并确定预测值。

15、你能够利用哪些软件实现进行回归分析?能否解释全部的软件输出结果?

答:目前会用的软件是SPSS 和matlab ,关于地球物理的软件如grapher 也可以进行回归分

析。对于SPSS 的一些输出结果,还是不太理解。

第二章 判别分析

1、判别分析的目的是什么?

相关文档
最新文档