应用回归分析试卷
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、对于一元线性回归01(1,2,...,)i i i y x i n ββε=++=,()0i E ε=,2
var()i εσ=,
cov(,)0()i j i j εε=≠,下列说法错误的是
(A)0β,1β的最小二乘估计0ˆβ,1
ˆβ 都是无偏估计; (B)0β,1β的最小二乘估计0ˆβ,1ˆβ对1y ,2y ,...,n y 是线性的;
2、在回归分析中若诊断出异方差,常通过方差稳定化变化对因变量进行变换. 如果误差方差与因变量y 的期望成正比,则可通过下列哪种变换将方差常数化 (A) 1
y
;
(C) ln(1)y +;(D)ln y .
3、下列说法错误的是
(A)强影响点不一定是异常值;
(B)在多元回归中,回归系数显着性的t 检验与回归方程显着性的F 检验是等价的; (C)一般情况下,一个定性变量有k 类可能的取值时,需要引入k-1个0-1型自变量; (D)异常值的识别与特定的模型有关.
4、下面给出了4个残差图,哪个图形表示误差序列是自相关的
(A)
(C) 5
应用回归分析试题(一)
(C)0β,1β的最小二乘估计0ˆβ,1
ˆβ之间是相关的; (D)若误差服从正态分布,0β,1β的最小二乘估计和极大似然估计是不一样的.
(A) (B)
(C) (D)
二、填空题(每空2分,共20分)
1、考虑模型y X βε=+,2var()n I εσ=,其中:X n p '⨯,秩为p ',2
0σ>不一定
已知,则ˆβ
=__________________, ˆvar()β=___________,若ε服从正态分布,则 22
ˆ()n p σ
σ'-:___________,其中2ˆσ
是2σ的无偏估计. 2、下表给出了四变量模型的回归结果:
则残差平方和=_________,总的观察值个数=_________,回归平方和的自由度=________. 3、已知因变量y 与自变量1x ,2x ,3x ,4x ,下表给出了所有可能回归模型的AIC 值,则最优子集是_____________________.
4、在诊断自相关现象时,若0.66DW =,则误差序列的自相关系数ρ的估计值=_____ ,若存在自相关现象,常用的处理方法有迭代法、_____________、科克伦-奥克特迭代法.
5、设因变量y 与自变量x 的观察值分别为12,,...,n y y y 和12,,...,n x x x ,则以*
x 为折点的
折线模型可表示为_____________________.
三、(共45分)研究货运总量y (万吨)与工业总产值1x (亿元)、农业总产值2x (亿元)、居民非商品支出3x (亿元)的线性回归关系.观察数据及残差值i e 、学生化残差i SRE 、
删除学生化残差()i SRE 、库克距离i D 、杠杆值ii ch 见表一
表一
表二 参数估计表
已知0.025(6) 2.447t =,0.025(7) 2.365t =,0.05(3,6) 4.76F =,0.05(4,7) 4.12F =,根据上述结果,解答如下问题:
1、计算误差方差2
σ的无偏估计及判定系数2
R .(8分)
2、对1x ,2x ,3x 的回归系数进行显着性检验.(显着性水平0.05α=)(12分)
3、对回归方程进行显着性检验.(显着性水平0.05α=)(8分)
4、诊断数据是否存在异常值,若存在,是关于自变量还是关于因变量的异常值?(10分)
5、写出y 关于1x ,2x ,3x 的回归方程,并结合实际对问题作一些基本分析(7分) 四、(共8分)某种合金中的主要成分为金属A 与金属B ,研究者经过13次试验,发现这两种金属成分之和x 与膨胀系数y 之间有一定的数量关系,但对这两种金属成分之和x 是否对膨胀系数y 有二次效应没有把握,经计算得y 与x 的回归的残差平方和为,y 与x 、2
x 的回归的残差平方和为,试在的显着性水平下检验x 对y 是否有二次效应? (参考数据0.050.05(1,10) 4.96,(2,10) 4.1F F ==)
五、(共12分)(1)简单描述一下自变量12,,...,p x x x 之间存在多重共线性的定义;(2分) (2)多重共线性的诊断方法主要有哪两种?(4分) (3)消除多重共线性的方法主要有哪几种?(6分)
应用回归分析试题(二)
一、选择题
1. 某同学由x 与y 之间的一组数据求得两个变量间的线性回归方程为y bx a =+,已知:数据x 的平均值为2,数据y 的平均值为3,则 ( A )
A .回归直线必过点(2,3)
B .回归直线一定不过点(2,3)
C .点(2,3)在回归直线上方
D .点(2,3)在回归直线下方
2. 在一次试验中,测得的四组值分别是,则Y 与X 之间的回归直线方程为( A )A . B . C . D.
3. 在对两个变量x ,y 进行线性回归分析时,有下列步骤:
①对所求出的回归直线方程作出解释; ②收集数据(i x 、i y ),1,2i =,…,n ;
③求线性回归方程; ④求未知参数; ⑤根据所搜集的数据绘制散点图
如果根据可行性要求能够作出变量,x y 具有线性相关结论,则在下列操作中正确的是( D )
A .①②⑤③④
B .③②④⑤①
C .②④③①⑤
D .②⑤④③①
4. 下列说法中正确的是(B )
A .任何两个变量都具有相关关系
B .人的知识与其年龄具有相关关系
C .散点图中的各点是分散的没有规律
D .根据散点图求得的回归直线方程都是有意义的
5. 给出下列结论:
(1)在回归分析中,可用指数系数2R 的值判断模型的拟合效果,2R 越大,模型的拟合效果越好;
(2)在回归分析中,可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好;
(3)在回归分析中,可用相关系数r 的值判断模型的拟合效果,r 越小,模型的拟合效果越好;