回归分析模拟试题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(1)根据给定的模型,考察当x趋向于无穷大时y的变化,确定参数C0的初始值;
(2)求给定的模型关于参数C0、C1、C2的导数;
(3)若取参数的初始值C0=100,C1=4to7搜索步长0.1,C2=3to5搜索步长0.1,利用高斯-牛顿迭代法进行参数估计,得到结果如下:
请写出完成该运算的SAS程序(数据集sta7)、拟合所得的模型,计算所得的相关指数R2。Data its_4;
Input x y@@;
Cards;
1 0.5
2 2.5
3 3.5
4 24
5 54.7
6 82.1
7 94.8
8 96.2
9 96.4
;
________________________________
Proc qplot;
Plot y*x=’*’/grtd;
Run;
______________________________
Proc nlin;
Paras c0=100 c1=3 to 6 by 0.02 c2=3 to 6 by 0.02;
Model y=c0-c0/(1+(x/c2)**c1);
Run;
多重共线性对回归参数的估计有何影响?
1.对参数的估计值不精确,也不稳定。样本观测值稍有变动,增加或减少解释变量都会使参数估计值发生较大变化,甚至出现符号错误,从而不能正确反映解释变量对被解释变量的影响。
2.参数估计的标准差较大,使参数的显著性t检验增加了接受原假设的可能,从而舍去对被解释变量有显著影响的解释变量。
主成分回归的思想和分析步骤:
有偏估计的方法:参数的有偏估计方法有岭回归、主成分回归和偏最小二乘。
主成分回归的思想和方法:
(1)主成分回归是利用主成分分析的思想,在损失信息很少的前提下把原变量利用正交旋转变化转化为较少个数的主成分(综合指标),计算样品在所选主成分上的得分,将原因变量对原来各分析样品主成分得分进行回归,并将各主成分分别对原自变量进行回归后再代入原因变量对主成分的回归方程就得到主成分回归方程。
(2)分析步骤:
1.求原自变量集的相关系数矩阵及其特征值和相应的标准正交特征向量;
2.按从大到小排列特征值,以累计方差贡献率>=85%选取前面较大的若干个特征值,利用其相应的特征向量构成主成分;
3.计算各样品在所选主成分上的得分;
4.利用原因变量对所选主成分得分进行回归,各主成分分析对原自变量进行回归并将所得的回归结果代入原因变量对所选主成分的回归方法既得结果
该方法的主要用途是消除自变量间的多重共线性,它与回归参数的普通最小二重估计的主
要区别在于它是对回归系数的有偏估计。
2.6
2n
1
i 2
i
2
1
2210])x x
()x (n
1[)ˆvar()x (n 1)x ˆy var()ˆvar(σ-+=β+σ=β-=β∑=
2.9
2xx
i 2i
10L )x x (n 1)x ˆˆvar(σ-+σ=β+β xx
i 2xx i 2
i i
2xx i i i i 2i 1i L )x x (n 1)L y )x x (,y cov(n 1)L y )x x ()x x (,y cov(n 1))x x (ˆy ,y cov(-+σ=-+σ=--+σ=-β+∑2xx 2i 22i 1i i 10i i i i n
11[L )x x (n 1))x x (ˆy ,y cov(2)x ˆˆvar()y var()y y var()e var(-
=σ--σ-σ=-β+-β+β+=-=
2.10
22xx
2i i 2
i 2i 2i i 2
)L )x x (1n (2n 1))e (E )e (var(2n 1)e (E 2n 1))y ˆy (2n 1(E )ˆ(E σ=σ----=--=-=--=σ∑∑3.3证明 随机误差项ε的方差σ2
的无偏估计。 证明:
2
212
2
2
2
21
1
1
1
1
2
22
1
111
ˆ(),111()()(1)(1)()(1)1
ˆ()()1n
i i n n n
n
n
i
i ii ii
ii i i i i i n
i i SSE e e e n p n p n p E e D e h h n h n p E E e n p σσσ
σ
σσσ======='===------∴==-=-=-=--∴==--∑∑∑∑∑∑∑
()1ˆ2--=p n SSE σ
3.10 验证决定系数R 2
与F 值之间的关系式:p
p n F F
R /)1(2
--+=
证明:
2/,
/(1)11
1(1)/1
SSR p
F SSE n p F SSE
SSR p
n p F SSE
p
SSR SSR F p F n p R F SSE SST SSR SSE F p n p F n p p
p SSE n p =
--⋅∴=⨯--⋅⨯⨯--∴=====
⋅+⨯+--+--⨯+--
3.11 研究货运总量y (万吨)与工业总产值x1(亿元)、农业总产值x2(亿元)、居民非商品支出x3(亿元)的关系。数据见表3.9(略)。 (1)计算出y ,x1,x2,x3的相关系数矩阵。 SPSS 输出如下:
则相关系数矩阵为: 1.0000.5560.7310.7240.556 1.0000.1130.3980.731
0.113 1.0000.5470.7240.3980.547 1.000r ⎡⎤⎢⎥⎢
⎥=⎢⎥⎢⎥
⎣⎦
(2)求出y 与x1,x2,x3的三元回归方程。