《数值计算方法》课程设计报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《数据分析方法》课程实验报告
1.实验内容
(1)掌握回归分析的思想和计算步骤;
(2) 编写程序完成回归分析的计算,包括后续的显著性检验、残差分析、Box-Cox 变换等内容。
2. 模型建立与求解(数据结构与算法描述)
3.实验数据与实验结果
解:根据所建立的模型在MATLAB 中输入程序(程序见附录)得到以下结果: (1)回归方程为:123.45260.49600.0092Y X X ∧
=++
说明该化妆品的消量和该城市人群收入情况关系不大,轻微影响,与使用该化妆品的人数有关。
2σ的无偏估计:2 4.7403σ= (2)方差分析表如下表: 方差来源
自由度
平方和 均方 F 值
p
回归(R ) 2 53845 26922 56795 2.28 误差(E ) 12 56.883 4.703 总和(T ) 14
53902
从分析表中可以看出:F 值远大于p 的值。所以回归关系显著。 复相关20.9989R =,所以回归效果显著。
解:根据所建立的模型,在MATLAB 中输入程序(程序见附录)得到如下结果: (1)回归方程为:1257.9877 4.70820.3393Y X X ∧
=-++
在MTLAB 中计算学生化残差(见程序清单二),所得到的学生化残差r 的值由残差可知得到的r 的值在(-1,1)的概率为0.645,在(-1.5,1.5)的概率为0.871,在(-2,2)之间的概率为0.968.
而服从正态分布的随机变量取值在(-1,1)之间的概率为0.68,在(-1.5,1.5)之间的概率为0.87,在(-2.2)之间的概率为0.95,所以相差较大,所以残差分析不合理,需要对数据变换。
取λ=0.6进行Box-Cox 变换()
ln ,01
,0Y Y Y λλλλλ
=⎧⎪
=⎨-≠⎪
⎩ 在MATLAB 中输入程序(见程序代码清单二)
取0.6λ=,所以得到r 的值(r 的值见附录二)其值在(-1,1)之间的个数大约为20/31=0.65,大致符合正态分布,所以重新拟合为:0-11.7736β=1 1.1478
β=20.0969β=
拟合函数为:12-11.7736 1.14780.0969Y X X ∧
=++ 通过F 值,R 值可以检验到,回归效果显著
(3)某医院为了了解病人对医院工作的满意程度Y 和病人的年龄1X ,病情的严重程度2X 和病人的忧虑程度3X 之间的关系,随机调查了该医院的23位病人,得数据如下表:
(1) 拟合线性回归模型0112233Y X X X ββββε=++++,通过残差分析与考察
模型及有关误差分布正态性假定的合理性;
(2) 若(1)中模型合理,分别在2
()()i R p α,()p ii C ,()p iii PRESS 准则下选择最
优回归方程,各准则下的选择结果是否一致?
(3) 对0.10E D αα==,用逐步回归法选择最优回归方程,其结果和(2)中的
数否一致?
(4) 对选择的最优回归方程作残差分析,与(1)中的相应结果比较,有何变
化? 习题2.6
解:(1)回归参数的β的最小二乘估计为:1()T T X X X Y β∧
-=。 在MATLAB 中输入程序(见程序代码清单二)可得: 0-57.9877β=,1 4.7082β=,2 0.3393β=
所以回归方程为: 1257.9877 4.70820.3393Y X X ∧
=-++
对数据做Box-Cox 变换,(由于λ的取值在能力范围不好确定,所以经测试,取λ=0.6进行Box-Cox 变换()
ln ,0
1,0Y Y Y λλλλλ
=⎧⎪
=⎨-≠⎪
⎩ 在MATLAB 中输入程序(见程序代码清单二)
取0.6λ=,所以得到r 的值(r 的值见附录二)其值在(-1,1)之间的个数大约为20/31=0.65,大致符合正态分布,所以重新拟合为:0-11.7736β=1 1.1478
β=20.0969β=
拟合函数为:12-11.7736 1.14780.0969Y X X ∧
=++ 通过F 值,R 值可以检验到,回归效果显著 习题2.9
解:根据所建立的模型,在MATLAB 中输入程序,得到以下结果: (1) 所得到的回归方程为:123162.8759 1.21030.66598.610Y X X X =--- (2) 所得到的学生化残差见附录,通过对残差的分析,很明显不符合正态分布所以(1)
中所建立的模型不合理。
4.程序代码清单: 习题2.4
x=[1 274 2450 1 180 3254 1 375 3802 1 205 2838 1 86 2347 1 265 3782 1 98 3008 1 330 2450 1 195 2137 1 53 2560 1 430 4020 1 372 4427 1 236 2660 1 157 2088 1 370 2605]; y=[162 120 223 131 67 169 81 192 116
55
252
232
144
103
212];
n=15;p=3
b=inv(x'*x)*x'*y
h=x*inv(x'*x)*x';
sse=y'*(eye(n,n)-h)*y
d2=1/(n-p)*y'*(eye(n,n)-h)*y
sst=y'*(eye(n,n)-(1/n)*ones(n,n))*y ssr=y'*(h-1/n*ones(n,n))*y
msr=ssr/(p-1)
mse=sse/(n-p)
f=msr/mse
r2=1-sse/sst
习题2.6
x=[1 8.3 70
1 8.6 65
1 8.8 63
1 10.5 72
1 10.7 81
1 10.8 83
1 11.0 66
1 11.0 75
1 11.1 80
1 11.
2 75
1 11.3 79
1 11.4 76
1 11.4 76
1 11.7 69
1 12.0 75
1 12.9 74
1 12.9 85
1 13.3 86
1 13.7 71
1 13.8 64
1 14.0 78
1 14.
2 80
1 14.5 74
1 16.0 72
1 16.3 77