回归分析在EXCEL中的运用(张苇)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
回归分析是对客观事物数量依存关系的分析,是农业科学研究中一种重要的统计分析方法,广泛地应用于社会经济现象变量之间的影响因素和关联的研究。
回归模型的建立就是为了全面揭示这种复杂的依存关系,准确地测定现象之间的数量变动,提高预测和控制的准确度。
1回归分析在EXCEL中的求解
1.13因素5水平最优设计回归模型
Y=bo+n
j=1
!bjxj+n
j=1
!bjjxj2+i<j
!+bijxvxj
其中Y是因变量,Xi、Xj是自变量,b0,b1,b2,......b9
是回归方程的参数。
式中各偏回归系数按矩阵运算求解得出,即b=(X
T
X)-1XTY,这里b为各偏回归系数矩阵,为结构矩阵、XT为结构矩阵的转置,为试验观察值。
利用矩阵求解回归方程是回归分析的一种较好方法,Excel软件中的函数为回归分析的矩阵求解给出了非常方便的操作过程。
1.2数据来源
水稻三因素五水平最优设计试验资料。
[1]
试验采
用N(x1)、P2O5(x2)、K2O(x3)3因素5水平12处理最优设计。
研究利用3因素5水平12处理回归设计法,设置重复与小区拉丁方排列相结合,通过对建立的数学模型进行择优,可有效地提高试验的成功率;又可以实现不同年度的重复建模。
1.3操作程序
启动EXCEL,新建工作薄。
按照图1所示输入原始数据及结构矩阵(X)数据。
分析:C=[XT
X]-1
式中,C表示相关矩阵,X表示结
构矩阵,XT
为X的转置矩阵。
由矩阵的运算可知,求解
矩阵C可能看成求结构矩阵与它的转置矩阵相乘后的逆矩阵。
运用Excel提供的MINVERSE、MMULT、
MDETERM等函数可以方便地完成矩阵的转置、矩阵的乘积、逆矩阵计算。
求解过程:
(1)在单元格B2:M14区域按矩阵的顺序分别输入结构矩阵的元素。
在M3:M14区域分别输入产量Y矩阵的元素,在C15:N15区域存放Y的转置矩阵。
操作方法:选定原数组(M3:M14),点“编辑”菜单下的“复制”
,再选定以存放转置矩阵元素的区域(C15:N15),点“编辑”菜单下的“选择性粘贴”,再点“转置”、“确定”即
可。
(2)选定C18:N27区域以存放A阵,即为C3:L14的转置矩阵。
操作方法:选定原数组(C3:L14),点“编辑”菜单下的“复制”,再选定以存放转置矩阵元素的区域(C18:N27),点“编辑”菜单下的“选择性粘贴”,再点“转置”、“确定”即可。
(3)选定C29:L38区域以存放矩阵C18:N27与矩阵C3:L14乘积。
矩阵乘法在Excel中通过函数
MMULT完成,操作方法是首先选定结果区域,而后在公式栏中输入“=MMULT(C18:N27,C3:L14)”,结果区域要根据原始矩阵的大小设定,如本例矩阵C18:N27
收稿日期:2007-08-31
作者简介:张苇(1966-),男,本科,高级农艺师,研究方向:作物规范化栽培及计算机应用。
回归分析在EXCEL中的运用
张苇
(福建省宁德市农业局,福建宁德352100)
摘
要:举例说明利用EXCEL软件进行回归分析的详细过程,说明应用EXCEL进行回归分析无需复杂的编程便可实现统
计计算的精确化、自动化。
关键词:EXCEL;回归分析中图分类号:TP399
文献标识码:B
文章编码:1672-6251(2007)12-0179-02
图1
试验原始数据与结果
(10行,12列)与矩阵C3:L14(12行,10列)相乘,则选定的结果区域需为(10行,10列)方可返回全部结果,即要求前一矩阵的列数等于后一矩阵的行数。
由于MMULT函数属于数组函数,在输入公式后需同时按Ctrl+Shift+Enter复合键,得到运算结果。
(4)选定C40:L49区域以存放矩阵C29:L38的逆阵,按F2进入编辑状态,在编辑窗口输入公式“=MINVERSE(C40:L49)”,然后按下Ctrl+Shift+Enter复合键得到逆矩阵,即C为[XTX]-1。
实际操作所得的结果见图2。
1.4常数项B值
各列B值(!xy):即YT与Xi或Xi2或Xij相乘,其中YT为Y的转置矩阵,填入图1。
计算过程:B0=[YTX0]=4991,Excel操作方法与(3)相似,在B16:L16区域存放B值。
同理:B1=48813.6B11=668237.8B12=242570.6B2=23323.4B22=160200.4B13=364165.5B3=35092.5B33=359325B23=1754821.5计算回归系数b
b=CB即[XTX]-1(逆阵)乘B阵。
选定B51:L55区域以存放矩阵C16:L16与矩阵C40:L49乘积。
操作方法与(3)相似见图3。
得:b0=300.5271;b1=25.88718;b2=0.888239;b3=7.906242b4=-0.96109;b5=-0.66435;b6=-0.63481;b7=-0.07732;b8=-0.21048;b9=0.6953291.6建立数学模型
将B值代入Y=bo+
n
J=1
!+bj+n
J=1
!bjjxj+
i<j
!bijxixj得:
∧y=300.53+25.89x
1
+0.888x2+7.91x3-0.08x1x2-0.21x1x3+0.695x2x3-0.96x21-0.66x22-0.63x23
理论值∧y:将结构矩阵中的实际值代入回归方程式,得各处理的理论估计值yi填入图1中。
2模型检验
2.1F检验
计算公式:F=
U/n
Q/(m-n-1)
总离散平方和:矩阵表示式S=[Y]T[Y](式中,Y为
Y实际值-Y平均值)
-y
(平均值)
=!yi/12=415.92
S=YTY=[y-y#]T[y-y#]=35916.9168(Excel操作方法与(3)相似)
回归平方和:矩阵表示式U=BTLY=BTxTY(式中,Y
为y
回归值-
y回归平均值);
∧y(回归平均值)=!∧yi/12=416.85
U=BTLY=BTxTY=36101.5797(Excel操作方法与(3)相似)
剩余平方和:矩阵表示式Q=[y-∧y]T[y-∧y](式中,Y
为y
实际值-
y回归值)
Q=[y-∧y]T[y-∧y]=160.4647(Excel操作方法与(3)相似)
则:F=
U/n
Q/(m-n-1)
=35756.4521/9
160.4647/12-9-1
=49.53**2.2复相关系数R
R=1-Q/S
$=U/S
$=35756.4521/35916.9168
$=0.9978
图2
图3回归系数计算结果
表1试验方差分析
DF SS MS F F 0.1 FÁ
Â
Á
9 35756.4521 3972.94 49.539.38 19.38
2 160.4647 80.2324
11 35916.9168
注:*置信度90°显著;**置信度95%显著
(下转第182页)
(上接第180页)
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
2.3标准误
回归标准误Se=Q/(m-n-1)
"
将Q=[y-∧y]T[y-∧y]=160.4647(m=12,n=9)代入得:
Se=160.4647
12-9-1
"=8.96
3总结
EXCEL没有提供专门计算矩阵的模块,但可利用其提供的函数功能方便地计算回归模型的系数和检验。
本文仅以回归分析在EXCEL中的实现过程为例,说明操作过程,有关本文举例具体解释可以参见相关文献。
参考文献
[1]张苇.应用3因素5水平最优设计建立水稻施肥模型的研究[J].土壤通报,2006,37(6):1134 ̄1136.
[2]张琪,等.通径分析在EXCEL和SPSS中的实现[J].农业网络信息,2007,(3):109 ̄110.
[3]周晓农.矩阵在回归分析中的应用[J].金筑大学学报(综合版),1999,33(1):105 ̄110.
属性来重新确定当前记录的位置。
仅向前Recordset对象只支持MoveNext方法。
当使用Move方法访问每个记录(或枚举Recordset)时,可使用BOF和EOF属性查看是否移动已经超过了Recordset的开始或结尾。
3.2.4Recordset对象可支持两类更新:立即更新和批更新。
使用立即更新,一旦调用Update方法,对数据的所有更改将被立即写入基本数据源。
也可以使用AddNew和Update方法将值的数组作为参数传递,同时更新记录的若干字段。
如果提供者支持批更新,可以使提供者将多个记录的更改存入缓存,然后使用Up-dateBatch方法在单个调用中将它们传送给数据库。
这种情况应用于使用AddNew、Update和Delete方法所做的更改。
调用UpdateBatch方法后,可以使用Status属性检查任何数据冲突并加以解决。
3.3游标的正确选择与使用
3.3.1仅向前游标型游标的特点与使用仅向前游标型游标占用最少的资源,因而能得到最高的性能.它也是recordset缺省的游标类型,唯一的缺点是只能单向移动游标.只能从头到尾单向遍历记录集,亦即只能使用MoveNext这样的方法,而不能使用MovePrev.比方说,如果企图在一个仅向前游标型的recordset里使用MovePrev的方法,将得到一个错误提示,它告诉无法利用消防水龙带型的游标来完成的操作.(所谓的消防水龙带型游标,是指记录集中的记录就是水龙带里的水一样,只能朝一个方向运动.)要使用一个仅向前游标型的游标,应该键入:
rs.CursorType=adOpenForwardOnly3.3.2静态游标游标的特点与使用它允许向任何一个方向移动游标,但如果用户在查看数据集同时,数据集发生了更新,删除或添加的操作,它将无法实时反映数据集的变化.它就如同数据集在用户在请求数据的时刻的映像(也叫快照,snapshot).如果数据集的游标是静态游标型的,可以使用各种各样的遍历数据集的命令,诸如MoveFirst,MovePrev,MoveLast,RecordCount等等.可以键入下面的程序来使用静态游标型游标:
rs.CursorType=adOpenStatic
3.3.3动态游标和键集游标型游标的特点与使用动态游标和键集游标型游标可以实时查看数据的更动.但这只是在VisualBASIC应用程序起作用,对于Web页面则一点儿用都没有.一旦用户发出数据请求,就同静态型游标一样数据集中得到那一时刻的数据映像.如果用户不刷新他们的浏览器页面,想持续地反应数据的变化是不可能的。
由于Web浏览方式的特殊性,可能根本用不到动态游标和键集游标型游标型的游标,它们比Static或forward-only型的游标更贪婪地攫取系统的资源.如果需要各方向遍历的数据集,或是想得知数据集中的记录数,就采用静态型游标,否则就用仅向前游标型游标型的。
4总结
总之,在创建recordset时,应该选择合适的游标!这样不但减小服务器的工作量,同时也能加快打开数据库的速度。