回归分析理论

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、多元线性回归

表达式:

1、b=regress(Y,X)确定回归系数的点估计值

2、[b,bint,r,rint,stats]=regress(Y,X,alpha)求回归系数的点估计和区间估计、并检验回归模型

①bint表示回归系数的区间估计.

②r表示残差

③rint表示置信区间

④stats表示用于检验回归模型的统计量,有三个数值:相关系数r2、F值、与F 对应的概率p

说明:相关系数r2越接近1,说明回归方程越显著;

时拒绝H0,F越大,说明回归方程越显著;与F对应的概率p<α时拒绝H0

⑤alpha表示显著性水平(缺省时为0.05)

3、rcoplot(r,rint)画出残差及其置信区间

4、实例演示,函数使用说明

(1)输入数据

(2)回归分析及检验

运行结果解读如下

参数回归结果为

,对应的置信区间分别为[-33.7017,1.5612]和[0.6047,0.834]

r2=0.9282(越接近于1,回归效果越显著),F=180.9531,p=0.0000,由p<0.05,可知回归模型y=-16.073+0.7194x成立

(3)残差分析作残差图

从残差图可以看出,除第二个数据外,其余数据的残差离零点均较近,且残差的置信区间均包含零点,这说明回归模型y=-16.073+0.7194x能较好的符合原始数据,而第二个数据可视为异常点。

(4)预测及作图

二、一元多项式回归

1、一元多项式回归函数

(1)[p,S]=polyfit(x,y,m)确定多项式系数的MATLAB命令

说明:x=(x1,x2,…,xn),y=(y1,y2,…,yn);p=(a1,a2,…,am+1)是多项式

y=a1xm+a2xm-1+…+amx+am+1的系数;S是一个矩阵,用来估计预测误差

(2)polytool(x,y,m)调用多项式回归GUI界面,参数意义同polyfit

2、预测和预测误差估计

(1)Y=polyval(p,x)求polyfit所得的回归多项式在x处的预测值Y

(2)[Y,DELTA]=polyconf(p,x,S,alpha)求polyfit所得的回归多项式在x处的预测值Y及预测值的显著性为1-alpha的置信区间Y±DELTA,alpha缺省时为0.5

3、实例演示说明

观测物体降落的距离s与时间t的关系,得到数据如下表,求s的表达式(即回归方程s=a+bt+ct2)

t(s)1/30 2/30 3/30 4/30 5/30 6/30 7/30

s(cm)11.86 15.67 20.60 26.69 33.71 41.93 51.13

t(s)8/30 9/30 10/30 11/30 12/30 13/30 14/30

s(cm)61.49 72.90 85.44 99.08 113.77 129.54 146.48

解法一:直接作二次多项式回归

故回归模型为

解法二:化为多元线性回归

故回归模型为:

预测及作图

三、多元二项式回归

1、多元二项式回归Matlab命令

rstool(x,y,'model',alpha)

输入参数说明:

x:n*m矩阵;

Y:n维列向量;

alpha:显著性水平(缺省时为0.05);

mode:由下列4个模型中选择1个(用字符串

2、实例演示说明

设某商品的需求量与消费者的平均收入、商品价格的统计数据如下,建立回归模型,预测平均收入为1000、价格为6时的商品需求量

需求量100 75 80 70 50 65 90 100 110 60

收入1000 600 1200 500 300 400 1300 1100 1300 300

价格5 7 6 6 8 7 5 4 3 9

解法一:选择纯二次模型

在x1对应的文本框中输入1000,X2中输入6,敲回车键,此时图形和相关数据会自动更新

此时在GUI左边的“Predicted Y1”下方的数据变为88.47981,表示平均收入为1000、价格为6时商品需求量为88.4791

点击左下角的Export按钮,将会导出回归的相关参数beta、rmse和residuals到工作空间(workspace)

在Export按钮下面可以选择回归类型

在Matlab命令窗口中输入

将得到如下结果

故回归模型为

解法二:将上面饿模型转换为多元线性回归

1.1.2 求数字特征

例2 已知50个数据x=[451.42 43.895 27.185 312.69 12.863 383.97 683.1 292.842 35.338 612.4 608.54 15.76 16.355 190.07 586.92 57.581 367.57 631.45 717.63 692.67 84.079 454.36 441.83 353.25 153.61 675.64 699.21 727.51 478.38 554.84 121.05 450.75 715.88 892.84 273.1 254.77 865.6 232.35 804.87 908.4 231.89 239.31 49.754 78.384 640.82 190.89 843.87 173.9 170.79 994.3],计算其数字特征。

输入数据,利用下列提供的函数可以求得各数字特征。

min(x): 向量x的元素的最小值

max(x): 向量x的元素的最大值

mean(x): 向量x的元素的算术平均值

geomean(x):向量x的元素的几何平均值

(n个正数的连乘积的n次算术根叫做这n个数的几何平均数)

median(x): 向量x的元素的中位数

var(x):向量x的元素的方差

std(x): 向量x的元素的标准差

diff(x): 向量x的相邻元素的差

sort(x): 对向量x的元素进行排序(Sorting)

length(x): 向量x的元素个数

sum(x): 向量x的元素总和

相关文档
最新文档